问题描述
如何抓取到淘宝界面信息呢?就类似新闻抓取那种,谁抓取过淘宝?比如http://happyxyzw.taobao.com这个页面信息如何过滤,如何得到页面代码的分隔符号?界面代码会经常变动吗?有没有做过抓取的,告诉一下实现思路?
解决方案
解决方案二:
去网上下载asp写的蜘蛛程序,分析下代码就知道怎么做了
解决方案三:
用组件Microsoft.XMLHTTP就可以不过抓取的是网页的源代码具体分析得自己弄了之前做过一个天气预报的flash应用就是需要抓取气象局页面的天气显示的页面然后得自己分析出数据来弄页面代码一般不会变的除非变换了界面样式改版过
时间: 2024-10-05 12:46:16