问题描述
请问大神们:如何读取网页上的数据求1、我想要读取网页上的信息,比如要获取百度贴吧一个帖子里所有的内容2、帖子有很多页,怎么继续按下一页继续读取呢?这里面需要什么方法或者控件,求大神给点思路和指导下!!!最好留个QQ请教
解决方案
解决方案二:
求代码求思路求大大
解决方案三:
通过当前页获取,获取后面页面,
解决方案四:
http://blog.csdn.net/X___V/article/details/8605946怎么获取内容,网上很多。主要获取到要怎么分析有用的
解决方案五:
引用3楼u013421223的回复:
http://blog.csdn.net/X___V/article/details/8605946怎么获取内容,网上很多。主要获取到要怎么分析有用的
如果说要操作网页的内容要怎么做呢,比如搜索按钮可以详细点说明吗
解决方案六:
http://club.excelhome.net/thread-893760-1-1.html看这个教程
解决方案七:
httprequest+regexp
解决方案八:
htmlagilitypack
解决方案九:
首先要看懂HTML语言比如知道按钮执行了什么方法。然后用C#模拟调用该方法。
解决方案十:
先读取页面html然后正则需要的内容提取就好了
解决方案十一:
引用9楼wy811007的回复:
先读取页面html然后正则需要的内容提取就好了
读取不到网页的内容,只能读取到框架,像成交记录这种读取不到,我是要读取淘宝网页
解决方案十二:
引用5楼liucqa的回复:
http://club.excelhome.net/thread-893760-1-1.html看这个教程
读取不到网页的内容,只能读取到框架,像成交记录这种读取不到,我是要读取淘宝宝贝详情页,一些像用户名之类的读取不了
解决方案十三:
引用7楼u010200878的回复:
htmlagilitypack
还用不到,读取这一布过不了
解决方案十四:
百度贴吧?模拟HTTP提交,抓包分析,然后该GET的GET,该POST的POST,至于返回数据,百度贴吧的图片,返回的是JSON,这点可以确定。帖子内容返回的应该也是JSON,可能是部分数据,需要不停的GET、POST下一页。如果返回的不是JSON,可以直接解析HTML,提取你需要的内容。如果多页,且不是一次性返回全部数据的情况下,就要考虑用循环提交。先找到总页数,比如总页数150页。写个循环,模拟GET提交for(inti=0;i<150;i++){.....?pag=i}每循环一次取一次数据,然后进行数据提取和解析。