问题描述
- 请问如何抓下去抓取如下链接中的数据?搞了几天了,没有头绪啊,坐等大神帮忙。。。。
- 各位大神好,我想抓取这个网站上http://xxfb.hydroinfo.gov.cn/ssIndex.html,大江大河的水文数据,
,好像是用post方法才能返回表里的数据,但是小白实在是不会用,请各路大神帮忙看看,如何获取这个表中的数据,谢谢啦
解决方案
可以用浏览器控制台抓一下请求,post的各种参数需要你能够搞清,这样就可以构造对应的参数,一个个发送post获取返回数据,然后再解析结果。
解决方案二:
额,发送网络请求就行了呗,socket或者wininet觉着那个顺手用那个
获取数据后有必要就转码,然后就是基本的字符串操作了。。
解决方案三:
自己用浏览器开发工具看就知道,数据是ajax动态加载的,你请求这个页面看不到数据的,接口是http://xxfb.hydroinfo.gov.cn/dwr/call/plaincall/IndexDwr.getSreachData.dwr,需要POST传递以下参数,
callCount=1
page=/ssIndex.html
httpSessionId=457DF20DBA703F85B030FDAEA46034DD.tomcat1
scriptSessionId=5481D9BFF3351DC2FF23AE7BBB32F366628
c0-scriptName=IndexDwr
c0-methodName=getSreachData
c0-id=0
c0-param0=string:hd
c0-param1=string:
c0-param2=string:
batchId=0
解决方案四:
可以用python来做,先用fiddler来看,正常情况下查看这些数据需要发送的POST或GET请求报头。
然后自己再用python编写个伪装的浏览器,构造请求报送。然后返回的应该就是你要的数据了!具体看看下面
http://blog.csdn.net/evankaka/article/details/46849095
时间: 2024-09-17 03:42:13