问题描述
- .net页面进行网络爬虫
-
中国海关 企业基本情况查询怎么爬虫,向各位大神求助,感激不尽。
http://service.customs.gov.cn/default.aspx?tabid=9408
解决方案
用httpwebrequest抓取页面的html,用正则表达式提取需要的数据。
解决方案二:
你是要抓取整站吗?
还是只是通过这个页面抓取企业信息?
解决方案三:
请求http request 获取返回的html页面,然后用xml格式来截取对应字段的数据。
解决方案四:
建议你使用HttpClient,不过我只写过get请求。
Java使用HttpClient的HttpGet获取网页内容 http://blog.csdn.net/testcs_dn/article/details/44021147
时间: 2025-01-07 16:30:01