问题描述
如题,如何提取网页中想要的信息并保存到text文件中!
解决方案
解决方案二:
该回复于2011-04-11 10:56:55被版主删除
解决方案三:
把网页中想要显示的内容转发(或者提交)给一个servlet控制器在控制器里面通过IO然后写到text中去
解决方案四:
提取的话,用正则过滤。
解决方案五:
引用2楼javaxiaochouyu的回复:
把网页中想要显示的内容转发(或者提交)给一个servlet控制器在控制器里面通过IO然后写到text中去
提取网页中想要的内容,这个怎么弄呢··初研究爬虫,所以不太了解,请各位大虾指点
解决方案六:
引用3楼ylz2007的回复:
提取的话,用正则过滤。
首先根据url拿到目标页面的文本,然后正则过滤出需要的,以及该页面内的所有链接对获得的链接与目前拥有的链接比对,去掉访问过的,得到还未进行爬取的进行再次处理这样层层向外
时间: 2024-11-10 01:31:29