问题描述
如果我要做这样一个搜索程序比如:名称addresstellink武汉火车站湖北省武汉市....123456http://www.wh.cn只取这几个名称显示成一个列表.与之相关的20条能过googlebaidu?问题怎么取这几个字段?
解决方案
解决方案二:
up
解决方案三:
名称addresstellink武汉火车站湖北省武汉市....123456http://www.wh.cn只搜与这几个名称相关的网页并取出来显示成一个列表
解决方案四:
要自动分析结果,取出正确答案,那基本没戏如果只是取得GOOGLE或百度的搜索结果,基本就是写几个合适的正则就能搞定了
解决方案五:
1:蜘蛛程序仅仅只是收集网页,只是一个downloader;2:对文本进行分析的是SE的分析引擎,其中包括了HTML格式化等语言处理程序,分析后形成索引;3:搜索则是搜索引擎SE来做,通过对搜索结果进行评分决定相关性排序的顺序,显示给用户;泛化意义上的搜索引擎是这几个组件的综合体有些蜘蛛喜欢在采集同时进行分析,但纯粹意义上的蜘蛛只做很简单的工作的LZ你想要的是一整套SE,要采集然后分析的如果只是对GOOGLE、BAIDU进行聚合,那么搞几个正则,分析GOOGLE、BAIDU的返回内容就可以了
解决方案六:
webrequest等获取数据,再用正则获取相关值
时间: 2024-10-24 21:05:54