问题描述
想实现一个系统,比如google的搜索,在客户端和搜索服务器之间建立一个代理服务器,通过代理服务器,对搜索结果进行过滤、控制,来获取最希望得到的结果。有没有高手能给点意见,类如实现方法,或者推荐的软件,最好是开源的。希望回答的详细点,或者推荐几部相关的资料。 问题补充:mtnt2008 写道
解决方案
如果那样的话,应该是要完成以下工作:1.获得搜索结果2.对得到的搜索结果进行解析,如:<li class="g w0">标签中的就是一条结果,而<li class="g">标签中的就是新闻的搜索结果3.按照你的规则和要求,对结果排序或者删除4.把处理后的结果发送到客户端编程的话,主要用到:1.soket或是对它的包装的URLConnection来得到搜索结果和发送搜索结果2.文本内容的处理,正则表达式
解决方案二:
现在,google的服务器做了一些处理,如果你搜索次数多的话,会出现验证码,用编程的方式不太容易解决.你可以看看google的自定义搜索
时间: 2024-10-18 11:12:56