Yioop! 是一个PHP搜索引擎。Yioop!可配置为一个通用的整个">网站搜索引擎,它也可以配置提供URL或域名的搜索结果。它支持多种索引的文件格式,如:HTML、PDF、DOC、PPT、RTF、RSS、XML、SVG、PNG、JPG、BMP、GIF 和 Sitemaps。Yioop! 爬行器可以部署在低端与有线互联网硬件的一个或多个机器上。Yioop!可以抓取存储Web存档格式,且易于移动。爬行可以做到一台机器上和其他地方部署的结果。 Yioop!支持混合抓取,配备所需使用的GUI,可以本地化的一个搜索前端。这个GUI支持RTL语言。管理的抓取也可以使用这个GUI,可配置使用memcache,如果有一个简单的方式。
Yioop! 0.86该版本增加了初步支持查询用户类型的字建议。现在用于加快常见的两个词查询的bigramming与N字克。N字克过滤器文件,现在可以使用维基百科的原始页面计数转储。此版本增加了支持* 和 $,并允许抓取网站的设定。用这种方法,用户可以抓取的网站到一个固定的深度。robots.txt的处理现在支持*和$ robot.txt路径。支持NOSNIPPET、NOARCHIVE和X-Robots-标签的HTTP头也已实施。
软件信息:http://www.seekquarry.com/
下载地址:http://www.seekquarry.com/viewgit/?a=archive&p=yioop&h=ac5ed18f5faeb3511f809edd8f67dd632c1c43d6&hb=2341626254d213230fce7306637f844caa2a57f4&t=zip
时间: 2024-10-21 17:16:36