Drupal 7结合Apache Solr 4.7实现中文分词教程

Solr的版本升级较快，目前已经到5.x的版本，但是drupal的版本升级比较慢，因此关于Drupal升级使用solr高版本的问题，进展也比较慢，另外一个原因是Drupal的apachesolr模块是否支持也是一个问题，所以作者建议不要盲目的升级使用高版本，一定要测试之后才能在正式服务器上使用。

这次是参考网上的一些教程，把Apache Solr整合了中文分词，然后配合了Drupal的schema设置步骤，已经添加了自定义的中文分词器，对Drupal7以及中文分词做了支持。

Solr4.x增加了collection的概念，其实collection就是一个数据库的table的概念，这样一个core就可以有多个collection，solr的存储基本跟数据库就类似了。core等于数据库、collection等于数据表。

由于Jetty的版本不一样，导致配置文件的修改也有不同，因此jetty也做了适当修改，比如context.xml中把war文件改成了resourceBase的设置模式，以至于每次war文件解压不会覆盖work目录的修改。

第二个就是solr/drupal7/conf/solrconfig.xml文件中会引用很多相对路径的jar包文件，这些文件原本在solr- example中工作正常，但是单独拿出来就报错，因此作者把solr包里面的contrib文件夹复制到了solr(jetty)的根目录，并做了适当修改。

详细的使用还是跟之前的solr4z类似，只是这次只支持Drupal7，没办法支持Drupal6了。

#简单的启动请使用：(window/linux)

#端口号是：8983

java -jar start.jar

#使用辅助solrd (linux only)

#端口号： 8993

./solrd start #启动

./solrd startx #前端启动

./solrd stop #停止solr

Drupal里面设置url的时候，注意一下，直接使用corename/collection-name 就可以，具体参考Drupal大学这个问题：

在drupal中Solr4如何配置url?

时间： 2024-10-27 00:48:40

Solr学习总结（八）IK 中文分词的配置和使用