ubuntu系统安装apachesolr及中文分词配置的方法

Solr 中的每个 Document 需要有能唯一标识其自身的属性,默认情况下这个属性的名字是 id,在 Schema 配置文件中使用:<uniqueKey>id</uniqueKey>进行描述

安装jdk与tomcat7

apt-get install openjdk-7-jdk
apt-get install tomcat7 tomcat7-admin

下载并配置apachesolr

http://archive.apache.org/dist/lucene/solr/

下载如下格式的文件:

solr-4.x.x.tgz

下载solr,尽量使用4.x的最新版本吧,5.x目录结构改动很大,没摸索出来。

tar xzf solr-4.x.x.tgz
cd solr.4.x.x.tgz

cp example/lib/ext/* /usr/share/tomcat7/lib/
cp dist/solrj-lib/* /usr/share/tomcat7/lib/
cp dist/solr-4.x.x.war /var/lib/tomcat7/webapps/solr.war
mkdir -p /var/lib/tomcat7/solr
cp -r example/solr/collection1/conf /var/lib/tomcat7/solr/

solr配置

https://www.drupal.org/project/search_api_solr

rsync -av search_api_solr/solr-conf/solr-4.x/ /var/lib/tomcat7/solr/conf/

使用http://pan.baidu.com/s/1gduye8F的scheme.xml配置覆盖如下文件

/var/lib/tomcat7/solr/drupal/conf/scheme.xml

vi /var/lib/tomcat7/solr/solr.xml

<?xml version="1.0" encoding="UTF-8" ?>
<solr persistent="false">
  <cores adminPath="/admin/cores">
    <core name="drupal" instanceDir="drupal" />
  </cores>
</solr>

mkdir /var/lib/tomcat7/solr/drupal
cp -r /var/lib/tomcat7/solr/conf /var/lib/tomcat7/solr/drupal/

如果需要两个环境,则执行如下:

cp /var/lib/tomcat7/solr/drupal /var/lib/tomcat7/solr/dev -r
vi /var/lib/tomcat7/solr/solr.xml

<?xml version="1.0" encoding="UTF-8" ?>
<solr persistent="false">
  <cores adminPath="/admin/cores">
    <core name="dev" instanceDir="dev" />
    <core name="drupal" instanceDir="drupal" />
  </cores>
</solr>

配置IK中文分词

到https://code.google.com/p/ik-analyzer/downloads/list下载并解压IKAnalyzer,版本号选择2012FF_hf1。

cp IKAnalyzer2012FF_u1.jar /var/lib/tomcat7/webapps/solr/WEB-INF/lib/
cp stopword.dic IKAnalyzer.cfg.xml /var/lib/tomcat7/webapps/solr/WEB-INF/classes

修改文件所有者并重启服务

service tomcat7 stop
chown tomcat7:tomcat7 /var/lib/tomcat7 -R
service tomcat7 start

时间: 2024-09-20 09:03:16

ubuntu系统安装apachesolr及中文分词配置的方法的相关文章

ubuntu下Mysql+sphinx+中文分词安装配置

一.编译先前条件 确认是否已经安装以下软件,有些也许不是必须的,但建议还是都装上. apt-get install autoconf automake autotools-dev cpp curl gawk gcc lftp libc6-dev linux-libc-dev make libpcre3-dev libpcrecpp0 g++ libtool libncurses5-dev aptitude install libmysql++-dev libmysqlclient15-dev c

ubuntu 系统 sublime text3中文输入配置

环境 ubuntu 16.04 amd64 sublime text3 准备工作 #安装 libgtk2.0-dev ,否则报错,No package 'gtk+-2.0' found : apt-get install libgtk2.0-dev 编译工作 1. 编辑 sublime_imfix.c #include <gtk/gtkimcontext.h>    void gtk_im_context_set_client_window (GtkIMContext *context,   

Ubuntu通过修改配置文件进行网络配置的方法

  Ubuntu系统进行网络配置有的时候用图形界面不起作用,这种情况下可以直接修改某些启动脚本或配置文件 Ubuntu系统进行网络配置涉及到几个配置文件1./etc/network/interfaces 2./etc/resolv.conf 操纵步骤: 1. 打开ubuntu的/etc/network/interfaces文件默认的内容如下: 代码如下: auto lo iface lo inet loopback 动态获取的配置方法: 代码如下: auto eth0 iface eth0 in

Solr学习总结(八)IK 中文分词的配置和使用

最近,很多朋友问我solr 中文分词配置的问题,都不知道怎么配置,怎么使用,原以为很简单,没想到这么多朋友都有问题,所以今天就总结总结中文分词的配置吧.   有的时候,用户搜索的关键字,可能是一句话,不是很规范.所以在 Solr 中查询出的时候,就需要将用户输入的关键字进行分词.   目前有很多优秀的中文分词组件.本篇只以  IKAnalyzer 分词为例,讲解如何在 solr  中及集成中文分词,使用 IKAnalyzer的原因 IK 比其他中文分词维护的勤快,和 Solr 集成也相对容易.具

【急】Nutch中如何添加中文分词插件??

问题描述 在网上看了一些关于添加中文分词插件的方法,但是按照类似的方法还是解决不了,或是网上都说的很模糊,我现在下载了一个IKAnalyzer插件,大家帮忙看一下我哪部错了,我在单独运行Query.java这个部分时,还是没有调用到自己添加的那个插件.具体的步骤是:1.下载了IKAnalyzer3.1.1Stable_AllInOne.jar包2.写配置文件plugin.xml文档3.把1和2这两个文件放入新建的IKAnalyzer3.1.1Stable文件夹中4.把IKAnalyzer3.1.

CoreSeek Mysql 安装与测试(中文分词与中文全文检索)

  CoreSeek安装比较麻烦,官方手册对此的支持并不算很好.CoreSeek是基于Sphinx的中文的分词和全文检索软件.本文是在MAC OS X系统下安装和调试CoreSeek.     安装过程中报错如果是警告warning则忽略,如果是错误error,则必须要处理.     CoreSeek是支持三种数据来源的,一种是众所周知的Mysql,一种是XML文件,另一种是Python.而Python则是万能数据类型.在本CoreSeek安装测试教程中只示例数据源是XML文件和MYSQL.  

11大Java开源中文分词器的使用方法和分词效果对比

本文的目标有两个: 1.学会使用11大Java开源中文分词器 2.对比分析11大Java开源中文分词器的分词效果 本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码,至于效果哪个好,那要用的人结合自己的应用场景自己来判断. 11大Java开源中文分词器,不同的分词器有不同的用法,定义的接口也不一样,我们先定义一个统一的接口: 从上面的定义我们知道,在Java中,同样的方法名称和参数,但是返回值不同,这种情况不可以使用重载. 这两个方法的区别在于返回值,每一个分词器都可能有多种分词

Ubuntu 14.04下mysql安装配置教程_MsSql

mysql是Oracle公司的一种开放源代码的关系型数据库管理系统,被广泛应用于各中小网站,是一种跨平台的数据库管理系统,现在介绍一下如何在Ubuntu 14.04上安装和配置mysql 方法/步骤 1.更新源列表 打开"终端窗口",输入"sudo apt-get update"-->回车-->"输入root用户的密码"-->回车,就可以了.如果不运行该命令,直接安装mysql,会出现"有几个软件包无法下载,您可以运行

Ubuntu 14.04下mysql安装配置教程

mysql是Oracle公司的一种开放源代码的关系型数据库管理系统,被广泛应用于各中小网站,是一种跨平台的数据库管理系统,现在介绍一下如何在Ubuntu 14.04上安装和配置mysql 方法/步骤 1.更新源列表 打开"终端窗口",输入"sudo apt-get update"-->回车-->"输入root用户的密码"-->回车,就可以了.如果不运行该命令,直接安装mysql,会出现"有几个软件包无法下载,您可以运行