bvgcd 发表于 2013-12-31 09:06:06

solr4.5安装配置 linux+tomcat6.0+mmseg4j-1.9.1分词

solr4.5安装配置 linux+tomcat6.0+mmseg4j-1.9.1分词
首先先介绍下solr的安装配置

运行环境

Java 1.5或更高版本。(注:Solr 4以上版本,要求Java 1.6)
一个java servlet容器,如Tomcat 下载地址
统一编码字符
分词mmseg4j 下载地址


为防止大家各种目录搞混,安装前先告诉大家我自己所创建使用的目录

  整个运行环境我创建了三个目录,分别用于

    1、solr源码保存,位于/down/solr

    2、solr web运行环境,位于/usr/local/tomcat/webapps

    3、solr 实例运行环境,位于/usr/local/solr

  接下来的各种配置,将以此目录为标准。

安装步骤(这里以jdk1.6 tomcat6.0 为例)

停止的servlet容器
从下载的solr包中复制solr.war到你的servlet容器的webapps目录
cp /down/solr/example/webapps/solr.war/usr/local/tomcat/webapps/solr


从下载的solr包中复制示例Solr的文件夹到您的solr实例环境。
cp /down/solr/example/solr/usr/local/solr


打开 etv/profile 文件,添加如下配置,请修改为你的jdk安装目录:


export JAVA_HOME=/usr/java/jdk1.6.0_13

export JAVA_BIN=/usr/java/jdk1.6.0_13/bin

export PATH=$PATH:$JAVA_HOME/bin

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOME JAVA_BIN PATH CLASSPATH




启动Servlet容器。
打开http://localhost:8080/solr/admin solr管理后台,验证是否安装成功。
servlet容器可能已经开始的端口不是8080其他在...检查servlet容器的文档,如果你不知道这是什么。
如果已经在该端口上运行一个servlet容器,你可能无法启动。关闭另外一个或更改你是在运行的端口。
 有关使用一个以上的索引,或者Solr中的多于一个实例的工作信息,请参阅MultipleIndexes。

  基于tomcat的详细配置请查看英文原版:http://wiki.apache.org/solr/SolrTomcat

继续来配置mmseg4j分词下载地址

  首先,在你创建的solr实例目录下,新建lib,dic两个文件夹,一个用于存放jar文件(lib),一个用于存放词库(dic)

cd /usr/local/solr mkdir libmkdir dic
  解压你下载的mmseg4j ,将mmseg4j /dist目录下的jar文件拷贝至刚新建的lib文件夹,将mmseg4j /data目录下的文件拷贝纸刚新建的dic文件夹



打开 /usr/local/solr/collection1/conf/solrconfig.xml文件,添加配置

<lib dir="/usr/local/solr/lib" />
打开 /usr/local/solr/collection1/conf/schema.xml文件,分别在相应位置添加如下配置。




<field name="simple" type="textSimple" indexed="true" stored="true"/>
<field name="complex" type="textComplex" indexed="true" stored="true"/>
<field name="MaxWord" type="textMaxWord" indexed="true" stored="true"/>

<copyField source="simple" dest="text" />
<copyField source="complex" dest="text"/>
<copyField source="MaxWord" dest="text"/>

<fieldType name="textComplex" class="solr.TextField">
<analyzer>
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="/usr/local/solr/dic"/>
</analyzer>
</fieldType>
    <fieldType name="textMaxWord" class="solr.TextField">
<analyzer>
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="usr/local/solr/dic"/>
</analyzer>
</fieldType>
    <fieldType name="textSimple" class="solr.TextField">
<analyzer>
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="usr/local/solr/dic"/>
</analyzer>
</fieldType>



OK,到此为止词库已经配置成功,重启tomcat打开 http://localhost:8080/solr/admin 试试分词效果吧,各种配置的详解将在后面的文章进行说明。



ts2009 发表于 2013-12-31 17:18:15

无论做什么,记得为自己而做,那就毫无怨言。

reko_3 发表于 2013-12-31 22:09:22

活在这个腐败的社会.何必把自己装的那么清高

艾丝凡家的 发表于 2014-1-1 01:07:12

你总是一个不经意的动作挑起那暧昧不清的关系
页: [1]
查看完整版本: solr4.5安装配置 linux+tomcat6.0+mmseg4j-1.9.1分词