tomcat 集成solr+paoding or Ikanalyer

mingche 发表于 2016-12-15 06:29:54

一.
1.    安装tomcat6.0
2.    下载apache-solr-3.1.0.zip
http://labs.xiaonei.com/apache-mirror/lucene/solr/3.1.0/

3.    解压后，打开apache-solr-3.1.0\dist目录，找到apache-solr-1.3.0.war,改名为solr.war(为了方便而已)，然后把其考到tomcat的webapps目录下。
4.    运行tomcat后再webapps下会自动生成solr文件夹。
5.    在tomcat下的\conf\Catalina\localhost中加入solr.xml,内容如下：

<?xml version="1.0" encoding="UTF-8"?>

<Context reloadable="true" docBase="D:/solr/solr.war" >
<Environment name="solr/home" type="java.lang.String" value="D:/solr/solr" override="true" />
</Context>

其中docBase对应solr.war的路径，可以改动
Value对应solr的home，可以改动

6.    把apache-solr-1.3.0\example\solr下的文件夹（包括bin,conf,data）考到solr的home目录下。
7.    重启tomcat，进行测试http://localhost:8080/solr/admin/analysis.jsp
二. solr集成paoding分词
1.设置环境变量PAODING_DIC_HOME；“变量值”为词库目录(dic),如 d:/solr/solr/dic
2. 修改paoding-dic-home.properties文件，添加宽paoding.dic.home指向词典目录，运行build.bat, 重新编译生成jar包
paoding.dic.home=D:\solr\dic
3.把paoding-analysis.jar放入到solr.war.lib目录下
4. 修改solr配置文件， solr.home/conf/schema.xml 修改或加 text fieldType 元素，如：
<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="false" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="1"
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="true" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="1"
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
</fieldType>

5.启动 tomcat 打开，http://localhost:8080/solr/admin/analysis.jsp，测试 paoding, 看是否正常工作

三. solr集成Ikanalyzer分词
...
本文转至http://blog.chenlb.com/2009/06/use-paoding-chinese-segment-in-solr.html

页: [1]

运维网's Archiver

tomcat 集成solr+paoding or Ikanalyer