mingche 发表于 2016-12-15 06:29:54

tomcat 集成solr+paoding or Ikanalyer

一.
1.      安装tomcat6.0
2.      下载apache-solr-3.1.0.zip
http://labs.xiaonei.com/apache-mirror/lucene/solr/3.1.0/

3.      解压后,打开apache-solr-3.1.0\dist目录,找到apache-solr-1.3.0.war,改名为solr.war(为了方便而已),然后把其考到tomcat的webapps目录下。
4.      运行tomcat后再webapps下会自动生成solr文件夹。
5.      在tomcat下的\conf\Catalina\localhost中加入solr.xml,内容如下:

<?xml version="1.0" encoding="UTF-8"?>

<Context reloadable="true" docBase="D:/solr/solr.war" >
   <Environment name="solr/home" type="java.lang.String" value="D:/solr/solr" override="true" />
</Context>

其中docBase对应solr.war的路径,可以改动
    Value对应solr的home,可以改动

6.      把apache-solr-1.3.0\example\solr下的文件夹(包括bin,conf,data)考到solr的home目录下。
7.      重启tomcat,进行测试http://localhost:8080/solr/admin/analysis.jsp
二. solr集成paoding分词
1.设置环境变量PAODING_DIC_HOME;“变量值”为词库目录(dic),如 d:/solr/solr/dic
2. 修改paoding-dic-home.properties文件,添加宽paoding.dic.home指向词典目录,运行build.bat, 重新编译生成jar包
paoding.dic.home=D:\solr\dic
3.把paoding-analysis.jar放入到solr.war.lib目录下
4. 修改solr配置文件, solr.home/conf/schema.xml 修改或加 text fieldType 元素,如:
<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="false" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="1"
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="true" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="1"
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
</fieldType>   

5.启动 tomcat 打开,http://localhost:8080/solr/admin/analysis.jsp,测试 paoding, 看是否正常工作

三. solr集成Ikanalyzer分词
...
本文转至http://blog.chenlb.com/2009/06/use-paoding-chinese-segment-in-solr.html
页: [1]
查看完整版本: tomcat 集成solr+paoding or Ikanalyer