zdc253212956 发表于 2017-12-19 17:54:03

Solr整合中文分词组件IKAnalyzer

  我用的Solr是4.10版本,
  在csdn下载这个版本的IKAnalyzer:IK Analyzer 2012FF_hf1.zip
  解压后目录如下:

  (1)这里还用solr自带的example实验分词效果,在如下的WEB-INF目录新建classes文件夹,
  将IKAnalyzer.cfg.xml和stopword.dic拷贝到classes文件夹里面

  (2)将IKAnalyzer2012FF_u1.jar拷贝到lib文件夹里面
  (3)修改example\solr\collection1\conf目录下的schema.xml,在最下面添加如下4行
  

<fieldType name="text_ik">  <analyzer type="index" isMaxWordLength="false"/>      
  <analyzer type="query" isMaxWordLength="true"/>
  
</fieldType>
  

  不要在最上面添加,会报错

  (4)重新启动solr
  在运行-cmd-切换回D盘的example目录下,执行java -jar start.jar
  再登录Solr管理界面,Analysis中的Field Value里输入一句话,FieldType选择刚在xml中配置的text_ik,点击蓝色按钮Analyse Values,

  停用词的使用:
  http://www.tuicool.com/articles/aYJ3Qv3
页: [1]
查看完整版本: Solr整合中文分词组件IKAnalyzer