设为首页 收藏本站
查看: 1201|回复: 0

[经验分享] tomcat apache solr配置 IK分词配置

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2015-9-24 08:29:38 | 显示全部楼层 |阅读模式
简介:

    它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于 HTTP 的管理界面。您可以坚持使用 Solr 的表现优异的基本搜索功能,也可以对它进行扩展从而满足企业的需要。Solr 还拥有一个活跃的开发者群体,如有需要,您可以随时向他们寻求帮助。
先决条件:
    1.JDK1.6及以上版本(本例版本1.7.0_80)
    2.ant1.8及以上版本(本例版本1.9.6)
    3.tomcat7及以上版本(本例版本7.0.64)
    4.apache solr4.10.4
    5.IK Analyer 2012-FF hotfix 1完整分发包(sha256sum:f9577ff396e26890d031f39fa56fe44e53e4ee095155483ef062bf6c6eeff19d  IK Analyzer 2012FF_hf1.zip)
安装:
    1.JDK安装
    将下载好的压缩包直接解压并重命名为:/usr/local/java
    做java软链接:ln -s /usr/local/java/bin/java /usr/local/bin
    2.ant安装
    将下载好的ant解压并重命名:/usr/local/ant
    做ant软连接:ln -s /usr/local/ant/bin/ant /usr/local/bin
    3.tomcat安装
    将下载好的tomcat解压并重命名:/usr/local/tomcat7
    4.solr安装
    将下载好的solr解压到/usr/local/src目录下
    复制solr.jar到tomcat目录下
1
#cp /usr/local/src/solr-4.10.4/example/webapps/solr.war /usr/local/tomcat7/webapps/



    复制solr源目录下的jar到tomcat目录

1
#cp /usr/local/src/solr-4.10.4/example/lib/ext/*.jar /usr/local/tomcat7/webapps/solr/WEB-INF/lib/



    配置solr web.xml文件,大概40行左右,将取消注释,并修改solr源目录

1
   # vim /usr/local/tomcat7/webapps/solr/WEB-INF/web.xml



1
2
3
4
5
     40     <env-entry>   
     41        <env-entry-name>solr/home</env-entry-name>
     42        <env-entry-value>/usr/local/src/solr-4.10.4/example/solr</env-e    ntry-value>
     43        <env-entry-type>java.lang.String</env-entry-type>
     44     </env-entry>



    wKioL1YCiBXyXJRYAAGNLUZuHLM924.jpg
    5.IK分词配置
    下载IK分词https://code.google.com/p/ik-ana ... ip&can=2&q=

    将下载的IK分词解,将解压后的文件IKAnalyzer2012FF_u1.jar复制到WEB-INF/lib下
1
    #cp /usr/local/src/IK/IKAnalyzer2012FF_u1.jar /usr/local/tomcat7/webapps/solr/WEB-INF/lib/



    将IKAnalyzer.cfg.xml、stopword.dic  复制到 WEB-INF/classes下,没有 则创建
1
    #mkdir /usr/local/tomcat7/webapps/solr/WEB-INF/classes



1
    IK#cp IKAnalyzer.cfg.xml stopword.dic /usr/local/tomcat7/webapps/solr/WEB-INF/classes



    6.修改collection1/conf/schema.xml 此文件在solr源目录下
1
    vim /usr/local/src/solr-4.10.4/example/solr/collection1/conf/schema.xml



    在第一段中加入如下代码(注 之前加错位置,页面一直报错,直到找到这篇文章http://blog.iyunv.com/wuzhilon88/article/details/42675573):

1
2
3
4
112     <fieldType name="text_ik" class="solr.TextField">
113         <analyzer type="index" isMaxWordLength="false" class="org.wltea.ana     lyzer.lucene.IKAnalyzer"/>
114         <analyzer type="query" isMaxWordLength="true" class="org.wltea.anal     yzer.lucene.IKAnalyzer"/>
115     </fieldType>



wKioL1YCisaz7XxSAAHM84Pf8h4451.jpg
    在修改type字段
1
2
3
136    <field name="sku" type="text_en_splitting_tight" indexed="true" stored="     true" omitNorms="true"/>
137    <field name="name" type="text_ik" indexed="true" stored="true"/>
138    <field name="manu" type="text_ik" indexed="true" stored="true" omitNorms     ="true"/>



wKiom1YCitTRjbIoAAKB6bR7DjQ690.jpg

    IK分词前后对比效果图
配置IK分词前

wKioL1YCjBzCtB0rAAV4VaJatQM740.jpg
配置IK分词后

wKioL1YCjDDj0gc3AALkz9OHEh4098.jpg


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-117924-1-1.html 上篇帖子: 在CentOS下安装Solr5.3 下篇帖子: solr dismax
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表