设为首页 收藏本站
查看: 1166|回复: 0

[经验分享] 搜索引擎 apache-solr

[复制链接]

尚未签到

发表于 2015-7-16 14:01:18 | 显示全部楼层 |阅读模式
SOLR


1.Solr server setup

l Java environment setup

Download linux JDK 6 from this website :

http://java.sun.com/javase/downloads/index.jsp

After installing JDK, edit /ect/profile , add these code to the end of the file

JAVA_HOME=/usr/java/jdk1.6.0_16

PATH=$JAVA_HOME/bin:$PATH

CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOME

export PATH

export CLASSPATH


/usr/java/jdk1.6.0_16 is the folder of the jdk. You should change it ,if you don’t install jdk in this folder.

l Solr setup

1.Download solr (apache-solr-1.3.0.zip ) from this website:  
http://ftp.kddilabs.jp/infosystems/apache/lucene/solr/


2.Install solr with following steps

#unzip -q apache-solr-1.3.0.zip#cd apache-solr-1.3.0/example/# java -jar start.jar           we can see that the Solr is running by loading http://localhost:8983/solr/admin/ in web browser. This is the main starting point for Administering Solr.  This is tutorial of solr http://lucene.apache.org/solr/tutorial.html.
  
2.Search Apach solr with php.

This is a tutorial of php solr client example:

http://www.ibm.com/developerworks/opensource/library/os-php-apachesolr/

We use PHP Solr Client to access to solr server . Download PHP Solr Client from this website: http://code.google.com/p/solr-php-client/downloads/list


l Change default Solr index data schema.

Solr index data schema is in the folder of “apache-solr-1.3.0\example\solr\conf\ schema.xml”

This is the snippet of solr schema.

...          ...  id ... text ...  
Edit the field element , change it as below:



product_name

To make this change active ,we have to restart Solr server as command like this:

#java -jar start.jar


l Create index by PHP

using php solr client , we can access to Solr easily.This is an example fo how to create an index by php.


l   Search index by PHP .

This is an example of searching index by php


l    delete index by PHP


l update index by PHP

If we want to update a document to index , there are two methods to resolve it :

     Method 1: delete the document by id, and then add an new one to index.

     Method 2: use the add method to directly add the document to index , because id is an indentify field, Solr server will use new document to cover the old one.

  如何使Solr支持中文,日文和英文的全文搜索呢。apache提供提供了一个 cjk库函数供我们使用,具体使用参考:http://chaifeng.com/blog/2008/01/_apache_solr.html

  默认情况下 Apache Solr 是不支持中文检索的,如果文档中包含中文,必须用完整的一句中文才能检索出内容。
下面以 Apache Solr 的演示程序为例,注意:粗体部分是需要修改的地方。
找到如下三行:
     
      
         
修改为:
     
      
         
找到如下两行:
      
         
修改为:
      
         
修改完毕,重新运行 Apache Solr 就可以对中文进行检索了,原先已经导入的文档需要重新导入。
记住原先的配置中有个 positionIncrementGap="100" 一定要删除了,否则会有异常。                           
  注意:如果是php编程,一定要让程序代码的编码格式为utf-8编码形式,不然创建索引会失败。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-87362-1-1.html 上篇帖子: 在Solr中配置和使用ansj分词 下篇帖子: Apache Solr的索引和查询顺序
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表