设为首页 收藏本站
查看: 1361|回复: 0

[经验分享] 四、Solr数据源配置(JNDI、DIH)及定时重做索引

[复制链接]

尚未签到

发表于 2015-7-16 11:19:42 | 显示全部楼层 |阅读模式
简介
  Solr支持很多种创建索引的方式,包括网页,xml以及数据库,因为我这边做的是企业级的搜索,所以用的是数据库建立索引。其实从数据库建立索引,很大程度上取决于原来的数据库设计。
  从数据库建立索引,solr官方是提供一个工具的—Data Import Handler。在下载的solr中可以找到相关的jar包:
  solr-dataimporthandler-4.9.0.jar
  solr-dataimporthandler-extras-4.9.0.jar
  将这两个jar包添加进web-inf/lib中
  Solr/example中有example-DIH的项目,用了hsqldb作为数据库演示了DIH的使用。读者有兴趣可以去看下,这里就介绍我的配置方法。
  DIH还支持增量索引,即在上次建立索引的基础上,只导入增量的数据。这个需要数据表设计的比较好,能够有字段区分,比如创建日期。这里我并没有使用增量索引。
  
Jndi配置
      Jndi有两种配置方法,第一种是在tomcat中配置,跟普通的jndi配置并没有什么区别。
      另外一种则是在前面博客中说过的$TOMCAT_HOME\conf\Catalina\localhost\solr.xml中配置,因为我是在开发环境中配置,到生产环境时用的是resin所以,我使用第二种方法配置,之后比较容易移植。






  •      

  •    


Solrconfig.xml配置
  在每个核心中的solrconfig.xml中配置dataimport:




  •      

  •        dbconf/Song.xml  

  •      

  •    
  
  配置文件的路径最好使用相对路径。

Db.xml配置
  在solrconfig.xml中配置好了db.xml所在的路径后,接下来就来配置db.xml。名字可以随便起,不过建议和core name一致。
  先来看个最简单的配置:




  •       

  •    

  •          

  •             

  •             


  •          

  •       

  •    


  
  dataSource
  所使用的数据源,其中name为可选的,主要在使用多数据源时使用。
  Document
  代表一个文档
  Entity
  即需要从数据库中取出的数据,支持sql语句,支持多表查询。跨库查询后面会介绍
  Field
  即接受到的数据,列名column和索引中的名称(必须和schema.xml)中field定义的名字一样。
  
Schema.xml配置




  •    
  配置相应的field。
导入和测试
DSC0000.png
  如上图所示,点击excute即可将数据库中的数据导入索引库。
  
多数据源配置
  多数据源是非常有用的一个配置。比如用户的信息存储在user表中,但是用户的分类存储在category表中,这两个表用userid联系起来,那么用多数据源的配置会非常简单。当时我并不知道怎样配置多数据源,结果导致我的SQL非常长,并且如果需要同时用到mysql和oracle时,只能用两个核心来实现(使用多数据源后,可以再一个核心索引库里配置)。
  数据源jndi的配置就不说了。
  主要是DB.xml的配置:




  •    

  •    


  •    

  •       

  •       

  •       

  •       



  •          

  •             

  •          

  •    

  •    


  
  如上面的配置,其实配置是比较简单的,主要是SQL和数据的组织。可以看到DIH的功能是非常强大的。
定时重做索引
  在用solr生成索引时,还有一个需求就是定期重做索引,官方是不支持此功能的,需要使用一个修改过的第三方jar:solr-dataimportscheduler-1.1.jar。
  下载地址: https://code.google.com/p/solr-dataimport-scheduler/
  但是这个版本会有一个问题,它是使用post请求访问到solr服务器端,并没有制定content-type,导致出错,需要修改源码。
  所以附件提供修改后的jar包下载(下载配置后即可使用):
  
  配置:
  步骤一:
  在solr hom根目录中新建conf文件夹
  步骤二:
      将solr-dataimportscheduler-1.1.jar包解压缩取出dataimport.properties复制到上一步建立的conf文件夹中。
  步骤三:
  修改tomcat发布的webapps/solr/WEB-INF/web.xml(或者修改solr.war中WEB-INF/web.xml), 在servlet节点前面增加:




  • org.apache.solr.handler.dataimport.scheduler.ApplicationListener




  步骤四:
  在中配置相关的信息,都比较简单,读者可以自行看文件中的注释就明白了,特别说下重做索引的URL,如下:
  #  重做索引的参数


  • reBuildIndexParams=/select?qt=/dataimport&command=full-import&clean=true&commit=true

  • #reBuildIndexParams=/dataimport?command=full-import&clean=true&commit=true
  
  两种方式都可以。
  加上其他的配置信息,如localhost,port,syncCores等等,其实原理就是根据配置信息生成一个带有重做索引命令的url,然后定期访问该url即可。自己在项目中实现一个定时器也可以实现:)
  
  
附件
  点击下载

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-87253-1-1.html 上篇帖子: 在tomcat中运行solr-4.3.0 下篇帖子: .net软件xcopy形式集成solr搜索引擎
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表