设为首页 收藏本站
查看: 862|回复: 0

[经验分享] 利用SOLR搭建企业搜索平台 之十(数据库数据导入到solr)

[复制链接]
YunVN网友  发表于 2015-7-17 10:58:00 |阅读模式
solr不可谓是个好东西啊,越往下挖掘,他的各种功能逐渐的展现在我的面前,对于solr的架构人员,不得不令人佩服啊。
几天前偶尔看到IBM developmentWorks上面的一片文章,看到了数据库数据的导入,以前我一直是这么认为的,像这种导入可以自己去写程序去导入。
写程序 可以将数据读出100条,如果你的内存够大,可以是1000条甚至更多,然后放入Collection中,批量提交至solr。或者读取数据写入xml文件中,再将该文件提交到solr等等。但是,在我看到那一篇文章的时候,原来还有这么巧妙的招。
废话不多说,入正题。
一.首先准备好solr的dataimport功能需要的东西,在solr的下载包中。分别在:
1》Solr-1.3.0\dist\apache-solr-dataimporthandler-1.3.0.jar
2》E:\education\search\Solr-1.3.0\example\example-DIH\solr\
3》你是哪种数据库,提供该数据库的jdbc驱动。
二.如果你还不会运行solr,请参考本人的前几篇博客。这里要做的是,先把E:\education\search\Solr-1.3.0 \example\example-DIH\solr\下面的东西拷贝到solr的HOME目录,然后删除rss,这个是另外一个功能是导入rss订阅信 息到solr中,确实很强,这都想到了。将jar文件,实际就两个拷贝到tomcat的webapps下面的solr的WEB-INF的lib文件夹下 面。
三.更改solr Home目录下的conf/solrconfig.xml,其实就是提交一个solrRequestHandler,代码如下:



Xml代码 http://lianj-lee.javaeye.com/javascripts/syntaxhighlighter/clipboard_new.swf?clipboard=%3CrequestHandler%20name%3D%22%2Fdataimport%22%20class%3D%22org.apache.solr.handler.dataimport.DataImportHandler%22%3E%0A%20%20%20%20%3Clst%20name%3D%22defaults%22%3E%0A%20%20%20%20%20%20%3Cstr%20name%3D%22config%22%3EC%3A%5Csolr-tomcat%5Csolr%5Cdb%5Cconf%5Cdb-data-config.xml%3C%2Fstr%3E%0A%20%20%20%20%3C%2Flst%3E%0A%20%20%3C%2FrequestHandler%3E

  •   
  •       
  •       C:\solr-tomcat\solr\db\conf\db-data-config.xml  
  •       
  •    
            C:\solr-tomcat\solr\db\conf\db-data-config.xml         
四.将solr Home目录下面的solrconfig.xml和schema.xml拷贝到db文件夹下面的conf中。
五.修改db\conf\db-data-config.xml



Xml代码 http://lianj-lee.javaeye.com/javascripts/syntaxhighlighter/clipboard_new.swf?clipboard=%3CdataConfig%3E%0A%09%09%3CdataSource%20type%3D%22JdbcDataSource%22%20driver%3D%22com.mysql.jdbc.Driver%22%20url%3D%22jdbc%3Amysql%3A%2F%2Flocalhost%3A3306%2Ftuitui%22%20user%3D%22root%22%20password%3D%22mysql%22%2F%3E%0A%20%20%20%20%3Cdocument%20name%3D%22shop%22%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Centity%20name%3D%22tuitui_shop%22%20pk%3D%22shopId%22%20query%3D%22select%20*%20from%20tuitui_shop%22%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22shopid%22%20name%3D%22shopId%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22shopName%22%20name%3D%22shopName%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22shopUrl%22%20name%3D%22shopUrl%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22keyword%22%20name%3D%22keyword%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22synopsis%22%20name%3D%22synopsis%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22province%22%20name%3D%22province%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22city%22%20name%3D%22city%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22domain%22%20name%3D%22domain%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22address%22%20name%3D%22address%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22coordinate%22%20name%3D%22coordinate%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22shopSspn%22%20name%3D%22shopSspn%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22phone%22%20name%3D%22phone%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%3Cfield%20column%3D%22createTime%22%20name%3D%22createTime%22%20%2F%3E%0A%20%20%20%20%20%20%20%20%3C%2Fentity%3E%0A%20%20%20%20%3C%2Fdocument%3E%0A%3C%2FdataConfig%3E

  •   
  •          
  •       
  •               
  •               
  •               
  •               
  •               
  •               
  •               
  •               
  •               
  •               
  •               
  •               
  •               
  •               
  •          
  •       
  •   
                                                                                                                                                                                                            
其中的意思我做简单解释,具体大家可以去看看官方wiki。
document:一个文档也就是lucene的document这个没什么解释的;
entity:主要针对的是一个数据库表;
filed:属性column是数据库的字段,name是filed的名字,即schema中的field name
http://wiki.apache.org/solr/DataImportHandler
我的数据库表结构发出来:
DSC0000.png
六.启动TOMCAT,输入地址进行导入,导入分为很多模式:我选用的全部倒入模式。
http://localhost/solr/dataimport?command=full-import
结果:
00C:\solr-tomcat\solr\db\conf\db-data-config.xmlfull-importidle1202009-09-05 21:28:08Indexing completed. Added/Updated: 2 documents. Deleted 0 documents.2009-09-05 21:28:092009-09-05 21:28:090:0:0.579This response format is experimental. It is likely to change in the future.
七.在去查询你刚才提交的数据,搞定。
最后在说说这个功能。上面的例子只不过是很简单的一个部分。针对solr的MultiCore,通过配置db-data-config.xml也可以实现,还有多表,或者多表关联等等操作只要在db-data-config.xml配置清楚都可以进行数据的导入。
在solr1.4中还有更多的扩展功能,这些功能为重建索引提供能很方便的操作。而且,datasource不单单指的是database,可以是xml文件,还可以是来自网络上的等等。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-87598-1-1.html 上篇帖子: Solr拼写检查(spellCheck)配置和使用 下篇帖子: Ubuntu下安装Solr
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表