设为首页 收藏本站
查看: 1048|回复: 0

[经验分享] 利用Solr服务建立的站内搜索雏形---solr1

[复制链接]

尚未签到

发表于 2015-7-16 13:19:13 | 显示全部楼层 |阅读模式
最近看完nutch后总感觉像好好捯饬下solr,上次看到老大给我展现了下站内搜索我便久久不能忘怀。总觉着之前搭建的nutch配上solr还是有点呆板,在nutch爬取的时候就建立索引到solr服务下,然后在solr的管理界面中选择query,比如在q选项框中将“*:*”改写为“title:安徽”,则在管理界面中就能看到搜索结果,可是这个与搜索引擎的感觉差远了,总感觉这些结果是被solr给套在他的管理界面中了,于是自己在网上搜索,也想整个站内搜索一样的东西,就算整不到那么炫,只要整到在solr的管理界面以外的地方出现搜索结果我就心满意足了……

网上海搜一番,发现有人做站内搜索的,但是也只是只言片语,没有很全的(后来发现及时很全的也不一定适用于你,因为搞IT的都具有时效性,谁知道你当前看到的一个类是不是n年前就被标记为过时了不能用了),但是也没办法,多看看结合一下,于是自己开始动手拼接组装程序了:

1.在程序中(我的环境是在Myeclipse中)要能够与solr服务器通信,毕竟你的索引是存在solr中的,然后就是加入搜索条件和要搜索的字段,再者就是一个查询类以及最后的结果的呈现,依次用到的是CommonsHttpSolrServer、SolrQuery、QueryResponse。

2.可是在组装好代码后运行是总是报错,也没有找到针对性的解决方案,但是调试的过程中把查询的条件取出来放到浏览器中查询是可以的,就是卡在QueryResponse qrsp = server.query(query); 这行,琢磨着应该是要换个纯净的工程,于是新建了个新的工程,按照网上要求的jar给导入,可是后来发现CommonsHttpSolrServer类总是无法导包,进入一看solrj的jar包下确实没有这个类,所以针对性的在网上搜索后发现该类在solr3.6版本后就被抛弃了,改用HttpSolrServer了,再次感谢链接:http://wenwen.sogou.com/z/q423004525.htm
除了导入solr-solrj-4.6.0.jar以外还导入了以下jar包,这些jar都来源于自己下载的\solr-4.4.0\solr-4.4.0\dist\solrj-lib目录下的所有jar包


DSC0000.jpg

3.有了jar包之后,就开始运行程序了,我的solr是装在虚拟机里面,所以还要先到虚拟机中把tomcat服务启动(我的solr服务已经部署到tomcat服务器下了),然后在win7系统的浏览器中输入http://ip:8080/solr就可以访问我虚拟机里的solr了,大体主体部分如下:
String url="http://ip:8080/solr/";
HttpSolrServer server = new HttpSolrServer(url);
server.setSoTimeout(3000); // socket read timeout
server.setConnectionTimeout(1000);
server.setDefaultMaxConnectionsPerHost(1000);
server.setMaxTotalConnections(10);
server.setFollowRedirects(false); // defaults to false
server.setAllowCompression(true);
server.setMaxRetries(1);
注意以上的ip为自己的ip,我的端口是8080,因为用的tomcat服务器,如果你没有部署到tomcat下,直接启动solr的example下的服务应该是8389,上面主要是与solr服务通信以及一些参数的设置;

SolrQuery query = new SolrQuery();
query.setQuery("title:安徽");
query.addField("content");
query.setStart(0);
query.setRows(15);
上面的这些代码是生命一个查询类,并赋给查询条件以及查询字段

QueryResponse qrsp = server.query(query);
SolrDocumentList docs = qrsp.getResults();
Iterator it = docs.iterator();
while (it.hasNext()) {
System.out.println(it.next());
}

这段代码是接收相应的搜索结果以及遍历显示打印搜索结果。



虽然以上算不得什么搜索引擎,也没有任何界面的显示,但是我已很欣慰,因为都已经能搜索了,离我的小百度还远么(开玩笑的^_^)下一步准备先看看solrj具体是怎么应用的,每个部分都如何使用的摸索弄个搜索引擎的模样出来过过瘾。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-87329-1-1.html 上篇帖子: [solr] 下篇帖子: Solr的学习使用之(四)建数据库(添加Core)、表(配置schema.xml)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表