设为首页 收藏本站
查看: 1943|回复: 0

[经验分享] Solr的自动完成实现方式(Suggester方式)

[复制链接]

尚未签到

发表于 2016-12-16 09:57:38 | 显示全部楼层 |阅读模式
开始 
DSC0000.png  

这里有一点需要提醒:Suggest组件在1.4.1或以下版本不可用。要使用这个组件,你需要下载3_xlucene/solr的主干版本。 

配置 
在索引配置之前,我们定义一个searchComponent 


DSC0001.gif

<searchComponent name="suggest" class="solr.SpellCheckComponent">  
<lst name="spellchecker">  
<str name="name">suggest</str>  
<str name="classname">org.apache.solr.spelling.suggest.Suggester</str>  
<str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str>  
<str name="field">name_autocomplete</str>  
</lst>  
</searchComponent>  




这个组件是基于solr.SpellCheckComponent的,这样我们就可以使用它的一些配置。配置中有3个非常重要的属性: 

name:组件名 
lookupImpl
:绑定这个搜索的对象,目前有两个类可以使用-JasperLookupTSTLookup,第二个效率更高 
field
:针对的字段 

现在让我们添加合适的handler 




<requestHandler name="/suggest" class="org.apache.solr.handler.component.SearchHandler">  
<lst name="defaults">  
<str name="spellcheck">true</str>  
<str name="spellcheck.dictionary">suggest</str>  
<str name="spellcheck.count">10</str>  
</lst>  
<arr name="components">  
<str>suggest</str>  
</arr>  
</requestHandler>  




 
非常简单的配置,它定义了Search的组件,告诉solr每次建议的最大个数为10,使用上面定义的suggest组件。 

索引 
假设我们的文档有三个字段:idnamedescription。我们想给name字段做自动完成功能,索引配置则为: 


<field name="id" type="string" indexed="true" stored="true" multiValued="false" required="true"/>  
<field name="name" type="text" indexed="true" stored="true" multiValued="false" />  
<field name="name_autocomplete" type="text_auto" indexed="true" stored="true" multiValued="false" />  
<field name="description" type="text" indexed="true" stored="true" multiValued="false" />  


 
另外,需要定义一个copyFiled 

<copyField source="name" dest="name_autocomplete" />  


 
单词建议 
为了完成单独词的建议,我们需要定义一个 text_autocomplete的类型




<fieldType class="solr.TextField" name="text_auto" positionIncrementGap="100">  
<analyzer>  
<tokenizer class="solr.WhitespaceTokenizerFactory"/>  
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>  
<filter class="solr.LowerCaseFilterFactory"/>  
</analyzer>  
</fieldType>  




 
词组建议 
如果实现完整的词组建议,我们的text_autocomplete类型应该定义为: 


<fieldType class="solr.TextField" name="text_auto">  
<analyzer>  
<tokenizer class="solr.KeywordTokenizerFactory"/>  
<filter class="solr.LowerCaseFilterFactory"/>  
</analyzer>  
</fieldType>  


 
如果使用词组,你需要定义自己的转换类(对于中文如庖丁、iK

建立词典 
在我们开始使用该组件前,我们需要对它建立索引,可以使用solr命令: 

 

/suggest?spellcheck.build=true  



查询 
现在终于可以使用这个组件了。使用词组的建议方式,假设查询语句为: 


/suggest?q=har  


 
执行该语句后,得到下面的建议: 



<?xml version="1.0" encoding="UTF-8"?>  
<response>  
<lst name="responseHeader">  
<int name="status">0</int>  
<int name="QTime">0</int>  
</lst>  
<lst name="spellcheck">  
<lst name="suggestions">  
<lst name="dys">  
<int name="numFound">4</int>  
<int name="startOffset">0</int>  
<int name="endOffset">3</int>  
<arr name="suggestion">  
<str>hard drive</str>  
<str>hard drive samsung</str>  
<str>hard drive seagate</str>  
<str>hard drive toshiba</str>  
</arr>  
</lst>  
</lst>  
</lst>  
</response>  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-315033-1-1.html 上篇帖子: 在Solr中使用IKAnalyzer遇到的一个问题 下篇帖子: Solr源码掘金之 SolrCloud中的zookeeper使用分析
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表