设为首页 收藏本站
查看: 1297|回复: 0

[经验分享] solr 自动补全

[复制链接]

尚未签到

发表于 2016-12-15 09:20:42 | 显示全部楼层 |阅读模式
  solr自动补全:
  http://www.cnblogs.com/ibook360/archive/2011/11/30/2269077.html
  在Solr的自动完成/自动补充实现介绍(第一部分) 中我介绍了怎么用faceting的机制来实现自动完成(autocomplete)的功能,今天我们来看一下如何用Suggester的组件来实现自动完成功能.

开始
DSC0000.png

这里有一点需要提醒:Suggest组件在1.4.1或以下版本不可用。要使用这个组件,你需要下载3_xlucene/solr的主干版本。

配置
在索引配置之前,我们定义一个searchComponent


DSC0001.gif

<searchComponent name="suggest" class="solr.SpellCheckComponent">  
<lst name="spellchecker">  
<str name="name">suggest</str>  
<str name="classname">org.apache.solr.spelling.suggest.Suggester</str>  
<str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str>  
<str name="field">name_autocomplete</str>  
</lst>  
</searchComponent>  



  这个组件是基于solr.SpellCheckComponent的,这样我们就可以使用它的一些配置。配置中有3个非常重要的属性:
  
name:组件名
lookupImpl
:绑定这个搜索的对象,目前有两个类可以使用-JasperLookupTSTLookup,第二个效率更高
field
:针对的字段

现在让我们添加合适的handler




<requestHandler name="/suggest" class="org.apache.solr.handler.component.SearchHandler">  
<lst name="defaults">  
<str name="spellcheck">true</str>  
<str name="spellcheck.dictionary">suggest</str>  
<str name="spellcheck.count">10</str>  
</lst>  
<arr name="components">  
<str>suggest</str>  
</arr>  
</requestHandler>  



  

  非常简单的配置,它定义了Search的组件,告诉solr每次建议的最大个数为10,使用上面定义的suggest组件。

索引
假设我们的文档有三个字段:idnamedescription。我们想给name字段做自动完成功能,索引配置则为:


<field name="id" type="string" indexed="true" stored="true" multiValued="false" required="true"/>  
<field name="name" type="text" indexed="true" stored="true" multiValued="false" />  
<field name="name_autocomplete" type="text_auto" indexed="true" stored="true" multiValued="false" />  
<field name="description" type="text" indexed="true" stored="true" multiValued="false" />  

  另外,需要定义一个copyFiled

<copyField source="name" dest="name_autocomplete" />  

  单词建议
为了完成单独词的建议,我们需要定义一个 text_autocomplete的类型:




<fieldType class="solr.TextField" name="text_auto" positionIncrementGap="100">  
<analyzer>  
<tokenizer class="solr.WhitespaceTokenizerFactory"/>  
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>  
<filter class="solr.LowerCaseFilterFactory"/>  
</analyzer>  
</fieldType>  



  词组建议
如果实现完整的词组建议,我们的text_autocomplete类型应该定义为:


<fieldType class="solr.TextField" name="text_auto">  
<analyzer>  
<tokenizer class="solr.KeywordTokenizerFactory"/>  
<filter class="solr.LowerCaseFilterFactory"/>  
</analyzer>  
</fieldType>  

  

  如果使用词组,你需要定义自己的转换类(对于中文如庖丁、iK)

建立词典
在我们开始使用该组件前,我们需要对它建立索引,可以使用solr命令:


/suggest?spellcheck.build=true  

  
查询
现在终于可以使用这个组件了。使用词组的建议方式,假设查询语句为:


/suggest?q=har  

  

  执行该语句后,得到下面的建议:



<?xml version="1.0" encoding="UTF-8"?>  
<response>  
<lst name="responseHeader">  
<int name="status">0</int>  
<int name="QTime">0</int>  
</lst>  
<lst name="spellcheck">  
<lst name="suggestions">  
<lst name="dys">  
<int name="numFound">4</int>  
<int name="startOffset">0</int>  
<int name="endOffset">3</int>  
<arr name="suggestion">  
<str>hard drive</str>  
<str>hard drive samsung</str>  
<str>hard drive seagate</str>  
<str>hard drive toshiba</str>  
</arr>  
</lst>  
</lst>  
</lst>  
</response>  



  结尾
下一部分我将介绍如何修改配置来使用静态的词典信息以及怎么获得更好的建议。该系列的最后一部分将对会这些方法做一个性能的比较,并选出在不同场景下最快的一个。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-314542-1-1.html 上篇帖子: solr in action翻译- 第五章配置Solr 5.1 下篇帖子: solr hbase 大数据
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表