Solr的自动完成实现方式（第三部分：Suggester方式续）

ms133 发表于 2015-7-16 13:24:33

　　在之前的两个部分(part1、part2)中,我们学会了如何配置和查询solr来获取自动完成的功能。今天，我们来看一下如果为suggester添加字段，以这种方式来提供自动完成的功能。

组件配置
在上一期的配置组件中添加如下的参数：

dict.txt
　　这样我们的配置就变成了：

suggest
org.apache.solr.spelling.suggest.Suggester
org.apache.solr.spelling.suggest.tst.TSTLookup
name_autocomplete
dict.txt

　　使用这个参数，我们让suggest组件使用名叫dict.txt的文件作为solr的配置字典。
　　
handler配置
handler的配置也需要添加额外的一个参数：

true
　　
　　完整的配置为：

true
suggest
10
true

suggest

　　这个参数告诉solr，当查询的结果数多于设定的count数时，返回点击数更多的那些。
　　
Dictionary
我们告诉solr来使用这个字段，那么这个字段长的什么样呢？下面来看一个例子：

# sample dict
Hard disk hitachi
Hard disk wd 2.0
Hard disk jjdd 3.0
　　

　　这个字典的结果是什么样的呢？每个词组放在单独的一行中，每行以改词组的权重为结束(权重与词组之间以TAB字符分隔)，这个权重就是跟spellcheck.onlyMorePopular=true 香港的参数，默认值为1.0。该字段必须以UTF-8的编码格式存储。每行前有#字符的将被忽略(注释行)。
数据
以这种方式，我们不需要数据，字段就是数据。
运行
在重新构建suggester之后，我们来看一下它的运行情况，输入命令：

/suggest?q=Har
　　得到的结果为：

0
0


3
0
3

Hard disk jjdd
Hard disk wd
Hard disk hitachi

　　
　　结束语
跟预期一样，suggest的结果是按权重排序的。这里的大小写敏感(注意首字母).
你有什么建议呢？如果我们有一个很好的字典，这个字典的权重是基于用户的查询行为产生的，那么用户肯定会喜欢它！如果没有好的字典，还是不要用这种方式的好。
下一步
下一期，我们看一下不同方式的suggest产生的索引结构和大小。

　　原文URL：http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene
　　

页: [1]

运维网's Archiver

Solr的自动完成实现方式（第三部分：Suggester方式续）