[solr]

lakers009 · 发表于 2015-7-16 13:17:58

　　前文使用了SpellCheck做了个自动完成模拟（Solr SpellCheck），使用第一种SpellCheck方式做auto-complete，是基于动态代码方式建立内容，下面方式可通过读文件方式建立内容，并有点击率排序。
　　
　　1、在mycore/conf目录下新建一个dictionary.txt文件（UTF-8格式），内容为：

# sample dict
cpu intel I7 1.0
cpu AMD 5000+ 2.0
中央处理器英特尔 1.0
中央处理器 AMD 2.0
中央空调海尔 1匹 1.0
中央空调海尔 1.5匹 2.0
中央空调海尔 2匹 3.0
中央空调格力 1匹 4.0
中央空调格力 1.5匹 5.0
中央空调格力 2匹 6.0
中央空调美的 1匹 7.0
中央空调美的 1.5匹 8.0
中央空调美的 2匹 9.0
中国中央政府 1.0
中国中央银行 2.0
中国中央人民银行 3.0
启信有限公司 1.0
启信科技有限公司 2.0
　　注意上面的“1.0、2.0、3.0”，这就是点击率。以Tab字符(\t)隔开与前面的文字，否则视为普通文本。
　　
　　2、打开solrconfig.xml文件，加入节点到当中：

file
org.apache.solr.spelling.suggest.Suggester
org.apache.solr.spelling.suggest.tst.TSTLookup

content
true
true

dictionary.txt

./spellchecker

true

true
file

20

true

spellcheck

　　在中关键这句：

dictionary.txt
　　
　　3、打开浏览器地址栏输入：

http://localhost:8899/solr/mycore/spellcheck?spellcheck.build=true
　　结果为：

　　
　　4、在浏览器测试，输入地址：

http://localhost:8899/solr/mycore/spellcheck?q=中央&rows=0

　　
　　5、使用代码测试：

package com.my.solr;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;
import java.util.Map;
import org.apache.solr.client.solrj.SolrQuery;
import org.apache.solr.client.solrj.SolrServerException;
import org.apache.solr.client.solrj.impl.HttpSolrServer;
import org.apache.solr.client.solrj.impl.XMLResponseParser;
import org.apache.solr.client.solrj.response.QueryResponse;
import org.apache.solr.client.solrj.response.SpellCheckResponse;
import org.apache.solr.client.solrj.response.SpellCheckResponse.Collation;
import org.apache.solr.client.solrj.response.SpellCheckResponse.Correction;
import org.apache.solr.client.solrj.response.SpellCheckResponse.Suggestion;
import com.my.entity.Item;
public class TestSolr {
public static void main(String[] args) throws IOException, SolrServerException {
String url = "http://localhost:8899/solr/mycore";
HttpSolrServer core = new HttpSolrServer(url);
core.setMaxRetries(1);
core.setConnectionTimeout(5000);
core.setParser(new XMLResponseParser()); // binary parser is used by default
core.setSoTimeout(1000); // socket read timeout
core.setDefaultMaxConnectionsPerHost(100);
core.setMaxTotalConnections(100);
core.setFollowRedirects(false); // defaults to false
core.setAllowCompression(true);
// ------------------------------------------------------
// search
// ------------------------------------------------------
SolrQuery query = new SolrQuery();
String token = "中央";
query.set("qt", "/spellcheck");
query.set("q", token);
query.set("spellcheck", "on");
query.set("spellcheck.build", "true");
query.set("spellcheck.onlyMorePopular", "true");
query.set("spellcheck.count", "100");
query.set("spellcheck.alternativeTermCount", "4");
query.set("spellcheck.onlyMorePopular", "true");
query.set("spellcheck.extendedResults", "true");
query.set("spellcheck.maxResultsForSuggest", "5");
query.set("spellcheck.collate", "true");
query.set("spellcheck.collateExtendedResults", "true");
query.set("spellcheck.maxCollationTries", "5");
query.set("spellcheck.maxCollations", "3");
QueryResponse response = null;
try {
response = core.query(query);
System.out.println("查询耗时：" + response.getQTime());
} catch (SolrServerException e) {
System.err.println(e.getMessage());
e.printStackTrace();
} catch (Exception e) {
System.err.println(e.getMessage());
e.printStackTrace();
} finally {
core.shutdown();
}
SpellCheckResponse spellCheckResponse = response.getSpellCheckResponse();
if (spellCheckResponse != null) {
List suggestionList = spellCheckResponse.getSuggestions();
for (Suggestion suggestion : suggestionList) {
System.out.println("Suggestions NumFound: " + suggestion.getNumFound());
System.out.println("Token: " + suggestion.getToken());
System.out.print("Suggested: ");
List suggestedWordList = suggestion.getAlternatives();
for (String word : suggestedWordList) {
System.out.println(word + ", ");
}
System.out.println();
}
System.out.println();
Map suggestedMap = spellCheckResponse.getSuggestionMap();
for (Map.Entry entry : suggestedMap.entrySet()) {
System.out.println("suggestionName: " + entry.getKey());
Suggestion suggestion = entry.getValue();
System.out.println("NumFound: " + suggestion.getNumFound());
System.out.println("Token: " + suggestion.getToken());
System.out.print("suggested: ");
List suggestedList = suggestion.getAlternatives();
for (String suggestedWord : suggestedList) {
System.out.print(suggestedWord + ", ");
}
System.out.println("\n\n");
}
Suggestion suggestion = spellCheckResponse.getSuggestion(token);
System.out.println("NumFound: " + suggestion.getNumFound());
System.out.println("Token: " + suggestion.getToken());
System.out.print("suggested: ");
List suggestedList = suggestion.getAlternatives();
for (String suggestedWord : suggestedList) {
System.out.print(suggestedWord + ", ");
}
System.out.println("\n\n");
System.out.println("The First suggested word for solr is : " + spellCheckResponse.getFirstSuggestion(token));
System.out.println("\n\n");
List collatedList = spellCheckResponse.getCollatedResults();
if (collatedList != null) {
for (Collation collation : collatedList) {
System.out.println("collated query String: " + collation.getCollationQueryString());
System.out.println("collation Num: " + collation.getNumberOfHits());
List correctionList = collation.getMisspellingsAndCorrections();
for (Correction correction : correctionList) {
System.out.println("original: " + correction.getOriginal());
System.out.println("correction: " + correction.getCorrection());
}
System.out.println();
}
}
System.out.println();
System.out.println("The Collated word: " + spellCheckResponse.getCollatedResult());
System.out.println();
}
System.out.println("查询耗时：" + response.getQTime());
}
}
　　输出结果：

　　这里已经根据点击率排好序了。
　　

　　
　　
　　上面dictionary.txt中有一个“启信”，这不是一个分词，所以如果查询“启”字，是不会有结果的。
　　加入用户自定义分词方法：
　　1、打开solr web的目录webapps\solr\WEB-INF\classes，新建一个etc.dic文本文件，内容：

启信
　　编辑IKAnalyzer.cfg.xml文件：

IK Analyzer 扩展配置

ext.dic;

stopword.dic;

　　保存，重启tomcat。
　　地址栏输入：

http://localhost:8899/solr/mycore/spellcheck?q=启&rows=0
　　结果：

　　
　　使用代码方式亦同。

账号		自动登录	找回密码
密码			立即注册

zabbix3.4中文手册，官网完整COPY（2019042

最新rhel8官方手册三本PDF

winhex数据恢复教程（非常巨大，内容丰富）

KMSpico10.2.0 免费激活Win10/Office2016（

zabbix3.4.1安装部署+微信推送信息+大屏显

VMware vcenter+vSphere 6.5 U2共享

CentOS6.5下redis-3.2.6的安装与配置

[经验分享] [solr]

扫码加入运维网微信交流群