实战:考虑性能

bestjoe · 发表于 2017-12-19 18:34:19

　　从 high level 的角度来看，schema.xml 结果如下,这个例子虽然不是一个真实的XML，但是简洁明了的传达了shema的概念。
　　

<schema>　　
<types>
　　
<fields>
　　
<uniqueKey>
　　
<defaultSearchField>
　　
<solrQueryParser defaultOperator>
　　
<copyField>
　　
</schema>
　　

　　绝大部分设计工作和内容都在types和fields中，这两个元素定义了索引的字段和类型，再辅以copyField。夹在copyField和fileds之间的是uniqueKey, defaultSearchField和defaultQueryOperator。

1.选择合适的数字类型。
　　一般数字字段：使用TrieIntField TrieLongField TrieFloatField TrieDoubleField 配置 precisionStep="0"。
　　频繁范围查询字段:如寻找price在[300,500]之间的记录，使用默认precisionStep或者设置precisionStep="8"(默认值)，这样能提高查询性能，同时代价是索引的size会有一点额外增加。

2.处理文本。
　　技巧1:通过copyField定义通用field。
　　搜索引擎用户不会希望自己输入field_name：value这种查询条件，更多时候，他们不关注fieldName。可以copy其他field的值到text字段中。搜索时，用户指定value，页面可以直接通过q查询，这也是大多数搜索引擎的搜索方法。
　　

<copyField source="name" dest="text" maxChars="25000" />　　
<copyField source="feature" dest="text" maxChars="25000" />
　　

　　技巧2:同一个值存不同形式。
　　假设你有一个名为author的field，同时需要满足按作者搜索和按第一作者做facet。如下:
　　Schildt, Herbert; Wolpert, Lewis; Davies, P.
　　1)按作者搜索场景,copy到textField类型，使用解析器lowCase+除去标点。
　　schildt herbert wolpert lewis davies p
　　2)facet场景，copy第一作者到string类型：
　　Schildt, Herber

3.Facet字段使用DocValues。
　　

<field name="manu_exact" type="string" indexed="false" stored="false" docValues="true"/>　　

　　如果该字段同时需要作为查询条件，indexed设置为true。

账号		自动登录	找回密码
密码			立即注册

大疆运维招人啦，

Red Hat RHCE 8 (EX294) Cert Guide

c++ size_t 和 int 的区别

HERE 使用 AWS EF 和 JFrog Artifactory 打

C++ 指针大全：从基础到进阶，一篇快速上手

wirelessnetview好用的无线分析工具

亿图图示专家(EDraw Max) V7.9 中文破解版

[经验分享] 实战:考虑性能

浏览过的版块

扫码加入运维网微信交流群