从 high level 的角度来看,schema.xml 结果如下,这个例子虽然不是一个真实的XML,但是简洁明了的传达了shema的概念。
<schema>
<types>
<fields>
<uniqueKey>
<defaultSearchField>
<solrQueryParser defaultOperator>
<copyField>
</schema>
绝大部分设计工作和内容都在types和fields中,这两个元素定义了索引的字段和类型,再辅以copyField。夹在copyField和fileds之间的是uniqueKey, defaultSearchField和defaultQueryOperator。
1.选择合适的数字类型。
一般数字字段 :使用TrieIntField TrieLongField TrieFloatField TrieDoubleField 配置 precisionStep="0"。
频繁范围查询字段 :如寻找price在[300,500]之间的记录,使用默认precisionStep或者设置precisionStep="8"(默认值),这样能提高查询性能,同时代价是索引的size会有一点额外增加。
2.处理文本。
技巧1:通过copyField定义通用field。
搜索引擎用户不会希望自己输入field_name:value这种查询条件,更多时候,他们不关注fieldName。可以copy其他field的值到text字段中。搜索时,用户指定value,页面可以直接通过q查询,这也是大多数搜索引擎的搜索方法。
<copyField source="name" dest="text" maxChars="25000" />
<copyField source="feature" dest="text" maxChars="25000" />
技巧2:同一个值存不同形式。
假设你有一个名为author的field,同时需要满足按作者搜索和按第一作者做facet。如下:
Schildt, Herbert; Wolpert, Lewis; Davies, P.
1)按作者搜索场景,copy到textField类型,使用解析器lowCase+除去标点。
schildt herbert wolpert lewis davies p
2)facet场景,copy第一作者到string类型:
Schildt, Herber
3.Facet字段使用DocValues。
<field name="manu_exact" type="string" indexed="false" stored="false" docValues="true"/>
如果该字段同时需要作为查询条件,indexed设置为true。
运维网声明
1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网 享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com