设为首页 收藏本站
查看: 837|回复: 0

[经验分享] solr-schema配置详解

[复制链接]

尚未签到

发表于 2016-12-15 10:18:08 | 显示全部楼层 |阅读模式
schema.xml文件中各个节点的配置极其作用。
  schema.xml配置文件是用于定义index索引库的结构,有点类似于数据表表的定义。
schema.xml文件里面主要定义了索引数据类型,索引字段等信息。
主要包括了以下节点
1.fieldtype节点
fieldtype节点主要用来定义数据类型。

<fieldType name="string" sortMissingLast="true" class="solr.StrField"/>  
<!-- boolean type: "true" or "false" -->  
<fieldType name="boolean" sortMissingLast="true" class="solr.BoolField"/>  
name指定的是节点定义的名称
class指向org.apache.solr.analysis中定义的类型名称
 
fieldtype还可以自己定义当前类型,建立索引(index)和查询数据(query)的时候使用的查询分析器。
analyzer指定查询分析器
tokenizer指定分词器
filter指定过滤器

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">  
<analyzer type="index">  
<tokenizer class="solr.StandardTokenizerFactory"/>  
<filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>  
<filter class="solr.LowerCaseFilterFactory"/>  
</analyzer>  
<analyzer type="query">  
<tokenizer class="solr.StandardTokenizerFactory"/>  
<filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>  
<filter class="solr.SynonymFilterFactory" ignoreCase="true" expand="true" synonyms="synonyms.txt"/>  
<filter class="solr.LowerCaseFilterFactory"/>  
</analyzer>  
</fieldType>
positionIncrementGap:可选属性,定义在同一个文档中此类型数据的空白间隔,避免短语匹配错误。
positionIncrementGap=100  只对 multiValue = true 的fieldType有意义。
StrField类型不被分析,而是被逐字地索引/存储  
solr.TextField 允许用户通过分析器来定制索引和查询,分析器包括一个分词器(tokenizer)和多个过滤器(filter)
 
2.field节点
field节点指定建立索引和查询数据的字段。
name代表数据字段名称
type代表数据类型,也就是之前定义的fieldtype
indexed代表是否被索引
stored代表是否被存储
multiValued是否有多个值,如果字段可能有多个值,尽可能设为true
_version节点和root节点是必须保留的,不能删除

<field name="_version_" stored="true" indexed="true" type="long"/>  
<field name="_root_" stored="false" indexed="true" type="string"/>  
<field name="ProductCode" stored="true" indexed="true" type="string" multiValued="false" required="true"/>  
<field name="ProductName" stored="true" indexed="true" type="text_general"/>  
3.copyfield节点
通过这个节点,可以把一个字段的值复制到另一个字段中,也可以把多个字段的值同时复制到另一个字段中,这样搜索的时候都可以根据一个字段来进行搜索。

<copyField source="ProductName" dest="text"/>  
<copyField source="ProductCode" dest="text"/>  
4.dynamicField节点
dynamicField表示动态字段,可以动态定义一个字段,只要符合规则的字段都可以。
*_i只要以_i结尾的字段都满足这个定义

<dynamicField name="*_i" stored="true" indexed="true" type="int"/>  
 5.其他节点
uniquekey节点是文档的唯一标识,相当于主键,每次更新删除的时候都根据这个字段来进行操作。必须填写
<uniqueKey>ProductCode</uniqueKey>
 
defaultSearchField指定搜索的时候默认搜索字段的值,
<defaultSearchField > text </ defaultSearchField >
 
solrQueryParser指定搜索时多个词之间的关系,可以是or,and两种
<solrQueryParser defaultOperator="OR" />
 
6.性能优化
将所有只用于搜索的,而不需要作为结果的field(特别是一些比较大的field)的stored设置为false。
将不需要被用于搜索的,而只是作为结果返回的field的indexed设置为false。
删除所有不必要的copyField声明。
为了索引字段的最小化和搜索的效率,将所有的text fields的index都设置成false,然后使用copyField将他们都复制到一个总的text field上,然后进行搜索。  
 

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-314636-1-1.html 上篇帖子: 优化Solr schemalXML 设置 下篇帖子: solr中facet、group查询
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表