设为首页 收藏本站
查看: 1155|回复: 0

[经验分享] solr schema.xml 字段解析

[复制链接]

尚未签到

发表于 2016-12-15 08:48:27 | 显示全部楼层 |阅读模式
文章地址:http://quentinxxz.iyunv.com/blog/2100628


fieldType  

< fieldType name =" string " class =" solr.StrField " sortMissingLast =" true " omitNorms =" true " />


  • sortMissingLast和sortMissingFirst两个属性是用在可以内在使用String排序的类型上(包括:string,boolean,sint,slong,sfloat,sdouble,pdate)。
  • sortMissingLast="true",没有该field的数据排在有该field的数据之后,而不管请求时的排序规则。
  • sortMissingFirst="true",跟上面倒过来呗



 

 <fieldType name="tint" class="solr.TrieIntField" precisionStep="8" positionIncrementGap="0"/>


  •    TrieField 用于范围查询,性能比普通的数值类型要快10倍。
  • precisionStep 值越小,分割的field段就越多,索引要存储的信息也越大,同时范围查找速度也就越快。




  • positionIncrementGap:可选属性,定义在同一个文档中此类型数据的空白间隔,避免短语匹配错误。 和multiValued
    一起使用,设置多个值之间的虚拟空白的数量 

    关于positionIncrementGap的详细说明,参考文章http://rockiee281.blog.163.com/blog/static/19385222920127225619919/



 

    <fieldType name="pint" class="solr.IntField"/>
    <fieldType name="plong" class="solr.LongField"/>
    <fieldType name="pfloat" class="solr.FloatField"/>
    <fieldType name="pdouble" class="solr.DoubleField"/>
    <fieldType name="pdate" class="solr.DateField" sortMissingLast="true"/>


  •    这些数值类型,用于对已存在的索引的兼容(由lucence或早期版本的solr创建),暂不支持范围查找



 

    <!-- A text field that only splits on whitespace for exact matching of words -->
    <fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100">
      <analyzer>
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
      </analyzer>
    </fieldType>

         The optional positionIncrementGap puts space between multiple fields of this type on the same document, with the purpose of preventing false phrase
         matching across fields.




 


 <fieldType name="random" class="solr.RandomSortField" indexed="true" />


  • RandomSortField不会被存储,也不用于搜索任何数据,用于生成伪随机排序的docs。




 

Filed

     官方建议不要修改id 与_version_  filed。

    当下列可选属性被使用时,Lucene的term Vector的存储会被触发

 



  • termVectors=true|false


  • termPositions=true|false


  • termOffsets=true|false

    这些选项用于高亮以及其他配套功能的加速,但是会对索引的大小造成额外开销。

 

杂项

 <uniqueKey> 






  • solr并不强制要求schema有一个唯一字段,但schema都基都会设置一个唯一字段。官方建议不要修改这个字段。‘
  • 如果你在solrconfig.xml中启用了QueryElevationComponent 。就可以要求schema使用一个StrFiled类型的唯一字段。



 

 <defaultSearchField>



  • 当搜索fied没有被显示指定的时候,solr指该字段为默认搜索字段。 



 

<solrQueryParser defaultOperator="AND|OR"/>


  • 默认OR



 

<copyField> 


  • 你必须保证datatye 是兼容的



 

<similarity class="org.apache.lucene.search.similarities.DefaultSimilarity"/>




  • 指定评分器

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-314457-1-1.html 上篇帖子: solr---参数说明 下篇帖子: solr分布式索引
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表