设为首页 收藏本站
查看: 1140|回复: 0

[经验分享] elasticsearch中template介绍

[复制链接]
发表于 2017-5-20 13:53:02 | 显示全部楼层 |阅读模式
  template中规定了数据的存储格式、分片数量等信息,下边是一个elasticsearch中template例子:
[html] view plaincopy


  • http://192.168.1.215:9200/_template/content_tpl  
  • PUT  
  • {  
  •     "template" : "content_*",  
  •     "settings" : {  
  •         "number_of_shards" : 1,  
  •     "index.mapper.dynamic" : false  
  •     },  
  •     "mappings" : {  
  •         "doc" : {  
  •           "properties" : {  
  •         "id" : {"type" : "long", "store": "yes"},  
  •             "url" : {"type" : "string", "index" : "not_analyzed", "omit_norms": "true", "store": "yes"},  
  •         "signature" : {"type" : "string", "index" : "not_analyzed", "omit_norms": "true", "store": "yes"},  
  •             "keyword" : {"type" : "string", "index_analyzer" : "lezhi_keyword", "index_options": "positions",  
  •                          "omit_norms": "true", "store": "no"},  
  •         "count" : {"type": "int", "index": "no", "store": "yes"},  
  •             "lastModified" : {"type" : "long", "store": "yes"}  
  •       }  
  •         }  
  •     }  
  • }  

  template大致分成setting和mappings两部分:
  1. settings主要作用于index的一些相关配置信息,如分片数、副本数,tranlog同步条件、refresh等。
  2. mappings主要是一些说明信息,大致又分为_all、_source、prpperties这三部分:
       (1) _all:主要指的是AllField字段,我们可以将一个或多个都包含进来,在进行检索时无需指定字段的情况下检索多个字段。设置“_all" : {"enabled" : true}
       (2) _source: 主要指的是SourceField字段,Source可以理解为ES除了将数据保存在索引文件中,另外还有一份源数据。_source字段在我们进行检索 时相当重要,如果在{"enabled" : false}情况下默认检索只会返回ID, 你需要通过Fields字段去到索引中去取数据,效率不是很高。但是enabled设置为true时,索引会比较大,这时可以通过Compress进行压 缩和inclueds、excludes来在字段级别上进行一些限制,自定义哪些字段允许存储。
       (3) properties:这是最重要的步伐,主要针对索引结构和字段级别上的一些设置。
  一些详细解释可以参考 http://www.elasticsearch.org/guide/reference/mapping/
  下面详细介绍properties中的一些配置
  1. index_options 
      Add index_options (applicable to string type) with values of:
      (1) docs: only documents are indexed, term frequencies and positions are omitted.
      (2) freqs: documents and term frequencies are index, positions are omitted.
    (3) positions: documents, term frequencies, and positions are indexed.
    see: http://https://github.com/elasticsearch/elasticsearch/issues/2346
      positions选项可以让lucene跳过对该项的出现频率和出现位置的索引,还可以节省一些索引在磁盘上的存储空间,还可以加速搜索和过滤过程,但是会但是悄悄阻止需要位置信息的搜索,如阻止PhraseQuery和SpanQuery类的运行
  2. index
      (1) analyzed -- 使用分词器将域值分解成独立的语汇单元流,并使每个语汇单元能被搜到,适用于普通文本域(如正文、标题、摘要等),通常需要设置“index_analyzer"。
    (2) not_analyzed -- 对域进行索引,但不对String值进行分析,实际上将域值作为 单一语汇单元并使之能本搜索,适用于不能被分解的域值,如URL、文件路径、日期、电话等。
    (3) no -- 使用对应的域值不被搜索
3. omit_norms
      norms记录了索引中index-time boost信息,但是当你进行搜索时可能会比较耗费内存。omit_norms = true则是忽略掉域加权信息,这样在搜索的时候就不会处理索引时刻的加权信息了。
  4. store
      域存储选项store,用来确定是否需要存储域的真实值,以便后续搜集时能恢复这个值。
      (1) yes -- 指定存储域值。该情况下,原始的字符串全部被保存在索引中,并可以由IndexReader类恢复。该选项对于需要展示搜索结果的一些域很有用(如URL、标题等)。如果索引的大小在搜索程序考虑之列的话,不要存储太大的域值,因为这些域值会消耗掉索引的存储空间。
    (2) no -- 指定不存储域值。该选项通常跟Index.ANALYZED选项共同用来索引大的文本域值,这些域值不用恢复初始格式,如文本正文。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-379388-1-1.html 上篇帖子: elasticsearch 的mapping定义 下篇帖子: elasticsearch中的mapping简介
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表