设为首页 收藏本站
查看: 1615|回复: 0

[经验分享] 关于动态Mappin-多字段映射

[复制链接]

尚未签到

发表于 2019-1-29 14:18:22 | 显示全部楼层 |阅读模式
  1. 类型判定
  ElasticSearch在创建index的时候是可以不指定schema的,那么它是怎么知道你使用的是什么类型呢?实际上它是通过给定 document的json来判定的,例如,string的话是用引号引起来的,数字是光溜溜的,boolean类型是true或者false等等。这个 规则非常的简单,但是非常有效。例如有如下的json:
{ "field1": "hello", "field2": 1024 }  ES能够很容易判定field1为string类型,field2为数字类型,但是有些情况下,需要把所有的格式都存为string,true和 false就不行了,因为ES会优先将其存为boolean类型,这就需要我们手动指定schema,另外一个问题是,如果我们对某个index首次插入 数据的时候为某个field插入了一个数字类型,例如:
curl -XPUT localhost:9200/blog/article/1?pretty -d '{ "field1" : 1024}'  我们可以查看其mapping:
curl -XGET localhost:9200/blog/_mapping?pretty  我们可以看到其schem如下:
{ "blog" : {  "article" : {
  "properties" : {
  "field1" : {
  "type" : "long",
  "ignore_malformed" : false
  }
  }
  }
  }
  }
  这说明ES已经将该字段的类型定义为long了,然后如果我们插入string,那么就会报错,说类型不匹配:
curl -XPUT localhost:9200/blog/article/2?pretty -d '{  "field1" : "test string"
  }'
  返回结果为:
{ "error" : "MapperParsingException[Failed to parse [field1]];  nested: NumberFormatException[For input string:
  \"test string\"]; ", "status" : 400 }
  但是,如果继续插入float型数据是可以的,因为long可以转换为float,如下:
curl -XPUT localhost:9200/blog/article/2?pretty -d '{  "field1" : 3.14
  }'
  这时,我们在查看schema,可以看到ES将schema修改了。这就会对我们的数据精度造成影响,为了防止这种情况,或者为了防止已经存在的index添加字段,我们可以将动态schema关闭,如下:
{ "blog" : { "article" : { "dynamic" : "false", "properties" : { ... } } } }  2.动态mapping
  有时,我们需要通过json中的field和type来决定我们使用的mapping,这时,动态templates就派上用场了。动态 templates和普通的mapping类似,它有一个自己的模式,如果一个field的名字匹配了该模式,该template就会使用,下面是定义模 式的两种手段:
  match: template在field名匹配的时候起用。
  unmatch: template在field名不匹配的时候起用。
  当然,也可以使用path_match和path_unmatch对嵌套field使用。
  定义field的使用可以使用
  {name}: document最初写入数据的field的名字。
  {dynamic_type}: document最初写入数据的field的type。
  需要提醒的是,ES是按照你写的templates的顺序来匹配的,因此,匹配范围越广的应该放在越后,不然就会将所有后面的正则拦掉了。例如*应该放在最后:
{  
    "mappings" : {
  
        "article" : {
  
            "dynamic_templates" : [ {
  
                "template_test": {
  
                     "match" : "*",
  
                     "mapping" : {
  
                          "type" : "multi_field",
  
                          "fields" : {
  
                              "{name}": { "type" : "{dynamic_type}"},
  
                              "str": {"type" : "string"}
  
                        }
  
                    }
  
                }
  
            }]
  
        }
  
    }
  
}
  例如我在logstash的日志发现了一个错误,如下
  "response"=>"-"
  "error"=>"MapperParsingException[failed to parse [response];
  nested: NumberFormatException[For input string: \"-\"; "
  ,这是因为我之前在mapping中定义了response为long类型,现在写入的数据中出现了response=> "-",导致报错类型不匹配。
{  "dynamic_templates" : [ {
  "response_fields": {
  "match" : "*",
  "mapping" : {
  "type" : "multi_field",
  "fields" : {
  "response": { "type" : "long"}, "str": {"type" : "string"}
  }
  }
  }
  }
  }
  文章原链:http://www.dengchuanhua.com/



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-669268-1-1.html 上篇帖子: Logstash 日志采集工具 下篇帖子: ES配置文件中文版
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表