elasticsearc之mapping的介绍

tiyan 发表于 2019-1-29 11:58:41

　　为了能够把日期字段处理成日期，把数字字段处理成数字，把字符串字段处理成全文本（Full-text）或精确的字符串值，Elasticsearch需要知道每个字段里面都包含了什么类型。这些类型和字段的信息存储（包含）在映射（mapping）中。
　　
Elasticsearch支持以下简单字段类型：
类型表示的数据类型StringstringWhole numberbyte, short, integer, longFloating pointfloat, doubleBooleanbooleanDatedate
　　查看索引的mapping

　　# curl -GET "http://192.168.10.49:9200/site_test/test/_mapping"
{
"site_test":
{
"mappings":
   {
"test":
   {
"properties":
   {
   "@timestamp":
      {
         "type":"date",
         "format":"strict_date_optional_time||epoch_millis"
      },
      "count":
      {
         "type":"long"
      },
      "brower":
      {
      "type":"string"
      }
   }
   }
}
}
}　　原创地址：http://irow10.blog.运维网.com/2425361/1851001
　　上面的mapping中我们可以看到这个索引中有三个变量，分别是date类型，long类型和string类型
　　我们也可以用其他方式查看mapping。用head插件查看索引的索引信息
　　其中string类型的字段是默认的，考虑到包含全文本，它们的值在索引前要经过分析器分析，并且在全文搜索此字段前要把查询语句做分析处理。也就是说只要定义为string的字段默认会按照一个规则拆分字段。如：hello100 会拆分成 hello100两个字段。汉字会拆成一个个的。这样在画图是就尴尬了！
　　下图是elasticsearch中head插件查询到的数据

http://s4.运维网.com/wyfs02/M00/87/09/wKioL1fSJSLBGdX6AAAnb89QWw0822.png
　　windows 8.1这个字段就是上面mapping对应的brower。类型是string。
　　我们在kibana的setting查看下site_test各个字段的信息
http://s5.运维网.com/wyfs02/M00/87/0B/wKiom1fSJaqCXB2tAAApI6lelzM567.png
　　string类型的brower在analyzed（分析）这选项中打勾了！
　　现在我们用kibana画图试试看看会不会有什么异常
http://s3.运维网.com/wyfs02/M00/87/0B/wKiom1fSJjzS1y7TAAAhbIwKbdc335.png怎么windows和8.1分成两个字段画图了，这不是我们想要的结果。那该如何解决呢?
　　自定义mapping
　　因为重新更改一个索引的mapping，必须新建索引。
　　先新建一个site_site索引
# curl -XPOST http://192.168.10.49:9200/site_test
{"acknowledged":true}　　把修改好的mapping放入一个文件类：mapping
{
"test":
   {
"properties":
   {
      "@timestamp":
            {
         "type":"date",
         "format":"strict_date_optional_time||epoch_millis"
            },
      "count":
            {
            "type":"long"
            },
      "brower":
            {
            "type":"string"，
            "index": "not_analyzed"
            }
      }
   }
}

　　对brower字段额外加个属性not_analyzed（不分词）！

# curl -XPOST "http://192.168.10.49:9200/site_test/test/_mapping?pretty" -d '@mapping'
{
"acknowledged" : true
}　　这样就把索引和mapping都定义好了然后在导入数据就不会出现分词的情况！
　　备注：如果有多个_type,定义一个就好，其他的会按照定义好的格式去自己扩建mapping。
　　当然我们也可以把上面两步做到一步到位。如下：
　　curl -XPUT 'http://192.168.10.49:9200/site_test' -d '@mapping'
　　上面这条命令能完成建立索引和mapping。

页: [1]

运维网's Archiver

elasticsearc之mapping的介绍