haoman 发表于 2017-5-20 13:30:38

ElasticSearch 如何搜索

ES不仅仅存储文档,还索引内容以便可搜索。
 
每个域都被索引,可以查询,不光这些,
在一个查询里,es可以使用所有的索引,以惊人的速度返回结果。
 
一个搜索可以:
1)搜索具体字段,比如性别或者年龄,按照加入日期排序,跟sql一样。
2)一个全文搜索,可以找到所有的匹配文档,按照相关性返回。
3)两者结合。
你需要了解三个主题:
1)Mapping   数据的每个域如何解释
2)Analysis  全文是如何处理以便搜索
3)Query SDL 弹性的,强大的查询语言
 
 
 
1 最基本的搜索形式是空搜索,没有任何限制,仅仅是简单返回集群里的所有索引的所有文档。
 
GET /_search
响应的格式如下:
{
   "hits" : {
      "total" :       14,
      "hits" : [
        {
          "_index":   "us",
          "_type":    "tweet",
          "_id":      "7",
          "_score":   1,
          "_source": {
             "date":    "2014-09-17",
             "name":    "John Smith",
             "tweet":   "The Query DSL is really powerful and flexible",
             "user_id": 2
          }
       },
        ... 9 RESULTS REMOVED ...
      ],
      "max_score" :   1
   },
   "took" :           4,
   "_shards" : {
      "failed" :      0,
      "successful" :  10,
      "total" :       10
   },
   "timed_out" :      false
}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
hits
最重要的就是hits,包含符合条件的文档总数。包含前10个,也就是只返回前面10个。
 
每个结果包含_index,_type,_id.还有_source字段。
这意味着整个文档立即可用。
不像其它搜索引擎只返回文档ID,需要你再次去拿到文档。
 
 
每个文档还包含有一个_score, 这个是相关性score,
 
默认情况下,总是返回相关度更高的文档,也就是说,按照_score逆序排列。
 
在这种情况下,我们不指定任何查询条件,所以所有的文档都是相关的,
max_score是最高分数。
 
 
took
这个字段告诉我们整个搜索花费了多少毫秒。
 
shards
这个字段告诉我们,此次查询涉及的分片的总数
多少成功,多少失败,
我们在正常条件下不期望分片失败,但是它还是可能发生的,
如果我们丢失了主分片和从分片,搜索就不会成功。
 
 
在这种条件下,es会报告说分片失败了,但是仍然从剩下的分片里搜索。
 
timeout
这个字段告诉我们查询是否超时,默认,搜索不会超时,
如果超时时间很重要,你可以指定超时时间,
 
GET /_search?timeout=10ms
这样es就会返回给 在超时时间之内搜到的文档。
http://my.oschina.net/qiangzigege/blog/264560
 
 
 
 
 
 
 
 
 
你是否意识到空搜索的结果包含不同的types,比如user,tweet,来自于两个不同的索引。
 
由于没有限制搜索特定的索引或者类型,我们搜索了集群里的所有文档,
 
ES并发的将搜索请求转发给每个分片的主分片或者是从分片,搜集结果,返回前10给客户。
 
 
通常,你将想在一个或者多个索引里搜索,或者一个或多个types里搜索,
我们可以在URL里指定这个。
 
/_search
搜索所有索引的所有类型
 
 
/gb/_search
搜索特定索引的所有类型
 
/gb,us/_search
搜索2个索引的所有类型
 
/g*,u*/_search
不用解释了吧
 
/gb/user/_search
搜索特定索引,特定类型的所有文档。
 
/gb,us/user,tweet/_search
不用解释了吧
 
/_all/user,tweet/_search
搜索所有索引的两个类型的所有文档。
 
当你在单个索引里搜索文档,es将搜索请求转发给索引里的每个分片的主分片或者从分片,
从每个分片里搜集结果,从多个索引里搜索是一样的。
 
理解下:一个索引,有5个主分片,在它里面搜索
完全等同于搜索5个索引,每个索引只有一个主分片。
这都不是事儿!http://my.oschina.net/qiangzigege/blog/264572
 
 
 
 
 
有14个文档,然后我们只返回了10个,剩下的怎么办?
sql使用limit关键字来指定页,es也是如此。
 
size
返回多少结果,默认10.
 
from
偏移量,默认0.
 
如果你想每页显示5个,如下:
GET /_search?size=5
GET /_search?size=5&from=5
GET /_search?size=5&from=10
 
注意到,搜索结果在返回前会被先存储起来,
记住,一个搜索通常涉及到多个分片,每个分片有自己的搜索排序结果,
然后集中起来再进行总的排序。
http://my.oschina.net/qiangzigege/blog/264584
 
 
 
 
 
 
 


 
 
 
页: [1]
查看完整版本: ElasticSearch 如何搜索