ElasticSearch 如何搜索
ES不仅仅存储文档,还索引内容以便可搜索。每个域都被索引,可以查询,不光这些,
在一个查询里,es可以使用所有的索引,以惊人的速度返回结果。
一个搜索可以:
1)搜索具体字段,比如性别或者年龄,按照加入日期排序,跟sql一样。
2)一个全文搜索,可以找到所有的匹配文档,按照相关性返回。
3)两者结合。
你需要了解三个主题:
1)Mapping 数据的每个域如何解释
2)Analysis 全文是如何处理以便搜索
3)Query SDL 弹性的,强大的查询语言
1 最基本的搜索形式是空搜索,没有任何限制,仅仅是简单返回集群里的所有索引的所有文档。
GET /_search
响应的格式如下:
{
"hits" : {
"total" : 14,
"hits" : [
{
"_index": "us",
"_type": "tweet",
"_id": "7",
"_score": 1,
"_source": {
"date": "2014-09-17",
"name": "John Smith",
"tweet": "The Query DSL is really powerful and flexible",
"user_id": 2
}
},
... 9 RESULTS REMOVED ...
],
"max_score" : 1
},
"took" : 4,
"_shards" : {
"failed" : 0,
"successful" : 10,
"total" : 10
},
"timed_out" : false
}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
hits
最重要的就是hits,包含符合条件的文档总数。包含前10个,也就是只返回前面10个。
每个结果包含_index,_type,_id.还有_source字段。
这意味着整个文档立即可用。
不像其它搜索引擎只返回文档ID,需要你再次去拿到文档。
每个文档还包含有一个_score, 这个是相关性score,
默认情况下,总是返回相关度更高的文档,也就是说,按照_score逆序排列。
在这种情况下,我们不指定任何查询条件,所以所有的文档都是相关的,
max_score是最高分数。
took
这个字段告诉我们整个搜索花费了多少毫秒。
shards
这个字段告诉我们,此次查询涉及的分片的总数
多少成功,多少失败,
我们在正常条件下不期望分片失败,但是它还是可能发生的,
如果我们丢失了主分片和从分片,搜索就不会成功。
在这种条件下,es会报告说分片失败了,但是仍然从剩下的分片里搜索。
timeout
这个字段告诉我们查询是否超时,默认,搜索不会超时,
如果超时时间很重要,你可以指定超时时间,
GET /_search?timeout=10ms
这样es就会返回给 在超时时间之内搜到的文档。
http://my.oschina.net/qiangzigege/blog/264560
你是否意识到空搜索的结果包含不同的types,比如user,tweet,来自于两个不同的索引。
由于没有限制搜索特定的索引或者类型,我们搜索了集群里的所有文档,
ES并发的将搜索请求转发给每个分片的主分片或者是从分片,搜集结果,返回前10给客户。
通常,你将想在一个或者多个索引里搜索,或者一个或多个types里搜索,
我们可以在URL里指定这个。
/_search
搜索所有索引的所有类型
/gb/_search
搜索特定索引的所有类型
/gb,us/_search
搜索2个索引的所有类型
/g*,u*/_search
不用解释了吧
/gb/user/_search
搜索特定索引,特定类型的所有文档。
/gb,us/user,tweet/_search
不用解释了吧
/_all/user,tweet/_search
搜索所有索引的两个类型的所有文档。
当你在单个索引里搜索文档,es将搜索请求转发给索引里的每个分片的主分片或者从分片,
从每个分片里搜集结果,从多个索引里搜索是一样的。
理解下:一个索引,有5个主分片,在它里面搜索
完全等同于搜索5个索引,每个索引只有一个主分片。
这都不是事儿!http://my.oschina.net/qiangzigege/blog/264572
有14个文档,然后我们只返回了10个,剩下的怎么办?
sql使用limit关键字来指定页,es也是如此。
size
返回多少结果,默认10.
from
偏移量,默认0.
如果你想每页显示5个,如下:
GET /_search?size=5
GET /_search?size=5&from=5
GET /_search?size=5&from=10
注意到,搜索结果在返回前会被先存储起来,
记住,一个搜索通常涉及到多个分片,每个分片有自己的搜索排序结果,
然后集中起来再进行总的排序。
http://my.oschina.net/qiangzigege/blog/264584
页:
[1]