设为首页 收藏本站
查看: 1152|回复: 0

[经验分享] ElasticSearch 如何搜索

[复制链接]

尚未签到

发表于 2017-5-20 13:30:38 | 显示全部楼层 |阅读模式
ES不仅仅存储文档,还索引内容以便可搜索。
 
每个域都被索引,可以查询,不光这些,
在一个查询里,es可以使用所有的索引,以惊人的速度返回结果。
 
一个搜索可以:
1)搜索具体字段,比如性别或者年龄,按照加入日期排序,跟sql一样。
2)一个全文搜索,可以找到所有的匹配文档,按照相关性返回。
3)两者结合。
你需要了解三个主题:
1)Mapping   数据的每个域如何解释
2)Analysis  全文是如何处理以便搜索
3)Query SDL 弹性的,强大的查询语言
 
 
 
1 最基本的搜索形式是空搜索,没有任何限制,仅仅是简单返回集群里的所有索引的所有文档。
 
GET /_search
响应的格式如下:
{
   "hits" : {
      "total" :       14,
      "hits" : [
        {
          "_index":   "us",
          "_type":    "tweet",
          "_id":      "7",
          "_score":   1,
          "_source": {
             "date":    "2014-09-17",
             "name":    "John Smith",
             "tweet":   "The Query DSL is really powerful and flexible",
             "user_id": 2
          }
       },
        ... 9 RESULTS REMOVED ...
      ],
      "max_score" :   1
   },
   "took" :           4,
   "_shards" : {
      "failed" :      0,
      "successful" :  10,
      "total" :       10
   },
   "timed_out" :      false
}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
hits
最重要的就是hits,包含符合条件的文档总数。包含前10个,也就是只返回前面10个。
 
每个结果包含_index,_type,_id.还有_source字段。
这意味着整个文档立即可用。
不像其它搜索引擎只返回文档ID,需要你再次去拿到文档。
 
 
每个文档还包含有一个_score, 这个是相关性score,
 
默认情况下,总是返回相关度更高的文档,也就是说,按照_score逆序排列。
 
在这种情况下,我们不指定任何查询条件,所以所有的文档都是相关的,
max_score是最高分数。
 
 
took
这个字段告诉我们整个搜索花费了多少毫秒。
 
shards
这个字段告诉我们,此次查询涉及的分片的总数
多少成功,多少失败,
我们在正常条件下不期望分片失败,但是它还是可能发生的,
如果我们丢失了主分片和从分片,搜索就不会成功。
 
 
在这种条件下,es会报告说分片失败了,但是仍然从剩下的分片里搜索。
 
timeout
这个字段告诉我们查询是否超时,默认,搜索不会超时,
如果超时时间很重要,你可以指定超时时间,
 
GET /_search?timeout=10ms
这样es就会返回给 在超时时间之内搜到的文档。
http://my.oschina.net/qiangzigege/blog/264560
 
 
 
 
 
 
 
 
 
你是否意识到空搜索的结果包含不同的types,比如user,tweet,来自于两个不同的索引。
 
由于没有限制搜索特定的索引或者类型,我们搜索了集群里的所有文档,
 
ES并发的将搜索请求转发给每个分片的主分片或者是从分片,搜集结果,返回前10给客户。
 
 
通常,你将想在一个或者多个索引里搜索,或者一个或多个types里搜索,
我们可以在URL里指定这个。
 
/_search
搜索所有索引的所有类型
 
 
/gb/_search
搜索特定索引的所有类型
 
/gb,us/_search
搜索2个索引的所有类型
 
/g*,u*/_search
不用解释了吧
 
/gb/user/_search
搜索特定索引,特定类型的所有文档。
 
/gb,us/user,tweet/_search
不用解释了吧
 
/_all/user,tweet/_search
搜索所有索引的两个类型的所有文档。
 
当你在单个索引里搜索文档,es将搜索请求转发给索引里的每个分片的主分片或者从分片,
从每个分片里搜集结果,从多个索引里搜索是一样的。
 
理解下:一个索引,有5个主分片,在它里面搜索
完全等同于搜索5个索引,每个索引只有一个主分片。
这都不是事儿!http://my.oschina.net/qiangzigege/blog/264572
 
 
 
 
 
有14个文档,然后我们只返回了10个,剩下的怎么办?
sql使用limit关键字来指定页,es也是如此。
 
size
返回多少结果,默认10.
 
from
偏移量,默认0.
 
如果你想每页显示5个,如下:
GET /_search?size=5
GET /_search?size=5&from=5
GET /_search?size=5&from=10
 
注意到,搜索结果在返回前会被先存储起来,
记住,一个搜索通常涉及到多个分片,每个分片有自己的搜索排序结果,
然后集中起来再进行总的排序。
http://my.oschina.net/qiangzigege/blog/264584
 
 
 
 
 
 
 


 
 
 

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-379374-1-1.html 上篇帖子: ElasticSearch 如何索引 下篇帖子: ElasticSearch 类型映射
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表