设为首页 收藏本站
查看: 1329|回复: 0

[经验分享] 西北野狼

[复制链接]

尚未签到

发表于 2017-12-19 19:21:44 | 显示全部楼层 |阅读模式

全文检索:
  将整个文本进行“分词”处理,在索引库中为分词得到的每一个词都建立索引,和用户搜索的关键词进行匹配。实现快速查找效果。
传统sql语句实现的局限性:
  select song_id,song_name,song_singer,song_album
  from table_song
  where song_name like “%神话%” or song_album like “%神话%” or song_lyric like “%神话%”
  效率低,影响性能。
数据库使用索引有无的区别:
i. 不使用索引
  从字典中查“王”:从正文的第一页开始,逐页检查,看当前页中是否有“猪”这个字。要是没有再翻下一页。
ii. 使用索引
  从字典中查“王”:先根据这个字的拼音或偏旁部首在“检字表”中找到这个字所在的页码,例如是857页,然后直接翻到857页,找到这个字。
全文检索技术:
  Lucene和solr
DSC0000.png

索引库的结构:
  索引库中的内容并不是一张完整的数据库表,因为有些内容在查询结果列表中不显示,所以不需要放在索引库中。
DSC0001.png

字段域的创建:
  常用类型:

  • IntField
  • StringField
  • TextField
分词的概念
  把一句话/一篇文章拆分成一个一个单个的词,并在内部统计每个词出现的频率,以此为依据进行后续的查询搜索。
  Good morning lily
[good]

[morning]

[lily]

  我爱炒鸡蛋
[我]       [我]

[爱]       [爱]

[炒]       [炒鸡蛋]

[鸡蛋]

  不分词的例子:“地址”字段中的“深圳”数据就不需要分词。不分词的字符串类型就使用StringField,分词的字符串就使用TextField。
建立索引
  在索引库内部,将一个具体的索引值和文档中分词的结果关联起来,在搜索时使用索引可以快速定位到对应的词,进而快速定位到词所在的文档。
  只有需要和搜索关键词匹配的字段才需要建立索引。
  需要建立索引的字段例子:根据“神话”这个关键词搜索“song_name”字段中“神话”这条记录。
  不需要建立索引的字段的例子:图片的路径/aaa/bbb/ccc/pic10.png所在的picture_path字段不需要建立索引。
字段的相关属性

  •   数据类型:int、double、字符串等等
  •   是否分词

    • 要分词:包含很多词的一句话
    • 不分词:分词之后失去本来的含义

  •   是否建立索引

    • 要建立索引:用户会根据关键词搜索这个字段
    • 不建立索引:用户不会根据关键词搜索这个字段

  •   是否存储

    •   要存储:在查询结果列表中要显示,或会用到
    •   不存储:在查询结果列表中不显示也不会用到


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-425806-1-1.html 上篇帖子: Solr实现 并集式、多值、复杂 过滤查询的权限【转】 下篇帖子: [solr 管理界面]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表