设为首页 收藏本站
查看: 995|回复: 0

[经验分享] Solr 学习(5) —- Solr查询语法和参数

[复制链接]

尚未签到

发表于 2016-12-15 09:54:25 | 显示全部楼层 |阅读模式
  1、查询地址
  建立好solr的索引后,可以通过管理界面进行查询。http://127.0.0.1:8983/solr/admin/form.jsp
  要尝试多个查询方法的话,可以进入full interface模式,并勾选debug选项,像下面这样
  
DSC0000.jpg
  随便进行一个查询,如输入 hi ,通过返回的页面的debug项中,就可以看到solr进行查询的很多相关信息

<lst name="debug">
<str name="rawquerystring">hi</str>
<str name="querystring">hi</str>
<str name="parsedquery">text:hi</str>
<str name="parsedquery_toString">text:hi</str>
<lst name="explain">
<str name="1474002">
8.481748 = (MATCH) fieldWeight(text:hi in 207626), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=207626)
</str>
<str name="556830">
8.481748 = (MATCH) fieldWeight(text:hi in 794169), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=794169)
</str>
<str name="735197">
8.481748 = (MATCH) fieldWeight(text:hi in 901810), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=901810)
</str>
<str name="2142779">
8.481748 = (MATCH) fieldWeight(text:hi in 1584789), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=1584789)
</str>
<str name="182950">
8.481748 = (MATCH) fieldWeight(text:hi in 1862408), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=1862408)
</str>
<str name="155112">
8.481748 = (MATCH) fieldWeight(text:hi in 1967709), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=1967709)
</str>
<str name="2223440">
8.481748 = (MATCH) fieldWeight(text:hi in 2181479), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=2181479)
</str>
<str name="2236992">
8.481748 = (MATCH) fieldWeight(text:hi in 2199957), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=2199957)
</str>
<str name="2231513">
7.4968767 = (MATCH) fieldWeight(text:hi in 2179538), product of: 1.4142135 = tf(termFreq(text:hi)=2) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 0.625 = fieldNorm(field=text, doc=2179538)
</str>
<str name="17885">
5.9975014 = (MATCH) fieldWeight(text:hi in 2009670), product of: 1.4142135 = tf(termFreq(text:hi)=2) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 0.5 = fieldNorm(field=text, doc=2009670)
</str>
</lst>
<str name="QParser">LuceneQParser</str>
<lst name="timing">
<double name="time">8.0</double>
<lst name="prepare">
<double name="time">1.0</double>
<lst name="org.apache.solr.handler.component.QueryComponent">
<double name="time">1.0</double>
</lst>
<lst name="org.apache.solr.handler.component.FacetComponent">
<double name="time">0.0</double>
</lst>
<lst name="org.apache.solr.handler.component.MoreLikeThisComponent">
<double name="time">0.0</double>
</lst>
<lst name="org.apache.solr.handler.component.HighlightComponent">
<double name="time">0.0</double>
</lst>
<lst name="org.apache.solr.handler.component.StatsComponent">
<double name="time">0.0</double>
</lst>
<lst name="org.apache.solr.handler.component.DebugComponent">
<double name="time">0.0</double>
</lst>
</lst>
<lst name="process">
<double name="time">7.0</double>
<lst name="org.apache.solr.handler.component.QueryComponent">
<double name="time">5.0</double>
</lst>
<lst name="org.apache.solr.handler.component.FacetComponent">
<double name="time">0.0</double>
</lst>
<lst name="org.apache.solr.handler.component.MoreLikeThisComponent">
<double name="time">0.0</double>
</lst>
<lst name="org.apache.solr.handler.component.HighlightComponent">
<double name="time">0.0</double>
</lst>
<lst name="org.apache.solr.handler.component.StatsComponent">
<double name="time">0.0</double>
</lst>
<lst name="org.apache.solr.handler.component.DebugComponent">
<double name="time">2.0</double>
</lst>
</lst>
</lst>
</lst>
   同时 在查询的头部信息中,也可以看到查询语法和参数是否被正确解析

<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">8</int>
<lst name="params">
<str name="explainOther"/>
<str name="fl">*,score</str>
<str name="debugQuery">on</str>
<str name="indent">on</str>
<str name="start">0</str>
<str name="q">hi</str>
<str name="hl.fl"/>
<str name="qt"/>
<str name="wt"/>
<str name="fq"/>
<str name="rows">10</str>
<str name="version">2.2</str>
</lst>
</lst>
   具体命中的文档数可以在respose标签里找到,如下说明找到1328个包含查询词的文档

<result name="response" numFound="1328" start="0" maxScore="8.481748">
   以上这些地方对分析解决查询中出现的问题都很有帮助
  2、查询语法
  solr的一些查询语法 
  1.1. 首先假设我的数据里fields有:name, tel, address 预设的搜寻是name这个字段, 如果要搜寻的数据刚好就是 name 这个字段,就不需要指定搜寻字段名称. 
  1.2. 查询规则: 
  如欲查询特定字段(非预设字段),请在查询词前加上该字段名称加 “:” (不包含”号) 符号, 
  例如: address:北京市海淀区上地软件园 tel:88xxxxx1 
  1>. q代表query input 
  2>. version代表solr版本(建议不要变动此变量) 
  3>. start代表显示结果从哪一笔结果资料开始,预设为0代表第一笔, rows是说要显示几笔数据,预设为10笔 
  (因为有时查询结果可能有几百笔,但不需要显示所有结果,所以预设是从第一笔开始到第十笔) 
  所以若要显示第10到30笔就改为: 
  http: //localhost:8080/solr/select/?indent=on&version=2.2&q=address:北京 市海淀区上地软件园+tel:88xxxxx1&version=2.2&start=10&rows= 20&indent=on 
  (indent代表输出的xml要不要缩行.预设为开启 on) 
  1.3. 另外,要限定输出结果的内容可用 “fl=” 加上你要的字段名称,如以下这个范例: 
  http: //localhost:8080/solr/select/?indent=on&version=2.2&q=text:北京+ OR+text:亿度&start=0&rows=10&fl=name,address,tel 
  在fl=之后加上了name,adress,tel 
  所以结果会如下: 
  3、查询参数
  常用


  • q - 查询字符串,必须的。
  • fl - 指定返回那些字段内容,用逗号或空格分隔多个。
  • start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。
  • rows - 指定返回结果最多有多少条记录,配合start来实现分页。
  • sort - 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例:(inStock desc, price asc)表示先 “inStock” 降序, 再 “price” 升序,默认是相关性降序。
  • wt - (writer type)指定输出格式,可以有 xml, json, php, phps, 后面 solr 1.3增加的,要用通知我们,因为默认没有打开。
  • fq - (filter query)过虑查询,作用:在q查询符合结果中同时是fq查询符合的,例如:q=mm&fq=date_time:[20081001 TO 20091031],找关键字mm,并且date_time是20081001到20091031之间的。官方文档:http://wiki.apache.org/solr/CommonQueryParameters
  不常用


  • q.op - 覆盖schema.xml的defaultOperator(有空格时用"AND"还是用"OR"操作逻辑),一般默认指定
  • df - 默认的查询字段,一般默认指定
  • qt - (query type)指定那个类型来处理查询请求,一般不用指定,默认是standard。
  其它


  • indent - 返回的结果是否缩进,默认关闭,用 indent=true|on 开启,一般调试json,php,phps,ruby输出才有必要用这个参数。
  • version - 查询语法的版本,建议不使用它,由服务器指定默认值。

[Solr的检索运算符]
 “:” 指定字段查指定值,如返回所有值*:*²
 “?”²表示单个任意字符的通配
 “*”
表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)²
 “~”²表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。
²邻近检索,如检索相隔10个单词的”apache”和”jakarta”,”jakarta
apache”~10
 “^”²控制相关度检索,如检索jakarta
apache,同时希望去让”jakarta”的相关度更加好,那么在其后加上”^”符号和增量值,即jakarta^4
apache
 布尔操作符AND、||²
 布尔操作符OR、²&&
 布尔操作符NOT、!、-²(排除操作符不能单独与项使用构成查询)
 “+”
存在操作符,要求符号”+”后的项必须在文档相应的域中存在²
 ( ) 用于构成子查询²
² [] 包含范围检索,如检索某时间段记录,包含头尾,date:[200707 TO
200710]
 {}²不包含范围检索,如检索某时间段记录,不包含头尾
date:{200707
TO 200710}
 " 转义操作符,特殊字符包括+ -² && || ! ( ) { } [ ] ^ ” ~ * ?
: "

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-314605-1-1.html 上篇帖子: Windows下acts_as_solr的rake solr:start起不来的问题解决办法 下篇帖子: Solr:eclipse开发环境
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表