设为首页 收藏本站
查看: 1286|回复: 0

[经验分享] solr配置

[复制链接]

尚未签到

发表于 2016-12-14 08:45:22 | 显示全部楼层 |阅读模式
solr配置通过两个文件,一个是solrconfig.xml,主要定义solr的处理程序(handler)和一些扩展程序;另一个是schema.xml,主要定义索引的字段和字段类型,下面分别说明两个文件的基本配置。

 

1. solrconfig

其中的配置很多,其实很多都可以保持默认,我只说几个可能会修改到的参数

1.1 dataDir

 

默认在solr/data 文件夹下建立索引 ,在solrconfig中也可修改为你指定的位置,如

 

 

Xml代码   DSC0000.png


  • <dataDir>/var/data/solr</dataDir>  

1.2 autoCommit

自动提交是指solr在建索引的时候收到请求并没用立即写入文件,而是先放到缓存中,等收到commit命令时才将缓存中得数据写入索引文件。

自动提交默认关闭,建议打开,这样建索引时省得去考虑何时发送commit命令的麻烦

 

Xml代码  


  • <autoCommit>  
  •       <maxDocs>10000</maxDocs> <!-- 触发自动提交的文档数-->  
  •       <maxTime>86000</maxTime> <!-- 发送一个文档后触发自动提交的最长等待时间 (单位 毫秒)  -->  
  •  </autoCommit>  

 1.3 highlight

solr对高亮的默认是<em></em> ,这样其实不是很明显,高亮最好显示成突出的颜色,于是可以改成如下的红色字体显示

 

 

Xml代码  


  • <highlighting>  
  •         。。。  
  •  <formatter name="html" class="org.apache.solr.highlight.HtmlFormatter" default="true">  
  •   <lst name="defaults">  
  •    <str name="hl.simple.pre"><![CDATA[<font coler=red>]]></str>  
  •    <str name="hl.simple.post"><![CDATA[</font>]]></str>  
  •   </lst>  
  •  </formatter>  
  • </highlighting>  

 
 

2.schema

 

2.1 字段类型 fieldType

 

Xml代码  


  • <fieldType name="pint" class="solr.IntField" omitNorms="true"/>  
  • <fieldType name="plong" class="solr.LongField" omitNorms="true"/>  
  • <fieldType name="pfloat" class="solr.FloatField" omitNorms="true"/>  
  • <fieldType name="pdouble" class="solr.DoubleField" omitNorms="true"/>  
  • <fieldType name="pdate" class="solr.DateField" sortMissingLast="true" omitNorms="true"/>  

 
 

添加处理中文字段类型的方法,当然还需要先把相应的jar包放到lib中,具体参考前一篇博文

 

 

Xml代码  


  • <fieldType name="text" class="solr.TextField">  
  •     <analyzer class="org.apahce.lucene.analysis.cn.smart.SmartChineseAnalyzer"/>  
  • </fieldType>  

 

 

2.2 字段 Field

 

2.2.1 字段 Field

 

定义需要的字段名和它的类型,如:

 

Xml代码  


  • <field name="id" type="string" indexed="true" stored="true" required="true" />   

Xml代码  


  • <field name="text" type="text" indexed="true" stored="true"  termVectors="true"  multiValued="false"/>  

Xml代码  


  • <field name="name" type="text_general" indexed="true" stored="true"/>  
  • <field name="alphaNameSort" type="alphaOnlySort" indexed="true" stored="false"/>  
  • <field name="manu" type="text_general" indexed="true" stored="true" omitNorms="true"/>  
  • <field name="cat" type="string" indexed="true" stored="true" multiValued="true"/>  
  • <field name="features" type="text_general" indexed="true" stored="true" multiValued="true"/>  
  • <field name="includes" type="text_general" indexed="true" stored="true" termVectors="true" termPositions="true" termOffsets="true" />  

 
 

参数

 

1 name 字段名

2 type  字段类型 由上面的字段类型给出定义

3 indexed  是否进行索引

4 stored 是否进行保存,如不保存,可以进行搜索,但不能显示该字段的内容

5 required 是否是必须字段,如若是,该字段必须有值,否则索引报错

6 multiValued 是否允许多值

下面三个参数用个图片说明下

7 termVectors 

8 termPosition

9 termOffset

 

如对Canon Power-Shot SD500 进行分词,得到如下的结果和positon,offset等参数,


DSC0001.jpg

 

2.2.2 动态字段 dynamic fields

 

动态字段表示,如果字段的定义没有在配置中找到,就在动态字段类型中进行查找,比如  sid_i ,就可以在动态字段类型中进行匹配,表示该字段是整形

 

Xml代码  


  •  <dynamicField name="*_i"  type="int"    indexed="true"  stored="true"/>  
  • <dynamicField name="*_s"  type="string"  indexed="true"  stored="true"/>  
  • <dynamicField name="*_l"  type="long"   indexed="true"  stored="true"/>  
  • <dynamicField name="*_t"  type="text"    indexed="true"  stored="true"/>  
  • <dynamicField name="*_txt" type="text_general"    indexed="true"  stored="true" multiValued="true"/>  
  • <dynamicField name="*_en"  type="text_en"    indexed="true"  stored="true" multiValued="true" />  
  • <dynamicField name="*_b"  type="boolean" indexed="true"  stored="true"/>  
  • <dynamicField name="*_f"  type="float"  indexed="true"  stored="true"/>  
  •  <dynamicField name="*_d"  type="double" indexed="true"  stored="true"/>  

 

 

 

2.2.3 复制字段 copy fields

 

复制源字段到目标字段,maxchars 限制复制的最大长度

Xml代码  


  • <copyField source="body" dest="teaser" maxChars="300"/>  

 

  这样进行复制,就可以 把所有字段放在一起,这样搜索的时候就可以不用很复杂的查询组合就可以在所有字段中搜索

 

Xml代码  


  • <copyField source="*" dest="text_t"/>  

 

2.3 其它参数

 

 

Xml代码  


  • <uniqueKey>id</uniqueKey>  

文档的唯一标识, 必须填写这个field(除非该field被标记required="false"),否则solr建立索引报错。这相当于数据库中得主键,如建索引时遇到重复的,则会覆盖掉以前的记录

 

Xml代码  


  • <defaultSearchField>text</defaultSearchField>  

 如果搜索参数中没有指定具体的field,那么这是默认的域。

 

 

Xml代码  


  • <solrQueryParser defaultOperator="OR" />  

配置搜索参数短语间的逻辑,可以是"AND|OR"。 

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-313991-1-1.html 上篇帖子: Solr : realtime recommender 下篇帖子: solr学习相关链接
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表