solr schema.xml配置

61581229 发表于 2017-12-18 21:41:40

solr使用_version_来做文档的版本控制和修改时加锁（乐观锁）
　　<field name="_version_" type="long" indexed="true" stored="true"/>
　　indexed是否索引只能在索引的列上进行查询
　　stored是否存储只能返回存储的列
　　required 是否必须
　　multiValued 是否多值
　　<field name="id" type="string" indexed="true" stored="true" required="true"multiValued="false" />
　　dynamicField 动态字段
　　<dynamicField name="*_i"type="int" indexed="true"stored="true"/>
　　uniqueKey主键列
　　<uniqueKey>id</uniqueKey>
　　copyField
　　<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>
　　<copyField source="cat" dest="text"/>
　　各种fieldtype ：
　　sortMissingLast：排序的时候空值排在后面
　　<fieldType name="string" sortMissingLast="true" />
　　<fieldType name="boolean" sortMissingLast="true"/>
　　<fieldType name="int" precisionStep="0" positionIncrementGap="0"/>
　　<fieldType name="float" precisionStep="0" positionIncrementGap="0"/>
　　<fieldType name="long" precisionStep="0" positionIncrementGap="0"/>
　　<fieldType name="double" precisionStep="0" positionIncrementGap="0"/>
　　
　　<fieldType name="text_general" positionIncrementGap="100">
　　<analyzertype="index">
　　<tokenizer/>
　　<filter ignoreCase="true" words="stopwords.txt" />
　　</analyzer>
　　<analyzer type="query">
　　<tokenizer/>
　　<filter ignoreCase="true" words="stopwords.txt" />
　　<filter synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
　　<filter/>
　　</analyzer>
　　</fieldType>
　　注意：
　　stopwords.txt的格式是，每行一个停用词。
　　synonyms.txt的格式是，在同一行输入多个同义词，逗号分隔。
　　tokenizer用来分词，filter（可选）可以后续处理分词的结果。
　　filter的作用：

[*]词元转换：如LowerCaseFilterFactory大小写转换。
[*]次元注入：如SynonymFilterFactory加入同义词。
[*]词元移除：如停用词过滤器StopFilterFactory。删除不必要的次元，如个，在等。

页: [1]

运维网's Archiver

solr schema.xml配置