|
solrconfig.xml包含了用于配置自身行为的绝大部分参数,其作用范围是当前core。该文件位于${solr_home}/solr/core1/conf/下。
参数列表概览:
A、lib
B、dataDir parameter
C、directoryFactory
D、codecFactory
E、indexConfig Section
F、Update Handler Section
G、The Query Section
H、Request Dispatcher
I、Request Handler Plug-in Section
J、UpdateRequestProcessorChain section
K、The Highlighter plugin configuration section
L、The Admin/GUI Section
M、System property substitution
N、Enable/disable components
O、XInclude
P、Includes via Document Entities
一、lib:
1、标签用于加载solr所需要的jar包,从而支持solrconfig.xml 或者 schema.xml中定义的插件(例如:Analyzers,Request Handlers...)
2、所有的路径都是相对路径,相对于当前实例文件夹${solr_home}/solr/core1
3、在定义时需要注意各个jar包之间的依赖,从而按照正确的顺序引入。例如:jar1依赖jar2,那么必须把jar2定义在jar1之前。
4、如果存在"./lib"文件夹,将会默认将其中所有的jar包引入。类似于语法:
5、相当于把中引用的所有jar包加入到了classpath中。
6、当存在regex属性时,进行过滤。
实例代码:
二、dataDir parameter:
solr默认将索引文件存放在${solr_home}/data目录下。而可以设置索引文件存放在任意指定的目录下。
如果配置了replication,那么这里的定义需要与其匹配。
${solr.data.dir:}
三、directoryFactory:
用于定义选择索引存储方案,directoryFactory总共有以下几种选择索引存储方案:
1、solr.StandardDirectoryFactory,这是一个基于文件系统存储目录的工厂,它会试图选择最好的实现基于你当前的操作系统和Java虚拟机版本。
2、solr.SimpleFSDirectoryFactory,适用于小型应用程序,不支持大数据和多线程。
3、solr.NIOFSDirectoryFactory,适用于多线程环境,但是不适用在windows平台(很慢),是因为JVM还存在bug。
4、solr.MMapDirectoryFactory,这个是solr3.1到4.0版本在linux64位系统下默认的实现。它是通过使用虚拟内存和内核特性调用mmap去访问存储在磁盘中的索引文件。它允许lucene或solr直接访问I/O缓存。如果不需要近实时搜索功能,使用此工厂是个不错的方案。
5、solr.NRTCachingDirectoryFactory,此工厂设计目的是存储部分索引在内存中,从而加快了近实时搜索的速度。
6、solr.RAMDirectoryFactory,这是一个内存存储方案,不能持久化存储,在系统重启或服务器crash时数据会丢失。且不支持索引复制。
四、codecFactory:
编解码工厂允许使用自定义的编解码器。例如:如果想启动per-field DocValues格式, 可以在solrconfig.xml里面设置SchemaCodecFactory:
五、indexConfig Section:
该模块用于设置索引的低级别的属性。
1、//限制token最大长度
2、1000//IndexWriter等待解锁的最长时间(毫秒)。
3、8//
4、false//solr默认为false。如果为true,索引文件减少,检索性能降低,追求平衡。
5、100//缓存
6、1000//同上。两个同时定义时命中较低的那个。
7、
10
10
//合并策略。
8、10//合并因子,每次合并多少个segments。
9、//合并调度器。
10、${solr.lock.type:native}//锁工厂。
11、false//是否启动时先解锁。
12、128//Lucene loads terms into memory 间隔
13、true//重新打开,替代先关闭-再打开。
14、//提交删除策略,必须实现org.apache.lucene.index.IndexDeletionPolicy
15、1
16、0
17、30MINUTES OR 1DAY
18、false//相当于把创建索引时的日志输出。
六、Update Handler Section:
该模块用于定义更新处理器。
${solr.ulog.dir:}
15000
false
七、The Query Section:
该模块用于设置查询时的一些处理,涉及到solr的调优,后续分析。
1、1024
2、各种Cache的使用,详情参考博文http://www.iyunv.com/phinecos/archive/2012/05/24/2517018.html
3、true
4、true
5、20
6、200
7、
8、false
9、2
示例代码:
true
20
200
static firstSearcher warming in solrconfig.xml
false
2
8、Request Dispatcher:
请求转发器。
9、Request Handler Plug-in Section:
请求处理器插件模块,可以在这里定义各种请求处理器。
A、第一个示例代码,后续中的参数设置与此相同:
explicit
10
text
10、UpdateRequestProcessorChain section:
此处暂时不做说明,后续补充。
示例代码:
true
id
false
name,features,cat
solr.processor.Lookup3Signature
text,title,subject,description
language_s
en
update-script.js
example config parameter
11、Response Writers:
后续讨论,见名知意。
实例代码:
text/plain; charset=UTF-8
5
12、Query Parsers:
|
|
|