缘来路过 发表于 2016-12-15 08:49:23

Solr 分布式部署

SOLR复制模式,是一种在分布式环境下用于同步主从服务器的一种实现方式,因之前提到的基于rsync的SOLR不同方式部署成本过高,被SOLR1.4版本所替换,取而代之的就是基于HTTP协议的索引文件传输机制,该方式部署简单,只需配置一个文件即可。以下讲解具体操作步骤:


步骤分主服务器和从服务器,允许有多个从服务器,即从服务器的配置一样。

主服务器:

在solrConfig.xml中,找到以下行:
<requestHandlername="/replication"class="solr.ReplicationHandler">

[*]<lstname="master">
[*]<strname="replicateAfter">commit</str>
[*]
[*]<strname="confFiles">schema.xml,stopwords.txt,elevate.xml</str>
[*]
[*]<strname="commitReserveDuration">00:05:00</str>
[*]<strname="httpBasicAuthUser">123</str>
[*]<strname="httpBasicAuthPassword">123</str>
[*]
[*]
[*]</lst>
[*]</requestHandler>


说明:

[*]replicateAfter : SOLR会自行在以下操作行为发生后执行复制: 'commit', 'startup' 'optimize',这里我们选择commit ,即SOLR每一次接受到commit请求后,会执行复制策略。
[*]confFiles : 待分发的配置文件,solr 也会将主服务器上的字段配置文件:schema.xml和stopwords.txt,固排文件: elevate.xml同步到辅服务器上。
[*]commitReserveDuration: 每次commit之后,保留增量索引的周期时间,这里设置为5分钟。
从服务器
<requestHandlername="/replication"class="solr.ReplicationHandler">

[*]<lstname="slave">
[*]
[*]<strname="masterUrl">http://localhost:port/solr/corename/replication</str>
[*]
[*]<strname="pollInterval">00:05:00</str>
[*]
[*]<strname="compression">internal</str>
[*]
[*]<strname="httpConnTimeout">5000</str>
[*]<strname="httpReadTimeout">10000</str>
[*]
[*]
[*]<strname="httpBasicAuthUser">123</str>
[*]<strname="httpBasicAuthPassword">123</str>
[*]
[*]</lst>
[*]</requestHandler>


说明:

[*]masterUrl : 主服务器同步URL地址
[*]pollInterval:从服务器同步间隔,即每隔多长时间同步一次主服务器
[*]httpConnTimeout:设置连接超时(单位:毫秒)
[*]httpReadTimeout:如果设置同步索引文件过大,则应适当提高此值。(单位:毫秒)
[*]httpBasicAuthUser:验证用户名,需要和主服务器一致
[*]httpBasicAuthPassword:验证密码,需和主服务器一致
[*]compression:external or internal 使用SOLR自己的压缩算法或应用容器的
区别:内部算法会大大提高同步成本,原话: USE THIS ONLY IF YOUR BANDWIDTH IS LOW . THIS CAN ACTUALLY SLOWDOWN REPLICATION IN A LAN。
因此建议使用外部方式即: external .
同时需要配置外部应用容器: 以TOMCAT为例:


[*]<Connectorcompression="on"
[*]compressableMimeType="text/html,text/xml,text/plain"
[*]compressionMinSize="2048"/>
页: [1]
查看完整版本: Solr 分布式部署