yunvn1 发表于 2015-7-17 10:49:47

利用SOLR搭建企业搜索平台 之七(solr使用问题集)

某日,突发奇想,想写这么一个博客,希望记录下所有在solr中使用的毛病。而且我希望广大的看友们也能一起来说说你们平时遇到的各种错误,这样大家才能一起更好的进步!
话不多说,进入正题
1》solr 做索引时报 Lock obtain timed out: SingleInstanceLock: write.lock
有个频繁做索引的应用,它同时也对外提供搜索服务。大部分是 solr 1.3 的默认配置。solr 做索引,有时候报:



Xml代码 http://lianj-lee.javaeye.com/javascripts/syntaxhighlighter/clipboard_new.swf?clipboard=2009-7-13%209%3A48%3A06%20org.apache.solr.common.SolrException%20log%0A%E4%B8%A5%E9%87%8D%3A%20org.apache.lucene.store.LockObtainFailedException%3A%20Lock%20obtain%20timed%20out%3A%20SingleInstanceLock%3A%20write.lock%0A%20%20%20%20%20%20%20%20at%20org.apache.lucene.store.Lock.obtain(Lock.java%3A85)%0A%20%20%20%20%20%20%20%20at%20org.apache.lucene.index.IndexWriter.init(IndexWriter.java%3A1140)%0A%20%20%20%20%20%20%20%20at%20org.apache.lucene.index.IndexWriter.%3Cinit%3E(IndexWriter.java%3A938)%0A%20%20%20%20%20%20%20%20at%20org.apache.solr.update.SolrIndexWriter.%3Cinit%3E(SolrIndexWriter.java%3A116)%0A...
[*]2009-7-13 9:48:06 org.apache.solr.common.SolrException log
[*]严重: org.apache.lucene.store.LockObtainFailedException: Lock obtain timed out: SingleInstanceLock: write.lock
[*]      at org.apache.lucene.store.Lock.obtain(Lock.java:85)
[*]      at org.apache.lucene.index.IndexWriter.init(IndexWriter.java:1140)
[*]      at org.apache.lucene.index.IndexWriter.(IndexWriter.java:938)
[*]      at org.apache.solr.update.SolrIndexWriter.(SolrIndexWriter.java:116)
[*]...
2009-7-13 9:48:06 org.apache.solr.common.SolrException log 严重: org.apache.lucene.store.LockObtainFailedException: Lock obtain timed out: SingleInstanceLock: write.lock         at org.apache.lucene.store.Lock.obtain(Lock.java:85)         at org.apache.lucene.index.IndexWriter.init(IndexWriter.java:1140)         at org.apache.lucene.index.IndexWriter.(IndexWriter.java:938)         at org.apache.solr.update.SolrIndexWriter.(SolrIndexWriter.java:116) ...
是写锁取不到。但重启 solr 又可以正常做,主要是运行时间长了就报这个错了。还是看下配置吧。
看到 solr 1.3 默认的配置是:



Xml代码 http://lianj-lee.javaeye.com/javascripts/syntaxhighlighter/clipboard_new.swf?clipboard=%3CindexDefaults%3E%20%20%0A%20%20%20%20%3C!--%20...%20--%3E%20%20%0A%20%20%20%20%3C!--%20%20%0A%20%20%20%20%20%20This%20option%20specifies%20which%20Lucene%20LockFactory%20implementation%20to%20use.%20%20%0A%20%20%0A%20%20%20%20%20%20single%20%3D%20SingleInstanceLockFactory%20-%20suggested%20for%20a%20read-only%20index%20%20%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20or%20when%20there%20is%20no%20possibility%20of%20another%20process%20trying%20%20%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20to%20modify%20the%20index.%20%20%0A%20%20%20%20%20%20native%20%3D%20NativeFSLockFactory%20%20%0A%20%20%20%20%20%20simple%20%3D%20SimpleFSLockFactory%20%20%0A%20%20%0A%20%20%20%20%20%20(For%20backwards%20compatibility%20with%20Solr%201.2%2C%20
[*]   
[*]      
[*]      
[*]    single   
[*]   
                     single      
默认锁是 single ,只读的。solr 1.2 是 simple,把它改回去了,运行了几天,没事。
2》lucene & solr optimize 索引后结果与平台有点关系
昨日做索引的程序重构下,测试 optimize 索引(在原有数据基础上提交索引)时,在开发的机器(windows)里总是会有两段索引,要再 optimize 才只是一个索引段,当然不是设置 maxSegments=2。反复运行还是如此,为了说明是否写的程序有问题,就用 solr 自带的 post.sh (或 post.jar)提交 optimize。结果还是有两段,再提交一次optimize 才是一个段。这问题……
旧的程序运行得很正常,看了下它也没有提交两次优化。然后把新的程序也放到服务器(linux)上运行,结果是只有一个段。
恩,可以认为是与文件系统有关,optimize 的时候是先新生成一段,然后再删除旧的索引,windows 可能是这样在运行期间与文件关联着删除不了旧的。linux 可能是不用(不打开)文件就可以删除。现只能这样简单解释。
3》换 solr 里的 lucene 包
solr 1.3 发布的时候,lucene 2.4还没有正式发布,其的 lucene 是开发版,现在lucene 2.4早已发布,那就换上新的 lucene 吧。
下载 solr 1.3 http://labs.xiaonei.com/apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.zip 和 lucene 2.4 http://labs.xiaonei.com/apache-mirror/lucene/java/lucene-2.4.0.zip 到目录如e:/search/,
把 e:/search/apache-solr-1.3/lib 目录下的 lucene 相关的*.jar删除:
lucene-analyzers-2.4-dev.jar
lucene-core-2.4-dev.jar
lucene-highlighter-2.4-dev.jar
lucene-memory-2.4-dev.jar
lucene-queries-2.4-dev.jar
lucene-snowball-2.4-dev.jar
lucene-spellchecker-2.4-dev.jar
从 e:/search/lucene-2.4/(或contrib/)目录下找到对应的放到solr-1.3/lib下
然后构建 solr,到e:/search/apache-solr-1.3目录,ant dist-war
4》solr q查询容错性
当solr接收没q参数(或q参数值为空)请求时,会报错。报错十分讨厌,对开发调试时才比较有用,但实际运行环境报错就不太好了,java异常可能有点性能消耗,那干脆就返回正常的结果好了(只是结果里没有找到的数据)。
solr 1.3 可以写个组件去做。判断到空的时候,加一个q参数,其值为在索引里没有的数据。这样就可以返回没有数据的结果。
其实这样实现还是比较麻烦。可以在 solrconfig.xml的requestHandler里加一个默认参数。如q=abcdefghijk。配置如下:



Xml代码 http://lianj-lee.javaeye.com/javascripts/syntaxhighlighter/clipboard_new.swf?clipboard=%3CrequestHandler%20name%3D%22standard%22%20class%3D%22solr.SearchHandler%22%20default%3D%22true%22%3E%20%20%0A%20%20%20%3Clst%20name%3D%22defaults%22%3E%20%20%0A%20%20%20%20%20%3Cstr%20name%3D%22q%22%3Eabcdefghijk%3C%2Fstr%3E%20%20%0A%20%20%20%3C%2Flst%3E%20%20%0A%3C%2FrequestHandler%3E%20
[*]   
[*]      
[*]   abcdefghijk   
[*]      
[*]   
            abcdefghijk            
这样的话查询容错性比较好,查询请求没有带q参数也可,q参数值为空也可。tomcat不会报错,还可以返回结果。
页: [1]
查看完整版本: 利用SOLR搭建企业搜索平台 之七(solr使用问题集)