设为首页 收藏本站
查看: 780|回复: 0

[经验分享] Paoding 在 Solr 1.4 中使用

[复制链接]

尚未签到

发表于 2015-7-17 10:24:21 | 显示全部楼层 |阅读模式
  Solr 1.4 中的 TokenizerFactory 有变化。以至旧的 solr 分词扩展不能用。它的 create 方法要求返回 Tokenizer,而 PaodingTokenizer 不是继承 Tokenizer 的。所以不太方便。因此写个包装。
  新写一个 SolrPaodingTokenizer 继承 Tokenizer,而 PaodingTokenizer 是其属性。如:


  • package com.chenlb.solr.paoding;  

  • import java.io.IOException;  
  • import java.io.Reader;  

  • import net.paoding.analysis.analyzer.PaodingTokenizer;  
  • import net.paoding.analysis.analyzer.TokenCollector;  
  • import net.paoding.analysis.knife.Knife;  

  • import org.apache.lucene.analysis.Token;  
  • import org.apache.lucene.analysis.Tokenizer;  

  • /**
  • * Solr 1.4 中使用对 PaodingTkenizer 的包装。
  • *
  • * @author chenlb 2009-12-18 下午 04:46:06
  • */  
  • public class SolrPaodingTokenizer extends Tokenizer {  

  •     private PaodingTokenizer paodingTokenizer;  

  •     private Knife knife;  
  •     private TokenCollector tokenCollector;  

  •     public SolrPaodingTokenizer(Reader input, Knife knife, TokenCollector tokenCollector) {  
  •         paodingTokenizer = new PaodingTokenizer(input, knife, tokenCollector);  
  •         this.input = input;  
  •         this.knife = knife;  
  •         this.tokenCollector = tokenCollector;  
  •     }

  •     public Token next throws IOException {  
  •         return paodingTokenizer.next;  
  •     }

  •     public void close throws IOException {  
  •         paodingTokenizer.close;
  •     }

  •     public void reset(Reader input) throws IOException {  
  •         paodingTokenizer = new PaodingTokenizer(input, knife, tokenCollector);  
  •         this.input = input;  
  •     }
  • }
package com.chenlb.solr.paoding;  import java.io.IOException; import java.io.Reader;  import net.paoding.analysis.analyzer.PaodingTokenizer; import net.paoding.analysis.analyzer.TokenCollector; import net.paoding.analysis.knife.Knife;  import org.apache.lucene.analysis.Token; import org.apache.lucene.analysis.Tokenizer;  /**  * Solr 1.4 中使用对 PaodingTkenizer 的包装。  *  * @author chenlb 2009-12-18 下午04:46:06  */ public class SolrPaodingTokenizer extends Tokenizer {  private PaodingTokenizer paodingTokenizer;  private Knife knife; private TokenCollector tokenCollector;  public SolrPaodingTokenizer(Reader input, Knife knife, TokenCollector tokenCollector) { paodingTokenizer = new PaodingTokenizer(input, knife, tokenCollector); this.input = input; this.knife = knife; this.tokenCollector = tokenCollector; }  public Token next throws IOException { return paodingTokenizer.next; }  public void close throws IOException { paodingTokenizer.close; }  public void reset(Reader input) throws IOException { paodingTokenizer = new PaodingTokenizer(input, knife, tokenCollector); this.input = input; } }   然后再写个 PaodingTokenizerFactory,我这就不写了,下载:solr-1.4-paoding.zip
  包装 paoding  2.0.4-beta,以至可以在 solr 1.4 中使用。
  使用:
  把 apache-solr-1.4.0-paoding.war 替换 apache-solr-1.4.0.war,里面打包了  paoding-2.0.4-beta、词库、还在包装的 solr-1.4-paoding.jar
  源码在 solr-1.4-paoding-src 中,solr-1.4-paoding.jar 是在 solr 1.3  下编译的。测试过,可以在 solr 1.4 中使用。
  solr/conf 包括有 schema.xml 配置:


  •   
  •       
  •          
  •          
  •       
  •   
        如果只用 PaodingAnalyzer 不用包装也行的。如:


  •   
  •    
  •   
       

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-87572-1-1.html 上篇帖子: 关于solr schema.xml 和solrconfig.xml的解释 下篇帖子: 编译Ansj之Solr插件
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表