半只蚂蚁 发表于 2017-12-20 12:46:44

Lucene简单介绍

是一个开源的java实现的web 爬虫;  主要用于收集网页数据然后进行分析,建立索引等,底层使用Hadoop进行分布式计算与存储,索引使用Solr分布式索引框架;
  依赖Hadoop的数据结构,适合批处理;
  可以和Solr结合使用,用Solr分析检索Nutch爬过的页面;
页: [1]
查看完整版本: Lucene简单介绍