运维网's Archiver
论坛
›
solr
› Lucene简单介绍
半只蚂蚁
发表于 2017-12-20 12:46:44
Lucene简单介绍
是一个开源的java实现的web 爬虫; 主要用于收集网页数据然后进行分析,建立索引等,底层使用Hadoop进行分布式计算与存储,索引使用Solr分布式索引框架;
依赖Hadoop的数据结构,适合批处理;
可以和Solr结合使用,用Solr分析检索Nutch爬过的页面;
页:
[1]
查看完整版本:
Lucene简单介绍