|
Solr似乎是目前开源界比较流行的全文索引工具了。
译自Solr官网。
http://lucene.apache.org/solr/index.html
Solr的主要特点:包含强大的全文索引,搜索关键词高亮,接近实时的索引,数据库集群整合,丰富的文档支持。Solr是高可用的,伸缩性强的,容错性高的,并且提供分布式索引的功能。
Solr为客户端提供近REST风格的API,支持XML, JSON, CSV or binary数据格式
基于Lucene
Solr包含了一些属性:
Schema,
定义了documents的字段信息
动态字段支持一些新加入的字段
可以允许多种索引方式索引一个字段,也可以把多个字段打包索引
显式的定义了类型,避免字段类型的歧义
外部文件定义的stopword list
额外的文字分析组件,如分词组件
Query
提供HTTP接口和可配置的返回类型(XML/XSLT, JSON, Python, Ruby, PHP, Velocity, CSV, binary)
可以根据多个字段来排序,也可以根据复杂计算之后的字段来排序
结果关键词高亮,相关性高
SolrCloud
云部署形式基于ZooKeeper
自动的创建分布式索引和分片
接近实时的索引,可以实时推送replication也可以懒拉取
事务日志保证了数据安全
自动的故障恢复 |
|
|