分布式Solr 配置
大家应该知道Java Search中比较流行的搜索框架有很多,比较热门之一就是Solr(现在的版本4.0-ALPHA).依赖于应用程序的架构和目前规模需要,我们来探索一下部署的两种解决方案。方案的不同仅仅在于它们的物理部署,便于从一种方案过渡到另一种方案而不会给人带来头疼。你知道的,分布式平台通常绕开了IO级别的瓶颈,早期的IO流太慢。随之我们索引数据量的增长,我们可能会迁移数据片段到不同的服务器中,从而能从更好IO吞吐中受益。然而,记住,这将提高各各多核服务器CUP使用率。我们还可以考虑的地方仍然保持在1-2个搜索服务器,既然IO成为了一个问题,那就安装新的驱动去负责加载的事.
方案一, 多索引。具体细节,如下图所示。
http://blog.shutupandcode.net/wp-content/uploads/2010/05/figure1.png
[*]好处
1. 维护方便
2. 允许转变为多服务器解决方案上来
3. 允许在多核(Solr cores)上有更高的运行时间
[*]潜在的缺陷
1. 起初规模就变小了
[*]解决策略
1. 考虑第二种解决方案,解决规模的问题
2. 在多主机上进行重叠索引
方案二, 分布式多核,
http://blog.shutupandcode.net/wp-content/uploads/2010/05/figure2.png
[*]好处
[*]大规模的水平尺度扩展,提升整体性能
[*]潜在缺陷
[*]提高的规模会提高管理成本,以及必要的测试工作量来保证整个架构运行良好
[*]需要额外的性能优化
页:
[1]