设为首页 收藏本站
查看: 948|回复: 0

[经验分享] Apache Solr 4.0 初试体验及LucidWorks介绍

[复制链接]

尚未签到

发表于 2015-7-17 08:39:07 | 显示全部楼层 |阅读模式
  Apache Solr 4.0 发布一段时间了,最新的solr修改动作还是很大的,尤其从后台管理界面来看,体验和管理更加方便了。默认使用了multi-core模式,以及支持了对多个collection的管理、监控、优化。从内核来看,Solr 4也带来了很多新东西,如Solr Cloud、Realtime GET、NRT(Near-Real-Time Search)、Master/Slave扩展与ZooKeeper集成、Join查询等。

安装SOLR 4
  1. 下载Solr4 http://lucene.apache.org/solr/
  2. 解压缩,进入example文件夹下面
  3. 启动Solr





java -jar start.jar
  启动没有报错的话solr 已经安装完成可以使用了。打开浏览器,键入网址 http://localhost:8983/solr/ ,可以看到如下的solr界面:
DSC0000.png
  新的solr管理admin管理界面主要有 Dashboard、日志、solr集合管理、线程管理以及系统信息,然后每一个collection会有单独的查询、检索等管理界面。
  进入collection1(默认的一个collection),可以看到如下管理collection的菜单:
DSC0001.png
  SOLR以前的界面是非AJAX形式的,并且多个collection没有一个统一的UI接口,大家可以参考以前的SOLR系列中的截图,看看SOLR 4.0之前的样子。


  • Drupal集成ApacheSolr-3.x以及中文分词处理
  • Apache Solr 快速启动包以及中文分词集成
  SOLR 4 APIs
虽然Solr4的后台管理变化比较大,但API的url变化却不是很大,我们列举出来solr
4的API的url,以供大家参考。





/admin/file
/admin/logging
/admin/luke
/admin/mbeans
/admin/ping
/admin/plugins
/admin/properties
/admin/system
/admin/threads
/analysis/document
/analysis/field
/browse
/debug/dump
/elevate
/get
/query
/replication
/select
/spell
/terms
/tvrh
/update
/update/csv
/update/extract
/update/json
  目前solr 4和drupal的集成还没有现成可用的模块,不过由于交互URL没有太多变化,相信对现有的API做一些修改就可以直接让drupal与solr4集成。
  LucidWorks
  最后我们介绍一下LucidWorks。LucidWorks是一款企业级的Solr的应用,包括SOLR的集成、各种数据的索引(文件、FTP、数据库、WEB-HTTP、Hadoop、亚马逊云等)、索引的管理、服务器的监控等等。之前叫LucidImagination,重命名后叫LucidWorks。
  以下两张截图可以看看LucidWorks的大概工作流程。
  LucidWorks Dashboard
DSC0002.png
  
  LucidWorks索引数据源管理
DSC0003.png
  
  一个小细节:以前笔者在测试LucidImagination (LucidWorksd前身)的时候,发现使用的SOLR4以及新版本的admin UI,但是刚刚在测试最新版本的时候,发现用的是旧版本的Admin UI,beta版本的solr4,这点比较奇怪。
  LucidWorks Big Data
  LucidWorks Big Data 是一个集成的搜索服务,提供大数据海量数据的管理、检索、查询服务,主要涵盖以下组件:

Product Brief Description Version
LucidWorksProvides search and discovery capabilities, plus connectors to common data sources2.1 plus plugins – Solr 4.0-SNAPSHOT
Apache HadoopProvides Distributed storage and general purpose distributed computation1.0.2
Apache MahoutScalable Machine Learning0.6
Apache HBaseProvides distributed storage for fast lookups based on Hadoop. Used to store metrics, user info and history, time series data0.92
Apache ZooKeeperProvides distributed synchronization, configuration, etc.3.4.3
Apache PigProvides high-level language for manipulating large data sets for analytics and ETL0.9.2
Apache KafkaProvides distributed pub-sub mechanism for real time distributed data sharing and for aggregating logs into HDFS0.7.0 (incubating)
Apache OozieDistributed Workflow coordination3.2.0-SNAPSHOT for compatibility with Hadoop 1.0.2
RestletREST API capabilities2.1-rc3
BehemothHadoop based document processing workflowTrunk
  LucidWorks Product Suite
DSC0004.png
  
  参考站点


  • http://www.lucidworks.com
  • http://lucene.apache.org/solr/
  
  转自:http://www.drupal001.com/2012/10/solr-4-0-lucidworks/

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-87450-1-1.html 上篇帖子: 转:Solr 基于java的复制(Master-Slave配置) 下篇帖子: 在Solr中配置中文分词IKAnalyzer
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表