旃麒雅 发表于 2018-11-1 11:42:00

Solr-5.3.0学习笔记(三)Manage Core

  鲁春利的工作笔记,好记性不如烂笔头

  1、Overview
  概要描述了索引库(Core)的统计分析信息(Doc数量、Segment数量、删除的Doc数量等)、实例信息(Instance路径、Data文件位置、Index文件位置等)以及复本信息等。
  2、Analysis
  Analysis窗口用来了解solr如何处理数据(也就是分词),处理时根据schema.xml文件中配置的field、field type以及dynamic rule等参数。

  说明:上述输入“Running is a Sport”应用了多种转换形式,其中is、a这类词汇被称为停用词(stop words)。停用词是指在文本中出现的频率非常高,但是对文本所携带的信息基本不产生影响的词或词语,如英文的a、an、the,或者中文的的、了、是或标点符号等。
  3、Dataimport
  sorry, no dataimport-handler defined!
  在这里主要配置DataImportHandler (DIH)的相关参数,用来实现数据导入及导入监控等操作。
  在Solr中提供了DIH的示例程序,通过bin/solr -e dih来启动。
  4、Documents
  提供了直接通过浏览器将数据上传到Solr索引库的功能,支持JSON、CSV、XML、Document Builder、Solr Command等多种Document Type。
  说明:选中不同的Document Type会有相应的示例说明。



  5、Files
  提供了查看当前选定的索引库(Core)的配置文件的功能,如solrconfig.xml和schema.xml文件。
# 查找schema.xml  
$ find . -name schema.xml
  
./server/solr/configsets/basic_configs/conf/schema.xml
  
./server/solr/configsets/sample_techproducts_configs/conf/schema.xml
  
./example/techproducts/solr/techproducts/conf/schema.xml
  
./example/example-DIH/solr/solr/conf/schema.xml
  
./example/example-DIH/solr/db/conf/schema.xml
  
./example/example-DIH/solr/tika/conf/schema.xml
  
./example/example-DIH/solr/mail/conf/schema.xml
  
./example/example-DIH/solr/rss/conf/schema.xml
  
$
  

  
# 查找solrconfig.xml
  
$ find . -name solrconfig.xml
  
./server/solr/configsets/data_driven_schema_configs/conf/solrconfig.xml
  
./server/solr/configsets/basic_configs/conf/solrconfig.xml
  
./server/solr/configsets/sample_techproducts_configs/conf/solrconfig.xml
  
./server/solr/test_core/conf/solrconfig.xml    # 自定义的索引库test_core
  
./example/techproducts/solr/techproducts/conf/solrconfig.xml
  
./example/techproducts/solr/testcore/conf/solrconfig.xml
  
./example/files/conf/solrconfig.xml
  
example目录下其他位置的略
  说明:
  schema.xml类似于数据表配置文件,定义了加入索引的数据的字段名称(未配置的字段名称将无法加入到索引库中)、是否被索引(indexed)或存储(stroed)等配置。
  solrconfig.xml定义了Solr本身的一些配置,如数据存储目录、索引及查询的行为(/update、/select、/query等映射)等。
  6、Ping
  选中索引库(core name),点击ping则会通过ping命令来验证Solr server是否仍在运行。

  通过Java代码(SolrJ)来实现该功能为:
SolrPing ping = new SolrPing();  
ping.getParams().add("distrib", "true"); //To make it a distributed request against
  
a collection
  
rsp = ping.process(solrClient, collectionName);
  
int status = rsp.getStatus();
  7、Plugins / Stats Screen
  查看Solr状态及性能的基本信息及统计数据,如the performance of Solr's caches, the state of Solr's searchers, and the configuration of searchHandlers and requestHandlers.。

  8、Query
  Request-Handler (qt)      /select
参数描述备注q查询,代表query input  * : *    表示查询全部
  name : lucl   表示查询name=lucl的
  name : luc?   ?表示任意字符
  id=1    用:或=均可
fq过滤条件,和q查询的数据求交集  price :    0 ~ 100
  price : {0 TO 100}   1 ~ 99
sort排序  id asc    表示id升序
  id desc, price asc
start, rows分页起始条目,查询多少个条目数据flfield list,表示返回那些列id, namedf默认的查询字段,默认值text在solrconfig.xml文件中df属性定义了默认字段。wtwrite type,指定输出格式indent结果是否缩进,默认为false  dismax
  edismax
暂略hlhigh light,表示高亮  hl.fl指定需要高亮的字段;
  hl.simple.pre指定高亮字段的前缀;
  hl.simple.post指定高亮字段的后缀;
  如查询的fl为name,前缀为,后缀为那么查询的结果会新增
"highlighting"  的分类 ,但实际的内容是通过id和
"response"  关联的。
facet类似于sql中的group byfacet.query  price:[* TO 20]
  price:
  在Raw Query Parameters中可以查询多个

  >  facet.field
  根据某个字段进行分组统计
  facet.prefix
  表示Facet字段值的前缀.比如”facet.field=cpu&facet.prefix=Intel”,那么对cpu字段进行Facet查询,返回的cpu都是以”Intel”开头的,”AMD”开头的cpu型号将不会被统计在内。
spatialspellcheck  9、Replication
  10、Schema Browser
  11、Segments Info


页: [1]
查看完整版本: Solr-5.3.0学习笔记(三)Manage Core