转载--solr的searching过程(1)

奥德赛F9 发表于 2018-11-2 06:27:11

1.拦截请求，解析请求并构建相应的handler。
发送检索请求，例如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on
首先他将被SolrDispatchFilter拦截。
?
doFilter(ServletRequest request, ServletResponse response, FilterChain chain)
通过对request的分析，获知当前request是做什么的（/select），并构造相应的handler（SearchHandler）。

2.SolrCore出面处理上层工作（具体工作交由handler处理）
将handler、SolrQueryRequest、SolrQueryResponse交由solrCore的execute方法处理
?
public void execute(SolrRequestHandler handler, SolrQueryRequest req, SolrQueryResponse rsp)
在该方法中主要还是由handler来完成的。
SolrRequestHandler是一个接口，他主要的方法就是：
?
public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp);
SolrRequestHandler的实现类的结构图如下：
http://pic002.cnblogs.com/images/2012/161247/2012020917051737.jpg
其中RequestHandlerBase为大部分的Handler实现了部分功能，主要包括
?
public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp){
　　......
　　handleRequestBody( req, rsp );
　　......
}
然而具体怎么做就交给具体的子类去执行了！（handleRequestBody( req, rsp );）
例如：这里是做检索，那么就交由SearchHandler处理。
（这里的设计方式有点类似于servlet，GenericSerlet实现了一些公用方法，而具体的则有其子类完成，例如HttpServlet）

3.SearchHandler具体的检索过程
现在的检索没有使用shards，在跟踪代码的过程中，发现以下过程是检索的主要环节。
?
if(!rb.isDebug()) {
   // Process
   for( SearchComponent c : components ) {
         c.process(rb);
   }
   }
从中可知真正的检索需要经过多个SearchComponent，在当前的实验环境下包括6个，如下：
http://pic002.cnblogs.com/images/2012/161247/2012020917162451.jpg

4.各个SearchComponent配合工作完成检索
我们先重点了解QueryComponent。
获得SolrIndexSearcher，这个对象是检索的主要执行者。
同时获取SolrIndexSearcher.QueryCommand、SolrIndexSearcher.QueryResult，并将其作为查询条件和查询结果提交给SolrIndexSearcher进行检索。
?
searcher.search(result,cmd);
在SolrIndexSearcher中search方法如下：
?
public QueryResult search(QueryResult qr, QueryCommand cmd) throws IOException {
getDocListC(qr,cmd);
return qr;
}
getDocListC又是一个比较复杂的方法，在这里加入的cache。
如果当前检索被缓存了（缓存也是个重点内容，后续详细分析！），那么直接返回结果，否则重新进行检索，检索的方法是：
?
private void getDocListNC(QueryResult qr,QueryCommand cmd)
在该方法中，和我们使用lucene进行检索十分相似，采用的具体方法是：
?
super.search(query, luceneFilter, collector);
检索完成将结果进行封装，放入QueryResult当中。
?
qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));
检索完成后，将结果放入缓存中，“造福后人”！
至此QueryComponent的工作就算完成了。
如果做简单查询（如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on）
那么后面5个Component就直接过了（没有真正被执行）。

5.收尾工作
将结果封装好，写入相应的ResponseHeaders，关闭SolrQueryRequest、solrCore。

-----------------------------------------------------
以上是solr-searching最粗略的过程，本着先脉络后细节的思想，以后再对各个重要环节做深入分析。
searching主要执行方法如下：
SolrDispatchFilter（doFilter,execute）
->SolrCore(execute)
->RequestHandlerBase(handleRequest)
->SearchHandler(handleRequestBody) //有可能执行多个Component
->QueryComponent(process)
->SolrIndexSearcher(search,getDocListC)
　　

页: [1]

运维网's Archiver

转载--solr的searching过程(1)