奥德赛F9 发表于 2018-11-2 06:27:11

转载--solr的searching过程(1)



1.拦截请求,解析请求并构建相应的handler。
发送检索请求,例如:http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on
首先他将被SolrDispatchFilter拦截。
?
doFilter(ServletRequest request, ServletResponse   response, FilterChain chain)
通过对request的分析,获知当前request是做什么的(/select),并构造相应的handler(SearchHandler)。

2.SolrCore出面处理上层工作(具体工作交由handler处理)
将handler、SolrQueryRequest、SolrQueryResponse交由solrCore的execute方法处理
?
public void execute(SolrRequestHandler   handler, SolrQueryRequest req, SolrQueryResponse rsp)
在该方法中主要还是由handler来完成的。
SolrRequestHandler是一个接口,他主要的方法就是:
?
public void handleRequest(SolrQueryRequest   req, SolrQueryResponse rsp);
SolrRequestHandler的实现类的结构图如下:
http://pic002.cnblogs.com/images/2012/161247/2012020917051737.jpg
其中RequestHandlerBase为大部分的Handler实现了部分功能,主要包括
?
public void handleRequest(SolrQueryRequest   req, SolrQueryResponse rsp){
  ......
  handleRequestBody( req, rsp );
  ......
}
然而具体怎么做就交给具体的子类去执行了!(handleRequestBody( req, rsp );)
例如:这里是做检索,那么就交由SearchHandler处理。
(这里的设计方式有点类似于servlet,GenericSerlet实现了一些公用方法,而具体的则有其子类完成,例如HttpServlet)

3.SearchHandler具体的检索过程
现在的检索没有使用shards,在跟踪代码的过程中,发现以下过程是检索的主要环节。
?
if(!rb.isDebug()) {
      //   Process
      for(   SearchComponent c : components ) {
            c.process(rb);
      }
      }
从中可知真正的检索需要经过多个SearchComponent,在当前的实验环境下包括6个,如下:
http://pic002.cnblogs.com/images/2012/161247/2012020917162451.jpg

4.各个SearchComponent配合工作完成检索
我们先重点了解QueryComponent。
获得SolrIndexSearcher,这个对象是检索的主要执行者。
同时获取SolrIndexSearcher.QueryCommand、SolrIndexSearcher.QueryResult,并将其作为查询条件和查询结果提交给SolrIndexSearcher进行检索。
?
searcher.search(result,cmd);
在SolrIndexSearcher中search方法如下:
?
public QueryResult search(QueryResult qr,   QueryCommand cmd) throws IOException {
    getDocListC(qr,cmd);
    return qr;
}
getDocListC又是一个比较复杂的方法,在这里加入的cache。
如果当前检索被缓存了(缓存也是个重点内容,后续详细分析!),那么直接返回结果,否则重新进行检索,检索的方法是:
?
private void getDocListNC(QueryResult   qr,QueryCommand cmd)
在该方法中,和我们使用lucene进行检索十分相似,采用的具体方法是:
?
super.search(query, luceneFilter, collector);
检索完成将结果进行封装,放入QueryResult当中。
?
qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));
检索完成后,将结果放入缓存中,“造福后人”!
至此QueryComponent的工作就算完成了。
如果做简单查询(如:http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on)
那么后面5个Component就直接过了(没有真正被执行)。

5.收尾工作
将结果封装好,写入相应的ResponseHeaders,关闭SolrQueryRequest、solrCore。

-----------------------------------------------------
以上是solr-searching最粗略的过程,本着先脉络后细节的思想,以后再对各个重要环节做深入分析。
searching主要执行方法如下:
SolrDispatchFilter(doFilter,execute)
->SolrCore(execute)
->RequestHandlerBase(handleRequest)
->SearchHandler(handleRequestBody) //有可能执行多个Component
->QueryComponent(process)
->SolrIndexSearcher(search,getDocListC)
  

页: [1]
查看完整版本: 转载--solr的searching过程(1)