有关Solr中SolrIndexSearcher的search和getDocSet的差别 -

yuaqian2003

浏览: 13294 次
性别:
来自: 上海

最近访客更多访客>>

Dennisit

fengyong7723131

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

有关Solr中SolrIndexSearcher的search和getDocSet的差别

博客分类：

搜索

query docset solrindexsearcher search

最近项目中碰到问题，发现在调用SolrIndexSearcher的
public TopFieldDocs search(Query query, Filter filter, int n,
                             Sort sort) throws IOException;
和public DocSet getDocSet(Query query) throws IOException；
效果差别比较大；
   查阅了代码发现在SolrIndexSearcher.getDocSet(Query query)中第一次搜索query时，内部实现是调用 getDocSetNC(Query query, DocSet filter)；非第一次的话会直接从cache中获取，即
   if (filterCache != null) {
      DocSet absAnswer = filterCache.get(absQ);
      if (absAnswer!=null) {
        if (positive) return absAnswer;
        else return getPositiveDocSet(matchAllDocsQuery).andNot(absAnswer);
      }
    }
   DocSet absAnswer = getDocSetNC(absQ, null);
    DocSet answer = positive ? absAnswer :                                getPositiveDocSet(matchAllDocsQuery).andNot(absAnswer);

    if (filterCache != null) {
      // cache negative queries as positive
      filterCache.put(absQ, absAnswer);
    }
    继续查阅方法getDocSetNC(Query query, DocSet filter)可以发现当filter不存在。且query为TermQuery时，实现如下：
    if (query instanceof TermQuery) {
        Term t = ((TermQuery)query).getTerm();
        SolrIndexReader[] readers = reader.getLeafReaders();
        int[] offsets = reader.getLeafOffsets();
        int[] arr = new int[256];
        int[] freq = new int[256];
        for (int i=0; i<readers.length; i++) {
          SolrIndexReader sir = readers[i];
          int offset = offsets[i];
          collector.setNextReader(sir, offset);
          TermDocs tdocs = sir.termDocs(t);
          for(;;) {
            int num = tdocs.read(arr, freq);
            if (num==0) break;
            for (int j=0; j<num; j++) {
              collector.collect(arr[j]);
            }
          }
          tdocs.close();
        }
    其实情况则直接调用lucene的super.search(query, luceneFilter, collector);

而SolrIndexSearcher.search(query,filter,n,sort)则是直接调用lucene的同名方法；

分享到：

UTF8格式中的BOM问题

2012-01-09 18:48
浏览 1322
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

有关Solr中SolrIndexSearcher的search和getDocSet的差别

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

有关Solr中SolrIndexSearcher的search和getDocSet的差别

评论

发表评论

相关推荐

如何提高lucene索引的速度

大数据量，海量数据 处理方法总结(转)

Spider技术综述 （转）

最近访客更多访客>>

大数据量，海量数据处理方法总结(转)

Spider技术综述（转）