Lucene5学习之TermRangeQuery使用

    TermRangeQuery是用于字符串范围查询的,既然涉及到范围必然需要字符串比较大小,字符串比较大小其实比较的是ASC码值,即ASC码范围查询。一般对于英文来说,进行ASC码范围查询还有那么一点意义,中文汉字进行ASC码值比较没什么太大意义,所以这个TermRangeQuery了解就行,用途不太大,一般数字范围查询NumericRangeQuery用的比较多一点,比如价格,年龄,金额,数量等等都涉及到数字,数字范围查询需求也很普遍。

    我们来看看官方API里是怎么解释这个Query的:


 意思就是这个Query通过一个范围内的Term来匹配索引文档,这个Query通过一组Term来查找索引文档,哪些Term呢?that后面是解释根据比较byte值落入提供的范围内的Term.但这个Query不适用于数字范围查询,数字范围查询请使用NumericRangeQuery代替。

    下面是TermRangeQuery的使用示例:

    

Java代码  

  1. package com.yida.framework.lucene5.query;  
  2.   
  3. import java.io.IOException;  
  4. import java.nio.file.Paths;  
  5. import java.util.ArrayList;  
  6. import java.util.List;  
  7.   
  8. import org.apache.lucene.document.Document;  
  9. import org.apache.lucene.index.DirectoryReader;  
  10. import org.apache.lucene.index.IndexReader;  
  11. import org.apache.lucene.queryparser.classic.ParseException;  
  12. import org.apache.lucene.search.IndexSearcher;  
  13. import org.apache.lucene.search.Query;  
  14. import org.apache.lucene.search.ScoreDoc;  
  15. import org.apache.lucene.search.TermRangeQuery;  
  16. import org.apache.lucene.search.TopDocs;  
  17. import org.apache.lucene.store.FSDirectory;  
  18. import org.apache.lucene.util.BytesRef;  
  19.   
  20. public class TermRangeQueryTest {  
  21.     public static void main(String[] args) throws ParseException, IOException {  
  22.         //参数定义  
  23.         String directoryPath = "D:/lucenedir";  
  24.         String fieldName = "contents";  
  25.         String lowerTermString = "fa";  
  26.         String upperTermString = "fi";  
  27.   
  28.           
  29.         Query query = new TermRangeQuery(fieldName,   
  30.             new BytesRef(lowerTermString),   
  31.             new BytesRef(upperTermString), false, false);  
  32.         List<Document> list = query(directoryPath,query);  
  33.         if(list == null || list.size() == 0) {  
  34.             System.out.println("No results found.");  
  35.             return;  
  36.         }  
  37.         for(Document doc : list) {  
  38.             String path = doc.get("path");  
  39.             String content = doc.get("contents");  
  40.             System.out.println("path:" + path);  
  41.             //System.out.println("contents:" + content);  
  42.         }  
  43.     }  
  44.     /** 
  45.      * 创建索引阅读器 
  46.      * @param directoryPath  索引目录 
  47.      * @return 
  48.      * @throws IOException   可能会抛出IO异常 
  49.      */  
  50.     public static IndexReader createIndexReader(String directoryPath) throws IOException {  
  51.         return DirectoryReader.open(FSDirectory.open(Paths.get(directoryPath, new String[0])));  
  52.     }  
  53.       
  54.     /** 
  55.      * 创建索引查询器 
  56.      * @param directoryPath   索引目录 
  57.      * @return 
  58.      * @throws IOException 
  59.      */  
  60.     public static IndexSearcher createIndexSearcher(String directoryPath) throws IOException {  
  61.         return new IndexSearcher(createIndexReader(directoryPath));  
  62.     }  
  63.       
  64.     /** 
  65.      * 创建索引查询器 
  66.      * @param reader 
  67.      * @return 
  68.      */  
  69.     public static IndexSearcher createIndexSearcher(IndexReader reader) {  
  70.         return new IndexSearcher(reader);  
  71.     }  
  72.       
  73.     public static List<Document> query(String directoryPath,Query query) throws IOException {  
  74.         IndexSearcher searcher = createIndexSearcher(directoryPath);  
  75.         TopDocs topDocs = searcher.search(query, Integer.MAX_VALUE);  
  76.         List<Document> docList = new ArrayList<Document>();  
  77.         ScoreDoc[] docs = topDocs.scoreDocs;  
  78.         for (ScoreDoc scoreDoc : docs) {  
  79.             int docID = scoreDoc.doc;  
  80.             Document document = searcher.doc(docID);  
  81.             docList.add(document);  
  82.         }  
  83.         searcher.getIndexReader().close();  
  84.         return docList;  
  85.     }  
  86. }  

    TermRangeQuery构造函数如下:

   

Java代码  

  1. TermRangeQuery(String field, BytesRef lowerTerm, BytesRef upperTerm, boolean includeLower, boolean includeUpper)   

   BytesRef创建很简单,直接new BytesRef(string)传入一个字符串即可, TermRangeQuery还提供了一个静态方法来构建TermRangeQuery实例:

    

Java代码  

  1. /** 
  2.    * Factory that creates a new TermRangeQuery using Strings for term text. 
  3.    */  
  4.   public static TermRangeQuery newStringRange(String field, String lowerTerm, String upperTerm, boolean includeLower, boolean includeUpper) {  
  5.     BytesRef lower = lowerTerm == null ? null : new BytesRef(lowerTerm);  
  6.     BytesRef upper = upperTerm == null ? null : new BytesRef(upperTerm);  
  7.     return new TermRangeQuery(field, lower, upper, includeLower, includeUpper);  
  8.   }  

 其实就是在方法内部帮我们new BytesRef()了,这样接口参数里面对用户的只有用户熟悉的String类型了而没有BytesRef类型了,毕竟用户对BytesRef不是很熟悉,会导致用户在使用API时会有些障碍,所以提供了newStringRange这么一个静态方法,当然如果你自己知道怎么使用默认的构造函数,直接使用构造函数new也可以,只是给用户多了一种选择。

     TermRangeQuery就介绍这么多了,打完收工!

 

      如果你还有什么问题请加我Q-Q:7-3-6-0-3-1-3-0-5,

或者加裙
一起交流学习!

转载:http://iamyida.iteye.com/blog/2194705

时间: 2024-10-27 01:43:26

Lucene5学习之TermRangeQuery使用的相关文章

Lucene5学习之Filter过滤器

  清明3天假,我猜小伙伴们都相约出去玩去了,对于我等屌丝来说,唯有在家写代码打发时间了.其实不是我喜欢宅,只是一个人去哪儿都没有激情,还不如在家安安静静的看看书写写代码来的安逸,对这个看脸的世界就差绝望了,就算代码虐我千万遍,我待代码还是如初恋啊!今天从早上9点起来,就中午做个饭,一坐就是整整10个小时,照着我预想的计划继续记录我的Lucene5学习轨迹,由于Filter体系下子类有点多,还要编写测试demo,所以这篇博客有点姗姗来迟,请大家多多包涵!                    

Lucene5学习之自定义排序

         在Lucene5学习之排序-Sort中,我们已经学习了Sort的用法,已经了解了,Lucene搜索返回的命中结果默认是按照索引文档跟搜索关键字的相关度已经排序的,而相关度又是基于内部的打分机制和索引文档id,内部的打分机制则是根据Term的IDF-TF以及创建索引时Field的boost等决定的,默认是按照得分降序排序,得分相同再按docId升序排序.如果你觉得默认的排序方式满足不了你的需求,你可以设置SortField按照特定的域来排序,特定的域排序其实根据域的type类型去

Lucene5学习之多线程创建索引

    昨晚睡觉前把多线程创建索引demo写好了,今天早上7点多就起来,趁着劲头赶紧记录分享一下,这样对那些同样对Lucene感兴趣的童鞋也有所帮助.     我们都知道Lucene的IndexWriter在构造初始化的时候会去获取索引目录的写锁writerLock,加锁的目的就是保证同时只能有一个IndexWriter实例在往索引目录中写数据,具体看截图:  而在多线程环境下,光保证只有IndexWriter实例能得到锁还不行,还必须保证每次只能有一个线程能获取到writerLock,Luce

Lucene5学习之Highlighte关键字高亮

   Google我想大家应该都用过,输入我们的搜索关键字,然后回车,Google就会返回搜索结果,在返回的界面里,会对命中的关键字进行红色字体标注出来,这就是高亮功能.        Lucene5中高亮功能相关API都在org.apache.lucene.search.highlight包下,我们先从简单的高亮器开始即Highlighter        透过Hightlighter类的源码,我们首先需要去了解里面的每个成员变量的含义: Java代码   public static fina

Lucene5学习之Suggest关键字提示

     首先需要搞清楚Suggest模块是用来解决什么问题的?Google我想大家都用过,当我们在搜索输入框里输入搜索关键字的时候,紧贴着输入框下方会弹出一个提示框,提示框里会列出Top N个包含当前用户输入的搜索关键字的搜索热词,如图:       这里说的不是前端的这种JS效果,而说的是输入一个关键字如何获取相关的搜索热词,至于js效果,自己Google jQuery自动补全插件,我以前玩过,这里关注的是提示数据如何获取,当然你也可以使用数据库SQL like "%xxxx%"来

Lucene5学习之FunctionQuery功能查询

    我猜,大家最大的疑问就是:不是已经有那么多Query实现类吗,为什么又设计一个FunctionQuery,它的设计初衷是什么,或者说它是用来解决什么问题的?我们还是来看看源码里是怎么解释FunctionQuery的:         意思就是基于ValueSource来返回每个文档的评分即valueSourceScore,那ValueSource又是怎么东东?接着看看ValueSource源码里的注释说明:  ValueSource是用来根据指定的IndexReader来实例化Funct

Lucene5学习之创建索引入门示例

    Lucene更新实在太快了,只好紧跟脚步开始学习Lucene5,花了点时间写了一个demo,就是程序根据用户提供的一个文件夹,读取该文件夹下的所有文件,然后读取文件里的内容写入索引.读取文件部分采用的是最新的NIO2.0API,因此,JDK必须使用1.7及以上版本.Lucene5开发压缩包请在Lucene官网下载.不多说了,对于码农来说,最直接的就是上代码. Java代码   package com.yida.framework.lucene5.core;      import jav

Lucene5学习之SpanQuery跨度查询

    SpanQuery下的子类有好几个,我就放一篇里集中说说.SpanQuery即跨度查询,首先要理解跨度这个概念,Lucene里跨度是用Spans这个类定义的,源码如下:   Java代码   /** Expert: an enumeration of span matches.  Used to implement span searching.   * Each span represents a range of term positions within a document.  

Lucene5学习之使用MMSeg4j分词器

     MMSeg4j是一款中文分词器,详细介绍如下:        1.mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用.          2.MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配.Complex 加了四