Luke lucene索引工具箱

项目地址,before 4.0 :http://www.getopt.org/luke/https://code.google.com/archive/p/luke/

项目地址,newer:    https://github.com/tarzanek/luke  。没有二进制发行版,需要自己用ant编译。

1.简介

Luke is a handy development and diagnostic tool, which accesses already existing Lucene indexes and allows you to display and modify their content in several ways:
· browse by document number, or by term
· view documents / copy to clipboard
· retrieve a ranked list of most frequent terms
· execute a search, and browse the results
· analyze search results
· selectively delete documents from the index
· reconstruct the original document fields, edit them and re-insert to the index
· optimize indexes
· open indexes consisting of multiple parts, and/or located on Hadoop filesystem

· and much more...

2.使用

界面见图2-1.

图2-1 Luck界面

时间: 2024-08-07 03:31:49

Luke lucene索引工具箱的相关文章

Luke:Lucene索引查看工具

Luke介绍 Luke是一个方便的索引查看和诊断工具,可以访问Lucene构建的索引文件,显示和修改某些索引内容.能提供: 通过document编号或term浏览索引 查看document内容,可复制到剪贴板 对频率最高的term的索引字段提供排名后的浏览 执行搜索语句并浏览搜索结果 分析搜索结果 从索引中选择性删除文件 重建原始文档字段,对其进行编辑,然后重新插入的索引 优化索引 可以打开hadoop文件系统内的索引文件 Luke使用 从google code里下载lukeall的jar包,直

MySQL和Lucene索引对比分析

MySQL和Lucene都可以对数据构建索引并通过索引查询数据,一个是关系型数据库,一个是构建搜索引擎(Solr.ElasticSearch)的核心类库.两者的索引(index)有什么区别呢?以前写过一篇<Solr与MySQL查询性能对比>,只是简单的对比了下查询性能,对于内部原理却没有解释,本文简单分析下两者的索引区别. MySQL索引实现 在MySQL中,索引属于存储引擎级别的概念,不同存储引擎对索引的实现方式是不同的,本文主要讨论MyISAM和InnoDB两个存储引擎的索引实现方式. M

【手把手教你全文检索】Lucene索引的【增、删、改、查】

前言 搞检索的,应该多少都会了解Lucene一些,它开源而且简单上手,官方API足够编写些小DEMO.并且根据倒排索引,实现快速检索.本文就简单的实现增量添加索引,删除索引,通过关键字查询,以及更新索引等操作. 目前博猪使用的不爽的地方就是,读取文件内容进行全文检索时,需要自己编写读取过程(这个solr免费帮我们实现).而且创建索引的过程比较慢,还有很大的优化空间,这个就要细心下来研究了. 创建索引 Lucene在进行创建索引时,根据前面一篇博客,已经讲完了大体的流程,这里再简单说下: 1 Di

Lucene5学习之使用Luke查看索引

    首先在Git上下载luke的最新源码,然后导入Eclipse中,如图:       然后编写MANIFEST.MF清单文件: 清单文件代码   Manifest-Version: 1.0   Class-Path: lib/js.jar      lib/commons-cli-1.2.jar      lib/commons-codec-1.3.jar      lib/commons-httpclient-3.0.1.jar      lib/commons-logging-1.0.

使用Lucene索引和检索POI数据

1.简介 关于空间数据搜索,以前写过<使用Solr进行空间搜索>这篇文章,是基于Solr的GIS数据的索引和检索. Solr和ElasticSearch这两者都是基于Lucene实现的,两者都可以进行空间搜索(Spatial Search),在有些场景,我们需要把Lucene嵌入到已有的系统提供数据索引和检索的功能,这篇文章介绍下用Lucene如何索引带有经纬度的POI信息并进行检索. 2.环境数据 Lucene版本:5.3.1 POI数据库:Base_Station测试数据,每条数据主要是I

01 一步一步学lucene 索引

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://dba10g.blog.51cto.com/764602/1359564 内容 创建某个目录的索引 查询索引 1.基于文件目录,创建索引 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44

理解Lucene索引与搜索过程中的核心类

理解索引过程中的核心类 欢迎访问我的个人网站http://wuyudong.com/ 执行简单索引的时候需要用的类有 IndexWriter.Directory.Analyzer.Document.Field 1.IndexWriter IndexWriter写索引是索引过程的核心组件这个类负责创建新的索引或者打开已有的索引以及向索引中添加.删除或更新被索引文档的信息但不能读取或搜索索引.IndexWriter需要开辟一定的空间来存储索引该功能由Directory完成 2.Directory /

lucene索引文件大小优化小结

   随着业务快速发展,基于lucene的索引文件zip压缩后也接近了GB量级,而保持索引文件大小为一个可以接受的范围非常有必要,不仅可以提高索引传输.读取速度,还能提高索引cache效率(lucene打开索引文件的时候往往会进行缓存,比如MMapDirectory通过内存映射方式进行缓存).       如何降低我们的索引文件大小呢?本文进行了一些尝试,下文将一一介绍. 1 数值数据类型索引优化 1.1 数值类型索引问题         lucene本质上是一个全文检索引擎而非传统的数据库系统

Lucene索引和检索中文文件的问题

问题描述 lucene初学者,基础不好,碰到以下问题,恳请各位大侠指导,小女子感激不尽!用的是IKAnalyzer2012_u6.jar和lucene-core-3.6.2.jar是对本地的文件进行的索引和检索,做的web版的1.能检索英文的,就是检索不了中文的2.英文的检索出来的doc.get("contents")的值是空的,但是文件名和路径能读出来(附件里有代码)IndexUtil1.javapackage com.lium.bean;import java.io.Buffere