Luke lucene索引工具箱

项目地址，before 4.0 ：http://www.getopt.org/luke/或https://code.google.com/archive/p/luke/

项目地址，newer: https://github.com/tarzanek/luke 。没有二进制发行版，需要自己用ant编译。

1.简介

Luke is a handy development and diagnostic tool, which accesses already existing Lucene indexes and allows you to display and modify their content in several ways:
· browse by document number, or by term
· view documents / copy to clipboard
· retrieve a ranked list of most frequent terms
· execute a search, and browse the results
· analyze search results
· selectively delete documents from the index
· reconstruct the original document fields, edit them and re-insert to the index
· optimize indexes
· open indexes consisting of multiple parts, and/or located on Hadoop filesystem

· and much more...

2.使用

界面见图2-1.

图2-1 Luck界面

时间： 2024-12-22 10:00:13

Luke lucene索引工具箱的相关文章

Luke:Lucene索引查看工具

Luke介绍 Luke是一个方便的索引查看和诊断工具,可以访问Lucene构建的索引文件,显示和修改某些索引内容.能提供: 通过document编号或term浏览索引查看document内容,可复制到剪贴板对频率最高的term的索引字段提供排名后的浏览执行搜索语句并浏览搜索结果分析搜索结果从索引中选择性删除文件重建原始文档字段,对其进行编辑,然后重新插入的索引优化索引可以打开hadoop文件系统内的索引文件 Luke使用从google code里下载lukeall的jar包,直

MySQL和Lucene索引对比分析

MySQL和Lucene都可以对数据构建索引并通过索引查询数据,一个是关系型数据库,一个是构建搜索引擎(Solr.ElasticSearch)的核心类库.两者的索引(index)有什么区别呢?以前写过一篇<Solr与MySQL查询性能对比>,只是简单的对比了下查询性能,对于内部原理却没有解释,本文简单分析下两者的索引区别. MySQL索引实现在MySQL中,索引属于存储引擎级别的概念,不同存储引擎对索引的实现方式是不同的,本文主要讨论MyISAM和InnoDB两个存储引擎的索引实现方式. M

【手把手教你全文检索】Lucene索引的【增、删、改、查】

前言搞检索的,应该多少都会了解Lucene一些,它开源而且简单上手,官方API足够编写些小DEMO.并且根据倒排索引,实现快速检索.本文就简单的实现增量添加索引,删除索引,通过关键字查询,以及更新索引等操作. 目前博猪使用的不爽的地方就是,读取文件内容进行全文检索时,需要自己编写读取过程(这个solr免费帮我们实现).而且创建索引的过程比较慢,还有很大的优化空间,这个就要细心下来研究了. 创建索引 Lucene在进行创建索引时,根据前面一篇博客,已经讲完了大体的流程,这里再简单说下: 1 Di

Lucene5学习之使用Luke查看索引

首先在Git上下载luke的最新源码,然后导入Eclipse中,如图: 然后编写MANIFEST.MF清单文件: 清单文件代码 Manifest-Version: 1.0 Class-Path: lib/js.jar lib/commons-cli-1.2.jar lib/commons-codec-1.3.jar lib/commons-httpclient-3.0.1.jar lib/commons-logging-1.0.

使用Lucene索引和检索POI数据

1.简介关于空间数据搜索,以前写过<使用Solr进行空间搜索>这篇文章,是基于Solr的GIS数据的索引和检索. Solr和ElasticSearch这两者都是基于Lucene实现的,两者都可以进行空间搜索(Spatial Search),在有些场景,我们需要把Lucene嵌入到已有的系统提供数据索引和检索的功能,这篇文章介绍下用Lucene如何索引带有经纬度的POI信息并进行检索. 2.环境数据 Lucene版本:5.3.1 POI数据库:Base_Station测试数据,每条数据主要是I

01 一步一步学lucene 索引

原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 .作者信息和本声明.否则将追究法律责任.http://dba10g.blog.51cto.com/764602/1359564 内容创建某个目录的索引查询索引 1.基于文件目录,创建索引 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44

理解Lucene索引与搜索过程中的核心类

理解索引过程中的核心类欢迎访问我的个人网站http://wuyudong.com/ 执行简单索引的时候需要用的类有 IndexWriter.Directory.Analyzer.Document.Field 1.IndexWriter IndexWriter写索引是索引过程的核心组件这个类负责创建新的索引或者打开已有的索引以及向索引中添加.删除或更新被索引文档的信息但不能读取或搜索索引.IndexWriter需要开辟一定的空间来存储索引该功能由Directory完成 2.Directory /

lucene索引文件大小优化小结

随着业务快速发展,基于lucene的索引文件zip压缩后也接近了GB量级,而保持索引文件大小为一个可以接受的范围非常有必要,不仅可以提高索引传输.读取速度,还能提高索引cache效率(lucene打开索引文件的时候往往会进行缓存,比如MMapDirectory通过内存映射方式进行缓存). 如何降低我们的索引文件大小呢?本文进行了一些尝试,下文将一一介绍. 1 数值数据类型索引优化 1.1 数值类型索引问题 lucene本质上是一个全文检索引擎而非传统的数据库系统

Lucene索引和检索中文文件的问题

问题描述 lucene初学者,基础不好,碰到以下问题,恳请各位大侠指导,小女子感激不尽!用的是IKAnalyzer2012_u6.jar和lucene-core-3.6.2.jar是对本地的文件进行的索引和检索,做的web版的1.能检索英文的,就是检索不了中文的2.英文的检索出来的doc.get("contents")的值是空的,但是文件名和路径能读出来(附件里有代码)IndexUtil1.javapackage com.lium.bean;import java.io.Buffere

猜你喜欢

CSS3变换教你简单快速实现简单的变换效果

CSS3变换教你简单快速实现简单的变换效果

flash8.0绘图练习：绘制“烛光”元件

(1)执行[插入]|[新建元件]命令,或者按快捷键Ctrl+F8,弹出[创建新元件]对话框,在[名称]文本框中输入元件名称为"烛光",选择[行为]为[图形]. (2)单击" ...

用自动ftp提高工作效率

自动FTP的SHELL脚本,结合数据库的系统管理,它有很多用途,可以提高你的工作效率. 用途1: 把数据库的逻辑备份或者其它关键的文件传到另一个地区,实现远端备份. ( 例如:从北京机房的传到上海机房 ...

函数调用的几个概念

左通过栈传递,被调用的函数在返回前清理传送参数的内存栈,但不同的是函数名的修饰部分(关于函数名的修饰部分在后面将详细说明). _stdcall是Pascal程序的缺省调用方式,通常用于Win32 Ap ...

巧用Word中的选择性粘贴保存文档格式

不少朋友将网页中的内容复制后在Word中进行粘贴,发现粘贴后的内容与网页界面类似,甚至部分内容还会超出边界.其实,这时只想复制其中的内容.传统的Ctrl+V就不适合使用了,应该会用选择性粘贴. 如果想 ...

移动设备上的劝导式设计解剖: Banner不靠谱

本文围绕劝导式设计(persuasive design)而展开,介绍了移动终端上banner广告.push信息等典型的劝服失败案例,并从用户与移动设备之间的情感联系出发,探讨了移动劝导策略的几个切入点 ...

Win8系统怎么修复LSP？

LSP是什么呢?很多用户还不是很了解,LSP即Layered Service Provider,是一些重要网络协议的接口.最近.有Win8系统用户,反应有时网络不能正常连接,导致无法上网的原因是L ...

笔记本无线路由器怎么设置

3g流量总是有限的,手机等移动设备上网的需求总是难以得到满足,想要用手机玩会游戏或者使用平板电脑躺在床上看会视频没有wifi真的很难受,下面为大家分享一下笔记本无线路由器设置教程,就可以利用笔记本共享 ...

识别出脸部以及给脸部打马赛克

识别出脸部以及给脸部打马赛克原始图片 & 打马后的图片说明 1. 通过CIDetector来识别出脸部获取相关数据 2. 将CoreImage坐标转换为UIKit坐标 3. 将 ...

C++中读取.dat文件的问题，急！

问题描述 C++中读取.dat文件的问题,急! 求解答,设计目标是想利用一个按钮,打开一个.dat文件并将其中数据放到数组中,但是现在好像没打开.dat文件,大家能不能帮我看看哪儿有问题,应该怎么改. ...

【翻译】关于扩容一个百万级别用户系统的六个课程

翻译自: Six Lessons Learned The Hard Way About Scaling A Million User System 每个人都会到一个点,那时,你觉得你学习的东西足 ...

请问：用Ｃ＃开发ＷＥＢ程序，类似论坛发表文章，在点击＂发表＂时，如何将所要存入数据库的内容转换为具有完整ＨＴＭＬ标签格式的？

问题描述 privatevoidbtnadd_Click(objectsender,System.EventArgse){//将文件写入NewsFiles目录stringstrPath=Server. ...

[经典面试题][腾讯]选择原料工厂(最短距离问题)

题目 12个工厂分布在一条东西向高速公路的两侧,工厂距离公路最西端的距离分别是0.4.5.10.12.18.27.30.31.38.39.47.在这12个工厂中选取3个原料供应厂,使得剩余工厂到最近的 ...

win2008下IIS7、IIS7.5 配置ASP+ACCESS使用环境_win服务器

一.IIS7的安装 Windows 中IIS7.IIS7.5是默认不安装的,所以在安装完Windows Vista/windows 7/windows 2008之后如果需要安装IIS7/iis7.5的 ...

C++的构造函数和析构函数

1.构造函数和析构函数为什么没有返回值? 构造函数和析构函数是两个非常特殊的函数:它们没有返回值.这与返回值为void的函数显然不同,后者虽然也不返回任何值,但还可以让它做点别的事情,而构造函数和析构 ...

谷歌CEO重新发表讲话声音嘶哑疑未完全康复

谷歌http://www.aliyun.com/zixun/aggregation/32086.html">首席执行官拉里·佩奇腾讯科技讯(无忌)北京时间10月17日消息,据国外媒体 ...

cdh5 ubuntu14-ubuntu14.04在安装CM5、CDH5过程中如何配置自己本地的yum源

问题描述 ubuntu14.04在安装CM5.CDH5过程中如何配置自己本地的yum源在经过下载系统对应的parsel包后,如何进行下一步呢,具体来说比如: 1.要在本地建哪几个文件夹,每个文件夹时 ...

ios-请教关于IOS手势的问题

问题描述请教关于IOS手势的问题 @property (weak, nonatomic) IBOutlet UILabel *gestureLabel; -(void)tapGesture{ UIT ...

java类的问题-如何菜单项设置快捷键

问题描述如何菜单项设置快捷键如何给菜单项设置ctrl快捷键查看=new JMenu("查看(V)");查看.setMnemonic(KeyEvent.VK_V);设成ctrl ...

jsp页面上的字比别人的大，没控制过字体，为什么

问题描述 jsp页面上的字比别人的大,没控制过字体,为什么为什么我用我的myeclipse写出的jsp页面上的字的大小比别人的大,我们都没有控制过字体大小? 解决方案也许你的安装包使用别人设定过 ...

[ExtJS5学习笔记]第十九节 Extjs5中通过设置form.Panel的FieldSet集合属性控制多个field集合

官方例子: http://docs.sencha.com/extjs/5.0/apidocs/#!/api/Ext.form.FieldSet 本文作者:sushengmiyan ---------- ...

澳大利亚首支4G手机开始预购每月价格79澳元

全澳首支4G手机周四开始在网上预购,下周二正式开售,不过消费者团体警告消费者,在购买之前先要查清楚自己所在地是否有4G网络. 这支HTC的Velocity 4G手机是澳洲的第一支4G手机,在4G网络内 ...

PHP可变函数的使用详解_php技巧

PHP 支持可变函数的概念.这意味着如果一个变量名后有圆括号,PHP 将寻找与变量的值同名的函数,并且尝试执行它.可变函数可以用来实现包括回调函数,函数表在内的一些用途. 变量函数不能用于语言结构,例 ...

eclipse热编译问题

问题描述每次改一点代码,保存后就报这个热编译问题.每次都重启服务,实在很麻烦...求大神解决方案解决方案二:记得以前遇到过这种问题具体解决方法忘记了楼主你试试project-->clean ...

安装websphere application developer 报错，有谁能帮我稍微看一下，大概是什么错误的嘛？谢谢

问题描述 javax.net.ssl.SSLException:Connectionhasbeenshutdown:javax.net.ssl.SSLException:java.net.Socket ...

怎么在远程的托管主机发布网站

问题描述使用J2EE技术做好了一个网站,现在想发布在远程的托管主机上,Web服务器是使用tomcat.应该要怎么做? 解决方案解决方案二:待学习,抢个sf,帮忙顶下解决方案三::):)解决方案四: ...

五个值得关注的图形数据库

图形数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息.最常见的一个例子,就是社会网络中http://www.aliyun.com/zixun/aggregation/7518.html ...

《c++语言导学》——1.4　函数

1.4 函数如果我们打算在C++程序中完成某些任务,最好的方式就是调用函数.要想准确描述某项操作的细节,把它定义成函数是最优选择.需要注意的是:函数必须先声明后使用.一条函数声明语句需要完成三项任务 ...

微软认为Office与LinkedIn可以协同增效

据国外媒体报道,微软认为,职业社交网络与实际工作有很大的机会融合在一起,Office和LinkedIn可以相互帮助,协同增效. 现在人们都知道,LinkedIn是人们找工作时使用的一个职业社交网络而微 ...

如何将字符串中的一些字段合并成map

问题描述现在有这么一个乱的字符串Stringstr="[tesdfg={Temp=sdaf,Params=adsfaa,No=2},{No=3}[,list={Temp=sadsfdaf, ...

热搜

© 2024 iVAN | info#iamivan.net | 12 q. 0.022 s.