lucene 文档评分及 CustomScoreQuery

1.评分

评分公式可见《lucence 文档评分公式》

2.解释

org.apache.lucene.search.Explanation
类，用于解释评分细节。
String org.apache.lucene.search.Explanation.toString()
文本格式输出。
String org.apache.lucene.search.Explanation.toHtml()
html格式输出。例子见图2-1.

图2-1 toHtml()格式的explanation

Explanation org.apache.lucene.search.IndexSearcher.explain(Query query, int doc)

给出doc对于query的评分。这个操作代价比较昂贵，等同于在整个索引上执行这个query。

3.自定义评分

场景：对最近修改过的文档进行加权。

3.1相关类

org.apache.lucene.queries.CustomScoreQuery
定制化评分的Query。
CustomScoreProvider org.apache.lucene.queries.CustomScoreQuery.getCustomScoreProvider(LeafReaderContext context)
拿到含有评分逻辑的CustomScoreProvider。
org.apache.lucene.queries.CustomScoreProvider
含有定制化评分逻辑的类。
float org.apache.lucene.queries.CustomScoreProvider.customScore(int doc, float subQueryScore, float valSrcScore)
一般会重写该方法。若认为这篇doc重要，可以return subQueryScore*加权程度。subQueryScore代表的是已有的评分，在此基础上进行干预更合理。

时间： 2024-08-04 01:35:05

lucene 文档评分及 CustomScoreQuery的相关文章

SharePoint 2010的文档评分功能

如果大家使用SharePoint来构建文档管理解决方案,给文档评分其实是一个挺常见的需求.可惜在之前的版本中,SharePoint并没有内置这个功能,当然,也不断的有社区项目,通过自定义开发的方式,给SharePoint文档库添加上这个功能.SharePoint 2010终于给文档库(实际上是所有列表),都加上了给文档(和列表项)评分的功能. 在文档库设置中,打开"等级设置"页面,然后在页面中启用等级评定. 然后文档库中会增加两个网站栏,"等级(0-5)"和&quo

lucence 文档评分公式

1.简介分值计算方式为查询语句query中每个项term与文档doc的评分之和.公式表示见1-1. score(query,doc)=∑term∈queryscore(term,doc)(1-1) 2.term与doc的评分 2.1 基于tf-idf score(t,d)=tf(t,d)∗idf(t)2∗boost(t,d)∗lengthNorm(t,d)∗coord(q,d)∗queryNorm(q)(2-1) 符号说明备注 t term / d doc / q term 所在query

lucene Sort 文档排序

1.Sort org.apache.lucene.search.Sort 封装排序标准的类. SortField[] org.apache.lucene.search.Sort.fields 字段. org.apache.lucene.search.Sort.Sort(SortField field) 构造函数.按照指定的SortField进行排序. org.apache.lucene.search.Sort.Sort(SortField... fields) 上面函数的重载,指定多个field

Lucene 3.6.2入门(14) SolrJ操作索引和搜索文档以及整合中文分词

package com.jadyer.solrj; import java.util.ArrayList; import java.util.List; import org.apache.solr.client.solrj.SolrQuery; import org.apache.solr.client.solrj.SolrServer; import org.apache.solr.client.solrj.SolrServerException; import org.apache.sol

lucene net-Lucene.net 创建索引 txt文档

问题描述 Lucene.net 创建索引 txt文档怎么用Lucene.net对已有的txt文本创建索引,索引文件__r.cfs,_r.cfx,segments.gen,segments_m是编代码之后自动生成的还是怎么来的?大致步骤是什么样的. 解决方案 http://blog.csdn.net/xuezhongsong/article/details/4388241 解决方案二: Lucene.Net创建索引

Lucene如何将含有某一关键字的文档过滤掉？

问题描述比如我要搜索含"房间"一词的文档,同时将含有"白色"字眼的搜索结果给筛掉,请问应该怎么写呢?之前从Lucene的API手册上发现有一个org.apache.lucene.search.TermsFilter的类可能可以实现这个功能,但在写代码的时候却老是引入不了这个类.不知道这个类放在哪个jar包里..当然,如果有其它更好的方法的话也可以分享一下. 问题补充:beneo 写道解决方案 TermsFilter不是要你引入的,而是要和FilteredQuer

lucene Collector 文档收集器

编写自定义的Colletor,可以对搜索返回的文档实现更精确的控制. 1.接口 1.1 Collector org.apache.lucene.search.Collector 接口.用于聚合原始的搜索结果,实现排序及定制化的过滤. LeafCollector org.apache.lucene.search.Collector.getLeafCollector(LeafReaderContext context) 接口内的方法.创建一个新的collector 来完成给定上下文的收集. bool

通过HttpHandler和开源控件PDFBox来对PDF文档进行访问控制

前言如果我们想将服务端的PDF文档内容展示给客户端,往往会通过URL直接访问的方式.这样一来,PDF文档就会毫无保留的保存到客户端去,通过浏览器的PDF插件,客户端可以随意拷贝PDF的副本.(如下图) 本文通过HttpHandler和开源控件PDFBox来对PDF文档进行访问控制,只向客户端解析并展示PDF的内容而非PDF文件本身. PDF解析目前有许多PDF解析组件,国内比较常用的是iTextSharp,该控件早期从JAVA移植过来,完全支持.NET平台,在创建PDF文档方面非常灵活易用.

OpenKM开源文档管理系统简介

OpenKM简介 OpenKM是一个文档管理系统,用于组织和共享文档.可以通过名称,内容,关键字等来搜索文档.基于Jboss+J2EE+Ajax web (GWT)+Jackrabbit (lucene)等技术开发. 相关技术 OpenKM开发过程中运用到了如下几个技术: JBoss 4.0.3SP1 ( version basis for the development ) Java企业级服务器 Java J2EE ( JDK 1,5 ) Java企业级开发环境 Jackrabbit 内容管理

猜你喜欢

win7旗舰版电脑唤醒时出现拒绝访问的提示怎么办？

在咱们的win7旗舰版64位系统下载中是有睡眠功能的,这个功能是在升级到win7旗舰版系统中才有的,当咱们在设定的时间内不对win7旗舰版电脑中执行任何操作,咱们的win7旗舰版电脑就会自动的进入 ...

常用的数据库访问方式

访问|数据|数据库 ASP访问数据库的方式有哪些? 在ASP中可以通过三种方式访问数据库:1.IDC(Internet Database Connector)方式:2.ADO(ActiveX Data ...

asp中对ip进行过滤限制函数

函数看了一些IP限制的函数,觉得太复杂.所以,试着写了一个,比较简单.请网友参考指教.谢谢!- 代码拷贝框<%'获取访问者的地址ip=Request.ServerVariables(" ...

了解VBE

功欲善其事,必先利其器!在我们要学习VBA与用VBA编写代码时,必须先熟悉开发的环境--VBE. VBE--Visual Basic Edirtor,如果大家对微软的一门编程语言有所了解的话,那对VB ...

核心交换机光纤端口级连接方式与类型

核心交换机的端口主要是光纤类型,但是交换机光纤端口的价格是非常昂贵的,需要用户特别注意,同时交换机的光纤端口没有堆叠能力,只能被用于级联. 级联既可使用普通端口也可使用特殊的MDI-II端口.当相互级 ...

PhotoShop制作流动的瀑布河水GIF动画效果教程

介绍如何用PS制作流动的瀑布河水GIF动画效果,主要是用到滤镜里的海洋波纹来变形,然后在动画窗口里设置帧数就行了,挺简单的,喜欢的同学可以学习一下! 素材: 效果图: 1,打开素材图片,抠出有水的地方 ...

Word2003为字符添加拼音指南

Word2003为字符添加拼音指南.只有通过"Microsoft Office 语言设置"启用了日语.简体中文.繁体中文或朝鲜语支持时,此"帮助"主题中描述的功 ...

win8系统怎么将qq音乐歌曲导入到itunes

win8系统怎么将qq音乐歌曲导入到itunes 1.打开iTunes,将"编辑"和"应用"下面的下拉菜修改为"音乐"; 2.打开QQ音 ...

Win7如何隐藏任务栏图标

1.首先用鼠标右键在桌面下面的任务栏处点击一下,这时就会出现上拉菜单. 2.移动鼠标在下拉菜单下面找到属性选项然后用鼠标点击属性选项. 3.点击属性以后任务栏和开始菜单属性窗口出现,然后把任务栏下 ...

腾讯美女设计师教你了解圆、方、三角

七巧板,或许我们小时候都玩过,我们曾利用它简单的拼出我们想像中的各种动物花鸟的形态,有时我们也会有意外的造型收获.正如这七巧板,圆形和方形与三角形则是网页造型结构中的精髓元素的归纳,即使再丰富生动 ...

win7系统里不能关闭的后台服务

1.DNSClient 服务这个是解析DNS,简单的来说.如果禁用这个进程,你就不能过通过输入www.355189.com来访问这个网站.只能通过找到这网站的IP地址来访问.这样会给你日常使用造 ...

Windows系统彻底删除电脑隐藏账户

最隐藏的系统后门都具备些什么特点? 首先必须功能强大,可以对系统进行完全控制,其次就是隐蔽性好.能躲过杀毒软件的法眼.这种后门有吗,答案是肯定的,除了专门的病毒以外存在于系统中的隐藏帐户也具有这种特 ...

静态网页-求大哥们帮做一个简单的购物网页。

问题描述求大哥们帮做一个简单的购物网页. 小弟本人是IT新手加菜鸟,刚上大一,这学期初学习了HTML静态网页制作,现在有道结课作业,要求如下: 至少应该有主页.注册登陆页面及其他商品介绍的页面.主页 ...

Android中new Notification创建实例的最佳方法_Android

目前 Android 已经不推荐使用下列方式创建 Notification实例: Notification notification = new Notification(R.drawable.ic_ ...

《设计原本—计算机科学巨匠Frederick P. Brooks的反思》一一3.10 注释和参考文献

3.10 注释和参考文献 1. 工程师需要的是最低限度满足解,而科学家需要的是发现,这往往可以通过在更大范围里探索而求得. 2. Blaauw和Brooks(1997),<Computer Ar ...

Android Animation动画详解（一）：补间动画

前言你有没有被一些APP中惊艳的动画效果震撼过,有没有去思考,甚至研究过这些动画是如何实现的呢? 啥?你没有思考,更没有研究过? 好吧,那跟着我一起来学习下如何去实现APP中那些让我们惊羡的动画特效 ...

浅谈图片优化的方法

在网站优化中,如果图片优化得好,不但可以提高页面的加载速度,提升网站的用户体验,而且还可以通过图片优化来节省网站的带宽.那么作为页面构建工程师应该采用什么方法来优化图片,既能保证UI的还原度,又使图片 ...

【dotnet跨平台】Visual Studio Code常见问答

[dotnet跨平台]Visual Studio Code常见问答如果你没找到想要的问题答案,请看已知问题:https://github.com/microsoft/vscode/issues ...

ssm-MultipartFile 图片上传后中文乱码

问题描述 MultipartFile 图片上传后中文乱码 String filename = myfile.getOriginalFilename(); 原本文件名称:单身汪.jpg 获取:???è? ...

互联网需要什么样的视频内容？

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客站长团购云主机技术大厅现在互联网内容造假炒作现象 ...

支付宝开通万事达卡港澳台支付

本报讯中国最大的第三方支付平台支付宝日前宣布与万事达卡国际组织进行合作,正式开通香港.澳门.台湾三地的万事达卡支付业务.目前支持支付宝万事达卡支付的港澳台发卡银行有20家,支持V ISA卡支付的发卡 ...

采用单页面做淘宝客赚佣金的思路

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅随着淘宝的壮大,像推销员员一样的淘 ...

气温骤降拉高部分菜价：白菜价翻倍

近日,大连气温骤降,突然变脸的天气不仅让市民们短时间内难以适应,对于一向关注天气变化的菜农.果农及各经销商们来说,也倍感措手不及.记者走访大连市场发现,这场突如其来的大降温在农产品和水产品市场上掀起一 ...

windows-win7 下 vim7.4 安装YouCompleteMe插件后，打开gvim闪退

问题描述 win7 下 vim7.4 安装YouCompleteMe插件后,打开gvim闪退刚刚接触vim,在安装YouCompleteMe插件的过程中遇到了麻烦,请大家帮忙看看. 安装时参考了(h ...

jQuery+CSS3实现四种应用广泛的导航条制作实例详解_jquery

导航条的使用很广,每个网站都会做出具有自己特色的导航条.最近特地去了解了各种类型的导航条,比如具有高亮显示的导航条,中英文互相切换的导航条,具有弹性动画的导航条,甚至是具有摩擦运动动画的导航条(文字下 ...

WPF的ListView控件自定义布局用法实例_C#教程

本文实例讲述了WPF的ListView控件自定义布局用法.分享给大家供大家参考,具体如下: 概要: 以源码的形式贴出,免得忘记后,再到网上查资料.在VS2008+SP1环境下调试通过引用的Grays ...

报告称新一代科技公司正在搬向中心商务区

国际物业咨询公司高力国际最新发布了一份报告,关于亚太地区科技公司对于办公空间需求的变化. 报告发现,从前科技公司通常分布在科技产业园区,而现在,新一代科技公司对于大型软硬件开发科研项目的依赖度变低,因 ...

2016年虚拟网络5大预测

随着今年开源软件的极大发展,网络行业成为了产业链中增长最快的产业,同时也是网络功能虚拟化(NFV)中的关键部分.NFV将改变网络的设计方式,随着过去几年中专有硬件的发展,将从传统的网络硬件向云服务迁移 ...

struts2用最新的包就报错

问题描述输入页index.jsp<%-- 使用Struts2标签库 --%> <%@ taglib prefix="s" uri="/struts-t ...

国产手机调查：三家厂商品牌突出质量是大问题

你对下面哪些内地手机品牌印象更深"的用户调查结果你会选择什么价位的国产手机"的用户调查结果你认为目前国产手机主要问题有什么?"的调查结果新浪科技今年8月初发起的有 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.021 s.