LuceneNet+盘古分词

问题描述

网站有1000多万数据，全站搜索使用了LuceneNet+盘古分词，网站启动后就自动加载分词文件，但是每个词第一次搜索都要几秒或上十秒以上，第二次后再搜索这个词就只使用几ms就出来了，请问有什么办法让每个词的第一次搜索都能秒显？

解决方案

解决方案二：
将加载分词文件后的数据缓存起来，可以吗？
解决方案三：
写个软件都相关的词都自动查一遍
解决方案四：
引用1楼hanjun0612的回复:

将加载分词文件后的数据缓存起来，可以吗？

已经做了缓存的，就是网站启动加载后就缓存下来了
解决方案五：
引用2楼liaoxing168的回复:

写个软件都相关的词都自动查一遍

还是会有很多未知用户要查的词啊
解决方案六：
调试跟踪下呗怀疑耗时的地方记录下开始和结束时间，找到耗时方法才能有相应的解决方案啊
解决方案七：
第一次搜索的时候执行的操作在启动网站的时候模拟执行一遍可以不？

时间： 2024-09-19 09:06:43

LuceneNet+盘古分词的相关文章

盘古分词-Lucen.net搜索的时候，怎么让输入的关键词先显示，然后再显示单个的字

问题描述 Lucen.net搜索的时候,怎么让输入的关键词先显示,然后再显示单个的字我用lucene.net和盘古分词结合,对txt文档实现了搜索,但搜索结果的排序有问题,比如,我搜索"方法",盘古分词会先对"方法'进行分词,分为"方"."方法'."法",然后搜索结果会把含有"方"和"法"的文档和含有"方法"的文档都显示出来,但是我想把含有"方法"

求教关于lucene.net盘古分词器的问题

问题描述我在搜索中加入了盘古分词器之后,用panguanalyzer替代了standardanalyzer,但是建立新的索引之后的搜索貌似是搜索到一个关键词就返回一次结果,所以搜索结果大量重复,求怎么解决....z这是搜索方法的代码,求大神解救.....privatevoidsearch(){DateTimestart=DateTime.Now;//createthesearcher//indexisplacedin"index"subdirectorystringindexDire

lucene.net 3.0.3、结合盘古分词进行搜索的小例子（分页功能）

添加:2013-12-25 更新:2013-12-26 新增分页功能. 更新:2013-12-27 新增按分类查询功能,调整索引行新增记录的图片字段. 最新盘古分词dll和词典管理工具下载:http://pangusegment.codeplex.com/ 词典下载:http://pangusegment.codeplex.com/releases/view/47411 //封装类 using System; using System.Collections.Generic; using Sy

让盘古分词支持最新的Lucene.Net 3.0.3

原文:让盘古分词支持最新的Lucene.Net 3.0.3 好多年没升级过的Lucene.Net最近居然升级了,到了3.0.3后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把MMSeg给修改了一下支持了Lucene.Net 3.0.3(参考<基于MMSeg算法的中文分词类库>). 然后我知道了.Net下还有一个盘古分词(http://pangusegment.codeplex.com/),但也不支持Lucene.Net 3.0.3,网上也不少人在问,于是就下载了它的最新代码,基于L

盘古分词用自定义字典

问题描述如图.....请问下盘古分词工具怎么设置自定义字典来分词.把自带的分词删掉...添加自己的字典解决方案解决方案二:下载字段管理工具,里面有一个dictManager.exe下载地址http://download.csdn.net/detail/fangmenglong12/5298566#comment

盘古分词,记灵一下

http://pangusegment.codeplex.com PanGu.dll 调用方法初始化在进程启动时,我们需要对盘古分词进行初始化,初始化的调用代码如下: 默认方式初始化 PanGu.Segment.Init(); 这个调用将使用和 PanGu.dll 同路径下的 pangu.xml 配置文件指定配置文件方式初始化 PanGu.Segment.Init(filename); filename 为pangu.xml 的完整路径名,如"c:\pangu.xml&quo

TreeSplitter---树形分词算法

注:思路不是原创,首先感谢思维的突发奇想者一. 说明: 目前分词的算法很多,现成的分词组件也不少,但很难找到一个我自己需要的,我只要一个分词功能,一个能理所当然完成分词工作的东西,理所当然是指词库里有什么词就能分出什么词.一些智能分词的目标是毋庸置疑的,难度也是随着智能的程度而增加,不是你我(只少不是我)随随便便走在大街上就能突发奇想出来的.一些成熟的分词方法是基于词库的,本着DRY原则以至于DRO(Don't repeat others),君要了解请看这里或直接Google.其中的不足,思路

[python] 使用Jieba工具中文分词及文本聚类概念

前面讲述了很多关于Python爬取本体Ontology.消息盒InfoBox.虎扑图片等例子,同时讲述了VSM向量空间模型的应用.但是由于InfoBox没有前后文和语义概念,所以效果不是很好,这篇文章主要是爬取百度5A景区摘要信息,再利用Jieba分词工具进行中文分词,最后提出文本聚类算法的一些概念知识. 相关文章: [Python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒 [python爬虫] Seleni

11款开放中文分词引擎大比拼

来自: http://blog.csdn.net/matthewei6/article/details/50610882 在逐渐步入DT(Data Technology)时代的今天,自然语义分析技术越发不可或缺.对于我们每天打交道的中文来说,并没有类似英文空格的边界标志.而理解句子所包含的词语,则是理解汉语语句的第一步.汉语自动分词的任务,通俗地说,就是要由机器在文本中的词与词之间自动加上空格. 一提到自动分词,通常会遇到两种比较典型的质疑.一种质疑是来自外行人的:这件事看上去平凡之极,好像一点

猜你喜欢

CSS属性表简表

CSS 属性表简表,列出了一些我们常用的CSS的属性. 属性名称属性含义属性值字体属性(Font) font-family 使用什么字体所有的字体 font-style 字体是否斜体 Norm ...

vb.net的GroupBox控件

GroupBox(控件组)控件一般是作为其他控件的组的容器的形式存在的,这样有利于用户识别,使界面变得更加友好(GroupBox控件相当于Visual Basic以前版本的Frame控件).使用控件组 ...

Oracle DG Linux平台物理Standby搭建实例

Oracle Data Guard Linux 平台 Physical Standby 搭建实例 Data Guard 环境: 操作系统: redhat 4.7 Primary数据库: IP地址:10 ...

虚拟主机实现“泛解析”解决方案

文章伊始,我先要说明本文提到到的"泛解析",不是真正意义上的泛解析,而是在虚拟主机中模拟泛解析以实现一个虚拟主机跑多个网站或实现将子目录转换为二级域名的目的! 一.类似解决方案及其 ...

图标文件格式之单色图标详细介绍

图标文件格式有多种,常见的有PNG.ICL.IP,还有就是接下来小编要为大家介绍的ICO格式图标,ICO格式图标一种单色图标,广泛存在于windows系统中的dll.exe文件中. ICON文件有 ...

Windows XP无法切换键盘时要怎么办？

Windows XP无法切换键盘时要怎么办? 1.在任务栏中的语言栏图标上,鼠标右键单击"设置"按钮 2.进入"文字服务和输入语言"设置 ...

Word如何三步完成项目画流程图

第1步:画草图首先我们要对流程图有一个整体的构想,最简单的方法,就是将初步构想先用笔在纸上画出来,并反复修改定形.草图有助于整理我们的想法,当然你也可以跳过这一步直接在Word中制作. 图1 流 ...

12个完美呈现“大气”的酷炫网站设计

高居在设计师杀人灭口排行榜第二名的"大气"元素今日现身江湖,据优设微信聊天区的同学说,这类网站淋漓尽致地,异常深刻地,一针见血地诠释了"大气"的本质.对此, ...

photoshop cs6原版安装和永久激活图解教程

下载解压后进入Adobe CS6,双击Set-up.exe 等待欢迎界面出来后,选择[试用].(这点很重要,别点错了哦 ) 创建ADOBE ID(注册资料随便听写即可,无需断网或拔网线) 点击创建后来 ...

对网上盛传的两千万泄漏数据的简单分析

最近网上盛传两千万酒店用户数据泄漏,出于好奇,我也从网上下载了一份下来.本次下载纯粹是出于学习和研究用,不会做什么坏事,不要问本人要下载地址,大家自己找.由于本人并不是学统计和数据挖掘方面的,所以只能 ...

史上最全的PHP正则表达式（手机号需要加上177-***）

首先看下正则表达式思维导图: 一.校验数字的表达式 1 数字: ^[0-9]*$ 2 n位的数字: ^\d{n}$ 3 至少n位的数字: ^\d{n,}$ 4 m-n位的数字: ^\d{m,n}$ 5 ...

android中文api(85)——HorizontalScrollView

前言本章内容是android.widget.HorizontalScrollView,译为"横向滚动条",版本为Android 2.3 r1,翻译来自"Tina&quo ...

获取Android设备的方向，使用加速度重力传感器

带有g-sensor的Android设备上可通过API获取到设备的运动加速度,应用程序通过一些假设和运算,可以从加速度计算出设备的方向获取设备运动加速度的基本代码是: SensorManager s ...

乒乓葡萄一元一斤没人要果农已打算更换品种

品种无优势,种植量太大,天公不作美每年的7月底,正是"乒乓葡萄"大量上市的季节,但在金华市农产品批发市场,做葡萄生意的邢老板的摊位上,根本看不到"乒乓葡萄"的 ...

sqlite-安卓的登录问题，各位大神，帮帮小的

问题描述安卓的登录问题,各位大神,帮帮小的账号输的是数据库的,为什么还是显示账号错误啊解决方案求大神解答,快快快,大哥们解决方案二: 检查你自己的代码有没有逻辑错误,排查数据有没有你输入的账 ...

运营石家庄人才网一年来的运营收获

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅运营石家庄人才网已经一年时间了,在 ...

如何查找和注册已备案过期域名

根据相关规定,目前使用国内空间建网站,域名都需要已经备案的域名,很多人觉得比较麻烦.其实有一些域名已经备案过,由于没有续费,即将过期被删除,我们可以购买这些域名来暂时使用,省去备案的麻烦. 那么,要如 ...

《为自己工作——世界顶级设计师成功法则》—第2章2.2节设计学院没有教你的事

2.2 设计学院没有教你的事终身学习会让你对自己和自己的专业有更多的认识,但不幸的是,设计学院常常会忽视这些部分. 我召集了一些设计专业的研究生,让他们写下他们希望能在学校里学到的内容.下面这些是我 ...

asp.net-net,vs学生管理系统sql2005,有可用源码与数据库说明,只需连接打开,帮我录个演示视频

问题描述 net,vs学生管理系统sql2005,有可用源码与数据库说明,只需连接打开,帮我录个演示视频因毕设急需演示视频,本人sqlserver无法连接上,急需吧友根据我的可用源码打开程序连接数据 ...

让大数据助力全球能源互联网

"建设全球能源互联网大数据实验室是具有战略性.有益于时代的大事."1月26日,中国科学院院士徐宗本在国网智能电网研究院全球能源互联网大数据实验室揭牌仪式暨第一次学术委员会会议上,表 ...

Linux搭建SVN（CollabNet Subversion）服务器可视化界面

最近一程序员友人给了我这样一个页面,顿时感觉SVN也可以这样管理的高大上,尽管svn已经不像当年如此风光,但是还有很多公司在使用它. 所以也是出于感兴趣就尝试着安装了一下,还算是比较顺利的,但是中间也 ...

全面剖析康奈尔大学“红云”项目

近日,康奈尔大学高级计算中心发布了"红云",一个基于订阅的按需研究计算服务.该项目致力于让更多的研究人员和学生使用康奈尔大学的HPC计算资源,进行科学研究与发现,从而促进科研成果的 ...

开源Math.NET基础数学类库使用(11)C#计算相关系数

原文:[原创]开源Math.NET基础数学类库使用(11)C#计算相关系数本博客所有文章分类的总目录:http://www.cnblogs.com/asxinyu/p/4 ...

OpenSSL 发现致命漏洞，三分之二互联网沦陷

由于互联网基础安全协议OpenSSL的漏洞存在时间较长,波及范围广(超过三分之二互联网站受到影响),攻击简便且不会留下痕迹,其对全球互联网尤其是网络金融和电子商务行业的冲击将难以估量. 研究者近日在互 ...

小伙建废品回收网站要当“昆明最牛破烂王”

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客站长团购云主机技术大厅唐世奎喜欢看一些成功人士法 ...

Android源码中的目录结构详解_Android

Android 2.1 |-- Makefile |-- bionic (bionic C库) |-- bootable ( ...

苹果ipad air/ipad5关闭后台程序方法

具体步骤 1.在ipad中我们连接按两次"主屏Home"键即这个和ios6没有区别 2.按了两次home键之后大家会发现,出现的与ios6完在不一样了. 3.这里我们如果想要关闭 ...

大哥们！！C#编程有六个textbox，和4个button，这4个按钮控制上下左右，上和下分别使文本框加减1，左右换文本框

问题描述各位大哥,求助C#编程有六个textbox,和4个button,这4个按钮控制上下左右,上和下分别使文本框加减1,左右换文本框解决方案解决方案二:这个文本框加到9后,再加就为0,大哥们求 ...

ie打不开

问题描述当我双进ie时,弹出错误提示,如何解决,谢谢! 解决方案你可以用360来修复 IE修复就好了.解决方案二:有什么提示呢?解决方案三:重新装一个浏览器吧, 这里是程序遭到破会,所以打不开: ...

关于Struts2 Dispatcher分发器的线程安全问题

问题描述查看Struts2StrutsPrepareAndExecuteFilter这个类可以看出在服务器进行初始化时,调用了这个类的init化方法dispatcher=init.initDispa ...

热搜

© 2024 iVAN | info#iamivan.net | 12 q. 0.019 s.