新闻内容与我数据库里的任一条有80%的相似度,我就要把它过滤掉。

问题描述

c#能够对新闻内容进行过滤吗。我现数据库有10万多条记录。当我从网上抓取一条新闻时。如这条新闻与我数据库里的任一条有80%的相似度,我就要把它过滤掉。如果要一条一条对比效率太低了。哪位有好的想法啊。将不胜感激

解决方案

解决方案二:
关注中
解决方案三:
我也遇到这种问题,我的初步想法是:对新闻进行分类,提取关键字,比较关键字愚笨的建议,呵呵.帮顶
解决方案四:
也是一个不错的想法啊。如果要更准确的话,还要记住这些关键字的具体位置啊。自已再顶一下了

时间: 2024-12-21 20:34:32

新闻内容与我数据库里的任一条有80%的相似度,我就要把它过滤掉。的相关文章

notificaion-在短信的数据库里添加一条短信未读,怎么实现推送?

问题描述 在短信的数据库里添加一条短信未读,怎么实现推送? /**将发送的短信插入数据库**/ ContentValues values = new ContentValues(); //发送时间 values.put(""date"" System.currentTimeMillis()); //阅读状态 0未读,1已读values.put(""read"" 0); //1为收 2为发 values.put("&q

php加一句如果在数据库里没某条记录,则显示提示消息。判断语句应该怎么改?求大神抱大腿!

问题描述 php加一句如果在数据库里没某条记录,则显示提示消息.判断语句应该怎么改?求大神抱大腿! function xuesheng(){ $c=M('case')->field('id')->where(""upid=5 and state=1"")->findAll(); foreach($c as $k => $v){ $caseid[]=$v['id']; } $wherecase="" and cid in (

每隔两分钟就显示数据库里的10条最新数据怎么做

问题描述 每隔两分钟就显示数据库里的10条最新数据怎么做 解决方案 解决方案二:那就每隔10分钟刷新一下页面了解决方案三:数据查询操作放到Timer控件的Tick事件里,每隔两分钟就显示数据库里的10条记录,查询语句里指明求最新追加的10条记录,如有自增的id则,selecttop10*fromtableorderbyiddesc解决方案四:selecttop10*fromtableorderbyiddesc访问数据库写对就OK了其他只要想办法实现定时刷新就可以刷新页面方法很多..整理了一下第一

select-mysql数据库里只有一条数据为什么查询出来有两条重复的数据

问题描述 mysql数据库里只有一条数据为什么查询出来有两条重复的数据 mysql数据库里只有一条数据为什么查询出来有两条重复的数据 而且两条数据的主键都是一样的. 下面是查询的sql: select a.*,a.prepared_date-now() prepared_date_flag,a.released_date-now() released_date_flag, a.end_date-now() end_date_flag, u.user_type from bidding a inn

点聚 weboffice 怎么能将每次修改的内容保存到数据库里

问题描述 使用的是点聚的Weboffice能不能把每次修改的信息(修改人.修改时间.修改内容)保存至数据库中呢?求Demo. 解决方案 解决方案二:俺也有这个困惑啊,楼主解决了吗?解决方案三:要用image类型的字段存储控件提交上来的二进制文件数据

mysql如何随机抽取数据库里的几条数据

数据库连接这些就不贴代码了,直接粘贴sql语句:  代码如下 复制代码 SELECT `title` , `id` FROM news ORDER BY RAND( ) LIMIT 0 , 5; 随机从new表里取出5条数据,显示id和标题.  代码如下 复制代码 mysql> select username from cdb_members order by rand() limit 0,5; +-----------+ | username  | +-----------+ | Takesh

新闻发布系统的新闻内容上传后要怎么处理

问题描述 新闻发布系统中,发布的新闻内容是像相册里的相片那样存储到服务器里,在数据库中存储图片名称,还是直接把内容以clob格式存储到数据库中呢,要怎么实现?基于struts框架 解决方案 解决方案二:我也在学这个,我还没有考虑到,希望懂得人来回答解决方案三:存储的是流,好象是,到网上找一下很多的...........解决方案四:图片若存于数据库中是这样,也可以只存储图片地址.........!解决方案五:当然是在数据库存储图片路径,图片文件保存到服务器上要是存BLOB你系统传几张图就慢的不行了

jsp读取新闻内容到页面,没有空格,段落问题

问题描述 本人做的是小型新闻网站,一般我们看新闻时候,新闻内容都是段落清晰,并且有空格的,我的新闻内容是从数据库中读到页面来的,发现一个空格都没有,而且从头到尾是一段,不知道该怎么解决这个问题麻烦有经验的大虾指点一下. 解决方案 解决方案二:新闻编写用JAVA编辑器插件,FCEditor,还网上搜下,还有很多的解决方案三:用网页编辑器录入内容.什么效果都可以,例如字体颜色,格式啊.转换后存入数据库.取出来转换再输出.解决方案四:用编辑器能解决你的问题,当然你也可以在录入新闻的时候进行人工排版,自

gridview用accessdatasource绑定时,不能完全显示数据库里的数据

问题描述 比如数据库里有3条数据:字段1字段2123456我用accessdatasource自动绑定到gridview时,只能显示1条但我用this.gridview1.datasource=dt.tables["dt"].defaultview;this.gridview1.databind();这样的时候,全部能显示,这是为什么?并且,我在本机和Web服务器上,都是能正常显示的.就是迁移打一个客户的自己的电脑上时,不正常了,请问这是为什么呢?请大家帮忙解决下!!! 解决方案 解决