“相似”“相关”解决方法?

问题描述

大型的新闻类、文章类网站,一篇文章底下会列出相似文章多少篇、相关文章多少篇,这个功能怎么实现呢?

解决方案

解决方案二:
额,这是一个很难回答的问题实际上大多数此类站都是“做假”,基本是“手工”推荐地因为这些在理论上都属于前端数学领域,包括“模式匹配”“聚类分析”“贝叶斯过滤”,“决策论”为了一个小小的网站去动用这些“前端数学武器”很明显并不是一件很划算的事情
解决方案三:
另外lz如果有空的话,可以看看一部美剧《数字追凶》这部剧集对于程序员来说还是有些帮助滴
解决方案四:
是按tag的吧
解决方案五:
引用1楼wanghui0380的回复:

额,这是一个很难回答的问题实际上大多数此类站都是“做假”,基本是“手工”推荐地因为这些在理论上都属于前端数学领域,包括“模式匹配”“聚类分析”“贝叶斯过滤”,“决策论”为了一个小小的网站去动用这些“前端数学武器”很明显并不是一件很划算的事情

+++厉害。一般都是有个字段保存相关的新闻id用个什么符号分割。
解决方案六:
叫tag也好,keyword也好,实际都是手工推荐的如果真要动用“聚类”“决策”这类数学工具,那很难是一般网站能承受的起的
解决方案七:
大部分是按主关键字来实现相关的,而不是真正算法意义上的相关。又或者是同一分类内的内容其实一篇新闻的主关键字经验多了还是很容易提取的另外就是wanghui0380说的手工方式在编辑的时候,顺便按某关键字搜索一下,然后把链接填到文章的相关的那个框框里。这种虽然增加了工作量,但是可控性、准确性比较好。当然,这是那些大网站的做法。对于小网站,还是以主关键字为主。
解决方案八:
引用6楼babyt的回复:

大部分是按主关键字来实现相关的,而不是真正算法意义上的相关。又或者是同一分类内的内容其实一篇新闻的主关键字经验多了还是很容易提取的另外就是wanghui0380说的手工方式在编辑的时候,顺便按某关键字搜索一下,然后把链接填到文章的相关的那个框框里。这种虽然增加了工作量,但是可控性、准确性比较好。当然,这是那些大网站的做法。对于小网站,还是以主关键字为主。

很精辟的讨论学习了
解决方案九:
查找一篇文章里有多少个相似关键字然后排序多的靠前

时间: 2024-09-19 19:39:57

“相似”“相关”解决方法?的相关文章

ThinkPHP表单令牌错误的相关解决方法分析

本文分析了ThinkPHP表单令牌错误的相关解决方法.分享给大家供大家参考,具体如下: 今天在用ThinkPHP做程序的时候,以前用create创建数据的时候,出现了错误提示"表单令牌错误",然后各种百度各种谷歌,得到的网上解答给出了以下的建议 1.清缓存: 用了,我把所有的Cache下的文件都删掉了,并将~app.php和~runtime.php两个文件同时都删掉了,但是没有效果. 2.将TOKEN_ON参数设置为FALSE: 试过了,但是也不行,虽然不提示表单令牌错误了,但是添加到

PHP整数取余返回负数的相关解决方法_php技巧

PHP语言虽然功能强大,但并不代表其没有缺点,在编写代码的过程中未免会遇到一些让人头痛的问题.下面我们将为大家介绍有关PHP整数取余返回负数的解决办法. 我们先来看个例子. 复制代码 代码如下: $res = 16244799483; echo $res%9999999; // 输出结果为 -5069794, 正确的结果应该是4801107 其实这也算上PHP一个BUG吧.最主要是PHP是个弱类型语言.他内置了机器来判断用户的类型. 但是机器毕竟是机器.也有判断出错的时候.就像上面.所以这时候我

Mysql中文乱码及导出sql语句和Excel的相关解决方法

  这几天基于Heritrix写了一个爬虫,用到mysql,在导入导出数据时,遇到一些乱码问题,好不容易解决了,记录一下,以备查看. 一.导出数据. 先说明一下自己的环境:Mac OS X 10.8.3, MySQL Community Server 5.6.10, MySQL Workbench 5.2.47. 我想把本机数据库内的数据迁移到另一台机器上,于是使用Workbench中自带的import/export功能,其实就是调用mysqldump.不幸的是,出现了版本不一致的错误. 错误没

博思得G3000条码机打印模糊及相关解决方法!

在使用POSTEK G3000打印标签的时候经常会遇到打印出的条码或者图像不清晰,很多人可能会误以为是机器的问题,其实这种情况打多数情况跟机器关系并不大.其实要解决打印不清晰的问题,我们可以从以下方面排除 一.碳带和标签不匹配 请更换优质的耗材并选择匹配的耗材进行打印,比如说用PET材料用混合的碳带打,效果肯定没有用全树脂碳带下苹果好. 注意:如果不知道如何搭配耗材,可以详细咨询购买的经销商或者POSTEK技术工程师. 二.打印深度或速度设置不合适 不同的耗材,在进行打印时的深度(浓度)会有所不

JavaScript的常见兼容问题及相关解决方法(chrome/IE/firefox)_javascript技巧

首先这里声明一下,关于我测试浏览器的版本是chrome15.0.874.121 Firefox 8.01 IE9 IETester 下面的代码关于声明 1:获得滚动条的情况 复制代码 代码如下: function getScroll(){        var t, l, w, h;         if (document.documentElement && document.documentElement.scrollTop) {            t = document.do

网站被百度K掉的常见原因与解决方法

对于我们做百度SEO优化的站长来说,最怕听到的就是网站被百度K掉的消息,因为网站被百度K掉之后,无疑是剥夺了我们网站从百度那里获得流量的机会,可是怕归怕,网站碰到了被百度K掉这种状况还是要解决的,因为各个网站被K的原因都不同,所以沙予在这只能总结出几个较为常见的原因与相关解决方法供各位站长参考下! 原因1)网站的内容全靠采集或是转载,可是又不对其进行伪原创修改! 解决方法:比如每天自已是否抽出点时间来写写原创文章,要是实在是没办法撰写原创内容的话,那么站长在采集或是转载其他一些网站内容的时候最好

我的SEO经验谈之网站降权原因与解决方法

当站长发现自已的网站快照不更新,或是百度不在收录网站内容页面,以及本来排名靠前的关键词突然下降的话,那么这个时候的站长就要注意了,因为会出现这种状况的原因是你的网站很可能被百度降权了,那到底是什么原因才导致了网站被百度降权呢?针对这个问题本人总结出四个比较常见的原因以及相关解决方法,各位站长不妨参考参考! 原因1)网站近期遭改动,可能是改动网站关键词,又或者是模板! 只有细心点的站长肯定留意到一个现像,那就是相比较谷歌或者国内其他一些搜索引擎,百度对于网站的改动更为敏感,比如网站随便改了个网站关

phpMyAdmin“无法载入mysql扩展,请检查PHP配置”的解决方法

phpMyAdmin"无法载入mysql扩展,请检查PHP配置"的解决方法 在配置了PHP的运行环境,并且安装了MySQl数据库之后,下面就可以学习下PHP如何与MySQL进行交互了. 既然MySQL是数据库,则必不可少的需要建立数据库.表.字段等操作(假象下我们使用ASP+ACCESS的情形),然而对于MySQL数据库而言,在我们默认安装时是没有可视化界面操作MySQl的,所以我们很多时候是借助phpMyAdmin来操作MySQL数据库的. 然而通过"PHP 5.2.3 i

phpMyAdmin“无法载入mysql扩展,请检查PHP配置”解决方法

在配置了PHP的运行环境,并且安装了MySQl数据库之后,下面就可以学习下PHP如何与MySQL进行交互了. 既然MySQL是数据库,则必不可少的需要建立数据库.表.字段等操作(假象下我们使用ASP+ACCESS的情形),然而对于MySQL数据库而言,在我们默认安装时是没有可视化界面操作MySQl的,所以我们很多时候是借助phpMyAdmin来操作MySQL数据库的. 然而通过"PHP 5.2.3 installer"安装版的使用,当我们应用到phpMyAdmin,页面出现了"