问题描述
大型的新闻类、文章类网站,一篇文章底下会列出相似文章多少篇、相关文章多少篇,这个功能怎么实现呢?
解决方案
解决方案二:
额,这是一个很难回答的问题实际上大多数此类站都是“做假”,基本是“手工”推荐地因为这些在理论上都属于前端数学领域,包括“模式匹配”“聚类分析”“贝叶斯过滤”,“决策论”为了一个小小的网站去动用这些“前端数学武器”很明显并不是一件很划算的事情
解决方案三:
另外lz如果有空的话,可以看看一部美剧《数字追凶》这部剧集对于程序员来说还是有些帮助滴
解决方案四:
是按tag的吧
解决方案五:
引用1楼wanghui0380的回复:
额,这是一个很难回答的问题实际上大多数此类站都是“做假”,基本是“手工”推荐地因为这些在理论上都属于前端数学领域,包括“模式匹配”“聚类分析”“贝叶斯过滤”,“决策论”为了一个小小的网站去动用这些“前端数学武器”很明显并不是一件很划算的事情
+++厉害。一般都是有个字段保存相关的新闻id用个什么符号分割。
解决方案六:
叫tag也好,keyword也好,实际都是手工推荐的如果真要动用“聚类”“决策”这类数学工具,那很难是一般网站能承受的起的
解决方案七:
大部分是按主关键字来实现相关的,而不是真正算法意义上的相关。又或者是同一分类内的内容其实一篇新闻的主关键字经验多了还是很容易提取的另外就是wanghui0380说的手工方式在编辑的时候,顺便按某关键字搜索一下,然后把链接填到文章的相关的那个框框里。这种虽然增加了工作量,但是可控性、准确性比较好。当然,这是那些大网站的做法。对于小网站,还是以主关键字为主。
解决方案八:
引用6楼babyt的回复:
大部分是按主关键字来实现相关的,而不是真正算法意义上的相关。又或者是同一分类内的内容其实一篇新闻的主关键字经验多了还是很容易提取的另外就是wanghui0380说的手工方式在编辑的时候,顺便按某关键字搜索一下,然后把链接填到文章的相关的那个框框里。这种虽然增加了工作量,但是可控性、准确性比较好。当然,这是那些大网站的做法。对于小网站,还是以主关键字为主。
很精辟的讨论学习了
解决方案九:
查找一篇文章里有多少个相似关键字然后排序多的靠前
时间: 2024-09-19 19:39:57