20 80 法则:搜索引擎暗规则之二

我以前曾经写过20/80 法则 重新阐释,这里从新提一下:
20/80法则也叫二八定律,即巴莱多定律。巴莱多定律是19世纪末20世纪初意大利经济学家巴莱多发明的。他认为,在任何一组东西中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的,因此又称二八定律。
在搜索引擎的设计上,可以说大多数的搜索引擎在搜索结果上第一页有80%的结果是相同的,不同的只有20%。可是正是这20% make different.
这20%的差别也是不同搜索引擎之间的差距,能够完善这20%将对一个搜索引擎来说是至关重要的。
在另外一方面,对于一个搜索引擎的完善,例如你可以花20%的努力做到80%的效果,而要想提高剩下的20%的效果也许要耗费80%的精力。
一个简单的例子,一个搜索引擎现在还比较初级,也许分词和搜索相关的准确率在80%左右,想要进一步提高,也许要调整40,50个参数,调整很多方面的因子,考虑很多的算法,花了极大的精力后发现只提高了一点,再调整,如此三番,也许很久一段时间后发现有90%了,这个10%就是大的突破,但是要花去的努力要比从0%到80%大的多的多。
搜索引擎各项参数的差距也许只有几个百分点,可是这几个百分点就是真正的差别,就真得创造了胜者和失败者。
从搜索的方面看,20 80 法则有另外的意义,80%的搜索集中在20%的少量关键词上,也就是说有20%的搜索词汇占了80%的总体搜索流量。搜索的词频可以通过搜索引擎的每天的统计得到,在某一些特殊的情况,这些分布可以用来对搜索引擎进行非常好的矫正工作。

时间: 2024-10-11 20:46:19

20 80 法则:搜索引擎暗规则之二的相关文章

马太效应:搜索引擎暗规则之一

中国人有句古话叫做:"学以至用".若干年我一直对这句话封为神灵,因为只用致用才能看到学的效果,了解到学的不足,享受到学的快乐.搜索引擎在过去两年的发展并没有大突破,但是却逐步走向成熟,走向商业.正是这两年的时间,部分的业余时间都用来做一些开发和研究,当我逐渐了解的更多的时候,也是我结束单枪披马的时候.未来的兴趣也许会转向分类技术,因此希望能够用这个系列为这段成长岁月化上句号.所谓暗规则,其实就是一些生活中非常显然的规则,只不过在搜索引擎这个领域表现的不是那么的突出,之所以不够突出,原因

破窗理论:搜索引擎暗规则之三

首先解释一下什么是破窗理论:"破窗理论"体现的是细节对人的暗示效果,以及细节对整体影响的扩展性 美国心理学家詹巴斗曾经做过一个"偷车实验 ",将两辆一模一样的轿车分别放在一个环境很好的中产阶级社区和环境比较脏乱的贫民区,结果发现贫民区的车很快被偷走了,而另一辆几天后仍然完好无损:如果将中产阶级社区的那辆车的天窗玻璃打破,几个小时后,那辆车也被偷了. 后来,在此实验基础上,美国政治学家威尔逊和犯罪学家凯林提出了有名的"破窗理论":如果有人打坏了一栋

羊群效应:搜索引擎暗规则之四

"羊群效应"是指管理学上一些企业的市场行为的一种常见现象.例如一个羊群(集体)是一个很散乱的组织,平时大家在一起盲目地左冲右撞.如果一头羊发现了一片肥沃的绿草地,并在那里吃到了新鲜的青草,后来的羊群就会一哄而上,争抢那里的青草,全然不顾旁边虎视眈眈的狼,或者看不到其它还有更好的青草. 羊群效应的出现一般在一个竞争非常激烈的行业上,而且这个行业上有一个领先者(领头羊)占据了主要的注意力,那么整个羊群就会不断摹仿这个领头羊的一举一动,领头羊到哪里去吃草,其它的羊也去哪里淘金.搜索引擎这个市

搜索引擎潜规则:精文转载与采集天壤地别

转载就一定会被降权吗?搜索引擎优化中,内容执掌网站命脉,因此能原创的原创,做不到原创的伪原创,甚至工具采集.然而姑且不论伪原创是否可以真正瞒天过海取得内容优化效果,文章转载与采集是否性质等同呢?大多人认为"转载"就是"采集",而区别主要在于转载是人为行动,"采集"则更多的被定性为人为编制程序代码所为.殊不知,在搜索引擎优化过程中,搜索引擎潜规则对于两者的定性却截然不同,本文就此分析: 一:转载与采集的区别在哪里 互联网每天的新闻有多少是重复信息?

20/80长尾定律及其网络营销案例

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 长尾简单地说,就是当商品存储.流通,展示的场地和渠道足够宽广,商品生产成本急剧下降,以至于个人都可以进行生产,并且商品的销售成本急剧降低时,几乎任何以前看似需求极低的产品只要有人卖就有人买. 营销篇 例:一个书店出售的书籍是有限的,但是在一个电子商务网站上,可以随意上很多书店摆放不下的偏门书籍,一年可能只有一个人买一本的书籍!在网站上只是一条

与其猜测搜索引擎排名规则不如做好用户体验

每当搜索引擎改变一次搜索引擎排名规则时,站长们便开始猜测,开始心慌意乱,这次谷歌又推出了蜂鸟排名规则,一时间,站长又开始担心,这种排名规则会不会颠覆以往的排名方式,从而让网站排名进行较大的洗牌,而影响到自己的网站流量.这根本就是一种多余的担心,不管搜索引擎的排名规则如何改变,只要我们从用户的角度出发,做好用户体验即可. 其实,这次谷歌的蜂鸟排名规则,这是搜索引擎规则的一个小小改动而已,意在为用户提供更加吻合和精准的信息.当用户搜索一个关键词时,把更准确的信息展示给用户.主要针对的是长尾词,而不是

用户体验设计:研究客户的需求观的20个法则

网页制作Webjx文章简介:如何有效收集与分析客户需求? 在项目开发中,所有的项目风险承担者都对需求分析阶段备感兴趣.这里所指的风险承 担者包括客户方面的项目负责人和用户,开发方面的需求分析人员和项目管理者. 对商业用户来说,他们后面是成百上千个 供货商,前面是成千上万个消费顾客.怎样利用软件管理错综复杂的供货商和消费顾客,如何做好精细到一个小小调料包的进.销.调.存的商品流通工作,这些都是商业企业需要信息管理系统的理由.软件开发的意义也就在于此.而弄清商业用户如此复杂需求的真面目,正是软件开发

搜索引擎收录规则解密:站点为什么被丢弃

排名大幅度波动,时而靠前又时而翻都翻不到,这其中又意味着什么呢?可能是网站被封杀的前兆.那么,为什么会被百度丢弃呢?本文做以下论述:百度收录规则解密. 1.标题中堆砌与正文无关关键字 比较常见的问题,搜索引擎强调标题和网站内容的遥相呼应,在标题中涉及到的关键字,而在内容中却并不存在这样相关的关键字,那么可能会被搜索引擎认为是在作弊.反应了比较严格的规则制度,值得思考的是搜索引擎通过什么样的手段来判断内容与标题的相关性呢?难道标题出现的关键字,内容必须要出现吗?如一个例子:"父亲.爸爸.爹爹&qu

制作PPT演示稿时应遵循的10/20/30法则

你在使用PPT时,是否想过怎样做才能取得更好的效果?一些简单的法则,往往含义深刻,让人受益匪浅.日本著名风险投资家盖川崎(Guy Kawasaki)就提出了PPT演示的10/20/30法则: ·演示文件不超过10页; ·演讲时间不超过20分钟; ·演示使用的字体不小于30点(30 point). 10页:不要用很多的内容来使你的PPT显得很充实,10页足已,太多的内容让人更无法记住重点.而如果你是写给VC(风险投资家),Guy Kawasaki建议要写出以下10个要点:问题.你的解决方案.商业模