准备写一篇文章关于seo优化细节的问题,因为我们常常说道seo要从细节做起,但是谈着谈着就不谈了,为何?因为没有人知道要注意哪些细节,了解了所有的细节也就掌握了seo的机制,这点是最难的,也就是说最基础的也往往是人们做不好的。这篇不再叙述,首先说说特征权重问题。
做seo不研究特征权重我感觉是一件非常荒谬的事情,可是貌似大佬们都不爱说,即使是国内最火最专业的论坛,你看到的也就是外链、内容、锚文本、服务器速度等细节,你甚至搜索不到任何新鲜的玩意,这原本就是不正常的。
对于特征权重,它主要的作用就是影响serp最终结果的一系列的因素,而每个不同的因素所影响的阶段和时间是不一样的,影响的范围也是不一样的。假如你是一线的seoer,你已经掌握了特征权重有哪些,你还需要知道蜘蛛是如何处理的,因为只有处理之后的特征权重才是直观性的数据化显示出来。
互联网上的所有的数据只有两种,离散型和连续性的。连续性的可以计数的,例如外链数量、关键词出现次数等,这些因素的处理直接采用的是计数,但是由于有些数量或许是非常大的,必须取对数来降低影响,这里就有一个问题http://blog.sina.com.cn/s/blog_5dac285301010jpj.html就是数值较大时候,一旦取了对数会不会降低了影响,zero在这里说了大众点评网的关键词密度过高问题,这里其实是有很多问题,在一定度量上,无论是否取对,数量都是呈现正面效应的,只是起到的作用降低了,这就比如一个加速度问题,力变小了,加速度变小了,但是速度还在增加ing的。这算是一个误区了。
对于离散型数据,一般采用svm处理机制,更多的是一个指标的多个纬度,这里最重要的是如何把度大小加入到离散型数据中,是采用带权传递或者给与不同权重分配不一样的比例。不管怎么计算,最终的结果都会呈现出不可控制性,但指标变多时候,不可控制的因素将会大大增加,但是同时也更多范围内满足人们的匹配。
百度和谷歌最大的区别就在于指标的量上是不一样多的,谷歌多,因此所需要的处理能力强,但最终排名会更加的客观,匹配度更加宽广,百度的指标量少,就呈现出中间突出的的状态,这也是两者结果排序最大的差别。
讲了这么多一定有人不耐烦了,这有什么用处呢?我说这个作用太大了,举个最小的例子,很多人看不懂为何某个页面排名异常的好,怎么都思考不出来为何,其实这就是离散型变量的影响,离散型变量呈现的一个最大的特点增加了结果的随机性。
至于如何采用特征权重的处理问题,还有一个最重要的就是结合我们做seo的时候,很多时候她都可以指导我们,比如某个因素做得太好时候,由于会去对数,影响将会降低,我们把握好这个点就可以把工作效率在理论上提高10倍;她也可以帮我们解释很多问题,如根据se的精神,当一个网站原创的文章的不再收录时候,很多人不知道为何会出现这样的机制,亲你知道为何吗?