&">nbsp;
前面的2篇文章都详细说明了Google搜索引擎算法的3大因素:域名级关键词和链接的权威特征,域名级关键词不确定性特征和品牌,页面级关键词特性和社会化指标。下面我们就开始讲解页面级链接和关键字的使用。在最近的几年里,网页特定链接特征一直是相关指标中排名最高的,虽然社会因素现在也起到了一定的作用,并慢慢在加大。我们总结发现一个非常有趣的事情,在一般情况下,部分匹配锚文本比精确匹配锚文本关联性更好。下面就有一些各种不同的因素对排名的相关性影响指标:
呈现正相关性由高到低排序为:0.28、页面权威性;0.25、部分匹配锚文本的根域名链接数目/部分匹配锚文本的外部链接所传递的MozRank/到页面的(或:c类)ip地址数目/部分匹配锚文本的外部链接数目;0.24、根域名链接数目/完全匹配锚文本的外部链接传递的MozRank/子域名链接数目/精确匹配锚文本的根域名链接数目/c类ip地址followed(或:nofollowed)链接数目/精确匹配锚文本的外部链接数目/外部链总接数目;0.23、外部juice-passing链接数目/根域名followed链接数目;0.22、外部mozRank/从部分匹配锚文本链接传递的mozRank;0.21、倒页面的所有链接数目/部分匹配锚文本链接数目/根域名nofollowed链接数目;0.2、从完全匹配锚文本链接传递的mozRank;0.13、完全匹配锚文本的外部链接百分比/到页面的内部链接数目;0.09、外部链接百分比/部分匹配锚文本的内部链接数目;0.07、完全匹配锚文本的内部链接数目。
从上面这些因素可以看出,在做链接建设过程中,特别是外部链接,部分匹配锚文本要比完全匹配的权重更高,这点很让人意外,另外还有一个呈现负相关的:-0.15、c类ip地址followed链接百分比。当然在所有的链接中链接的多样性同样影响着排名,域名级链接远比页面链接来的实际,这就说明了首页链接的重要性,特别是单向链接。
接下来主要是针对页面关键词的布局和使用的一些数据特征,这些特征描述了页面上HTML代码中特定部分(Title元素,H1,ALT属性等)使用关键词术语/短语对页面排名的影响情况。下面让我们来看一下,同样按照相关性由高到低排序:
0.09、关键词是网页标题的第一个词/关键词在页面的重复次数;0.08、标题中的第一个词语/图片alt属性包含关键词/页面标题的TF*IDF;0.07、页面主体内容的TF*IDF/关键词是h1的第一个词;0.06、关键词出现在meta描述中/meta关键词标签中;0.05、第一个关键词出现位置距离页面顶部的距离;0.04、页面标题中关键词匹配数目。
这些相信大家都可以看的懂的,不多解释,上面提到了一个名词:TF*IDF,解释下: TF-IDF(term frequency–inverse document frequency)是一种用于信息搜索和信息挖掘的常用加权技术。在搜索、文献分类和其他相关领域有广泛的应用。使用TF*IDF可以计算某个关键字在某篇文章里面的重要性,因而识别这篇文章的主要含义,实现计算机读懂文章的功能。
TF-IDF的主要思想是,如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TF词频(Term Frequency)指的是某一个给定的词语在该文件中出现的次数。IDF反文档频率(Inverse Document Frequency)的主要思想是:如果包含词条的文档越少,IDF越大,则说明词条具有很好的类别区分能力。
报告的最好一部分是关于页面级流量/查询数据的,这些元素描述了关于排名页面的用户+使用的数据(如Google + Bing,搜索工具栏、浏览器和移动设备,而获得了大量的网络流量数据)。同样主要针对google,所涉及到的特征有:点击率、跳出率、分享频率等等一些和用户相关的数据。
本文来源:英文SEO优化:http://www.seotea.com
原文地址:http://www.seotea.com/expert/19