感动新做了一个论坛,收录了几个页面之后,收录的页面就没有增长,于是将日志打开来分析了一下。发现了来自123.125.71.95的百度蜘蛛比较频繁,仔细查看了一下这个IP段的蜘蛛,发现这个IP段的蜘蛛代表是来抓取内面收录的,网站权重较低,爬过的内页文章不过很快放出来,因为不是原创,或是采集文章。
感动就比较纳闷了,因为论坛还在建设初期,大部分都是感动自己的原创文章和一些朋友发的心情分享类文章。原创都能保证的。
笔者又对其中一个全部由感动原创的文章的版块抽出来分析。发现这些页面依然是这个IP段的地址访问的多。笔者就纳闷了。更具体的抽出一篇文章“关键词竞争度分析”。又从百度搜索“关键词竞争度”找到相关结果。随便选取了一些页面测试了他们的相似度。感动原创的“关键词竞争度分析”与百度搜索相关结果的相似度基本都在20%以上。最高的一篇相似度达到27%。
大家也可以通过这个网站http://www.webconfs.com/similar-page-checker.php查询自己网站各个页面的相似度。这个相似度的算法与百度的算法可能不太一样。但27%的相似对于两个不同网站的页面来说,确实已经很大了。我们不能肯定百度通过自己的算法得出这两个网页的相似度会更高。但这只是我随便选的两个网页。
这个事实说明,SEO的这个行业都难有原创文章了。因为SEO的知识就是那些,再怎么原创,其核心、表现形式也大同小异罢了。
无独有偶。前一段时间一位朋友问我,他的网站为什么总是在收录的第二天就全部被K掉所有页面。我提议让他原创。可朋友却说原创的也是一样。将他的网站看了一下,这个网站是做淘宝刷钻的。我随便阅读了几篇,发现其中的意思都差不多。看来刷钻也就是那些方法,那些规则。
当一个行业竞争度大到一定程度,没有创新就难再有原创。这对于一个权重不高的网站,尤其是新站来说是非常致命的。我们如何面对这样的情况呢?感动为大家提出了三点建议:
1.网站前期不局限于SEO,可以多做网站推广。有人气的网站才会得到搜索引擎更高的关注。网站建设初期通过适当的推广方法获得人气是吸引搜索引擎抓取页面的必要手段。
2.用内链将整个网站串连起来。这是减少与其它网站页面相似度,增加本网站相关性的重要方法。内链结构要丰富,通过内链指向相关但不重复的页面。不仅可以增加文章的可读性,还能引导流量延伸与转化。
3.利用百度统计工具。网站的优点应该让百度知晓。利用百度统计工具无疑是一个告诉百度网站流量,受众范围,用户体验等信息的好方法。百度为了更加完善搜索引擎算法。我们大胆猜测,它极可能调用百度相关产品的数据。就像百度也调用百度搜藏的信息一样。
当然,如果能够在行业内创新,那就最好不过了。
本文由SEO交互论坛www.seohu.net投稿,转载请注明。谢谢。