笔者于6月25日发表了一篇《巧用301重定向将404错误转化为网站外链》的文章,谈了一下如何通过301重定向的方式,将从外部得到错误URL转化为可访问的URL,从而达到传递权重的文章。
今天在A5看到了一篇《浅谈利用301重定向将404页面转移成自己外链的危害》,反驳了我之前那篇文章中的观点。我觉得非常好,SEO行业正应该有这种质疑的精神和独立思考的能力。仔细拜读了文章,发现作者误解了我的意思。所以再写一篇文章澄清一下其中的观点,以及介绍一下301重定向的作用。首先我明确两个在《使用301重定向将404错误转化为网站外链》一文中的思路:
文章所讲述的是将404错误URL,通过301重定向回到原文的URL。这点需要说明,我没有在文章提到任何301到首页或者其他页面的意思,文章中的例子,讲述的是从外部(B网站)链入自身网站(A网站),在过程中有可能出现的URL错误拼写、链接添加错误甚至故意产生错误URL的行为。而不是A网站自身出现的404错误。
原文一直在那里,有质疑的朋友可以再仔细阅读一下。以下我再反驳一下这位朋友的观点(蓝字是有反驳意见朋友的观点):
反驳第一段
原作者,将外链指向中的404错误归结于是网站外部造成的,这句话无可厚非,但是这种404错误的出现,也是由于自己网站程序所决定的,既然出现了就没有办法逃避,就比如在A5上页面也可以出现很多个这样活着那样的后缀404页面,直接在后面加入1.html,2.html,就可以了,如此而已,但是如果有人处心积虑的用外链的形式来进行链接这样的网页,那也是为网站带来链接,如此而已,顶多产生一个404页面,而不会有其他。
网站出现404错误,不一定是网站内部程序的问题。蜘蛛通过外部网站(以B网站为例)一个错误的URL爬行到自身网站(以A网站为例),同样会造成404错误,即:错误的URL导致了错误的页面。蜘蛛是不会管你链接URL存在于网站内部还是外部,只要在顺着URL爬行的过程中出现了“页面不存在”的情况,就会记录一个404错误。
这点我们在谷歌管理员工具的“运行状况” — “抓取错误” – “找不到” 一栏中可以明确的看到。404错误被谷歌分为“在sitemap中” (内因)和 “链接到您网站网页的域” (外因)两项。
顾名思义,其中“链接到您网站网页的域”是指从B网站链接到A网站的URL。
反驳第二段
而原作者的意思是如何把握这一方面的权重,想要将这种外链的权重直接倒回去,而不是放掉,这里呢,笔者也有自己的观点,本身这种外链“http://www.xxxxx.com/rich-snippets.htmlGFQ”,这种外链所链接过来的就是404页面,如果你将这些页面301掉,这种情况就和网站中出现大量的404页面,然后直接将404页面301到一个页面的情况是一样的;那么如果你的网站有404页面,那么为了防止这些权重的流失,难道将这些页面全部301到首页?这完全就是不符合搜索引擎的要求,如果想知道清楚的话,就直接百度一下“404页面301到首页的危害就”就可以明白更多。
首先,对于“自身行为”还是“外部行为”,显然搜索引擎有着明确的区分。拿链接建设来说,内链和外链在权重方面的效果是不同的。这点大家都很清楚。其核心思想就是外链是网站站长无法控制的,而内链是站长可以自行设置的。虽然在搜索引擎的发展过程中,出现“可被站长控制的外链”这一因素(就是平常的外链建设)。但无论可控还是不可控,有一个思想是明确的,即谁也不会在别人的网站可以发布正确URL的前提下,却去发错误的URL,导致用户无法正常访问自己的网站或在自己的网站上出现“该网页不存在”的字眼。
其次,对于301到原网页还是301到首页。这点我不想多说,大家都原文就可以明白我的意思。我这里想说的是搜索引擎如何甄别原文的出处的一些信号:
搜索引擎最先在哪里看到内容
诸多同样内容所在的域名信任度
指向哪里的链接最多(原文中的内链)
拷贝是否链接回原始出处(版权链接)
由于第二条信号的存在,我们原创作者很多发布或被转载在其他网站的内容,无法获得好的排名。很多作者也对此有抱怨。但我们可以利用1、3、4点信号将这个错误纠正过来。
百度在这方面做的还不是很好,但谷歌已经可以很快且很准的识别出原文的出处。这就得益于以上3条。而其中“拷贝是否链接回原始出处”这一因素,也是我在《使用301重定向将404错误转化为网站外链》这篇文章中所阐述的目的之一,还有一个目的大家也看到了就是传递权重。
最后,将一个用户无法访问的错误URL,合理的通过301的方式重定向到正确的URL。也对用户体验有所帮助。我们同样在谷歌管理员工具的“抓取错误”中看到了这句话。
Googlebot 无法抓取该网址,因为它指向的网页不存在。通常,404 不会影响您的网站在搜索结果中的排名,但您可以借助它改善用户体验。
解决404错误的方式无非是通过robots.txt屏蔽,或者通过301重定向。我不认为屏蔽后可以改善用户体验。robots.txt的方式只能改善蜘蛛体验。因为用户点击错误URL后,访问的还是一个不存在的页面和看到404错误。
反驳第三段
直接复制原话“如果针对不存在的网页返回 404 或 410 以外的代码(或将用户重定向至首页等其他网页,而不是返回 404),则可能会出现问题。首先,这样就等于告诉搜索引擎通过该网址可以找到实际的网页。结果,搜索引擎可能会抓取该网址,并将其内容编入索引。因为 Googlebot 要使用很多的时间处理不存在的网页,可能无法迅速找到您的网址或频繁访问这些网址,也无法频繁地访问这些网址,从而影响对您网站内容的抓取量(另外,您一定也不希望自己的网站经常出现在 [未找到文件] 的搜索查询中)。”这是404页面的原话,如果你不按照要求继续错误页面的跳转的话,可能出现的情况就是你的网站上出现大量的相同页面,相同标题,相同描述,相同内容,等等,然后这就是不同的URL和相同的内容之间的故事,至于以后会发生什么?这个大家可以自己去百度,自己去google上找找就知道了。
反驳的朋友既然提到了google管理员指南,就千万别忘记摘录另外一段文字:
一般来说,404 错误不会影响您的网站在 Google 中的排名,因此您可以放心忽略这些错误。这些错误通常是由于以下原因导致的:拼写有误、配置有误(例如由内容管理系统自动生成的链接)或 Google 加强了识别和抓取 Javascript 等嵌入式内容中的链接的力度。
要查看无效链接的来源,请点击相关网址。在错误对话框中,点击链接自以下网页标签。如果相关链接来自您的网站,请修复或删除这些链接。如果这些链接来自外部网站,您可以使用这些数据改善网站的用户体验。例如,如果某人本打算链接到您的网站但却输错了网址,那么就会出现拼写有误的合法网址(如 www.example.com/awesome 拼写成了 www.example.com/awsome)。您可以将拼写有误的网址 301 重定向到正确的网址并通过该链接获取预期流量,而不是返回 404 错误。您也可以在将用户定向到 404 网页后,确保帮助他们找到所需内容,而不是仅仅显示“404 未找到”。不过,我们只建议您在错误链接可产生较高流量的情况下采取上述措施。
来源链接:https://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=2409439
很遗憾的是,这位朋友只看到了其一,却没有看到其二。我们在做SEO时,官方的资料非常重要,很多细节都隐藏在其中,需要花大量的时间去仔细阅读和理解。
实际上,谷歌管理员工具中很多设置和说明文字都是有其道理的。只是我们一些SEO不愿意去理解。就像404产生的内因和外因这种事情,在“抓取错误”一项中将它区分开也是有其道理的。而不是闲着没事干就那么做了。
总结:作为SEO,我们要吸取很多知识,同时开拓自己的思路和分析问题的办法。但需要确保你学习的知识是先进的而不是陈旧的。否则自己的思路很容易被误导,从而产生不好的效果。
对观点的争论也是SEO工作中非常重要的一个环节。没有人可以肯定的说自己的理解是正确的,我们只能拿官方透露出来的一些资料和自己通过数据分析得出来的结论来证明自己思路和理论的正确性。
本文由杨帆原创于杨氏SEO,转载请保留链接:http://www.seoyangs.com/404-301-original-page.html