许多的新网站都出现过只收录首页而不收录内页的情况,甚至有的网站首页已经被收录几个月了,而内页却始终不被收录。为什么会出现这种情况呢?其实,新网站出现这个现象不足为怪,这可能是一些搜搜引擎在收录算法上的一个新调整,可能与搜索引擎对新网站进行考核,或者网站确实有一定的问题所致。这里,笔者为您具体列出这些可能的原因。
原因一、新网站处于信任考核期。
站长们都知道大多搜索引擎对新网站都有个考核期,一般考核期在1-6个月左右的时间,有的是连网站首页也不收录,过了一定时间之后才开始收录首页,但是对于内页的收录却更加谨慎,需要过了考核期之后才会开始收录。因此,如果新网站值收录了首页而没有收录内页,则很可能是网站正处于考核期,过了考核期以后内页自然会释放出来,并开始收录。之所以对新网站设立考核期,笔者以为主要要因是搜索引擎要对新网站的站内内容、是否作弊、是否正规、是否备案等各方面有一个考核,防止收录一些垃圾站点、临时性站点,保证搜索引擎收录的正规性和有效性。。
原因二、内页文章质量存在问题。
内页内容的价值不高也是内页不被收录的原因之一。有价值的内页搜索引擎必然会收录的,即使没有及时释放出来,但迟早也会被释放的。而没有多大价值的网页,搜索引擎即使收录了,也会在分析网页内容之后放弃收录的。因为这些网页对浏览者没用,也没人原因浏览这些网页,所以,这些内页搜索引擎不会收录,搜索引擎的宗旨就是为用户提供有价值有需求有用的信息,这样无价值的网页收录何益呢?所以对新站来说,不要采集文章或用伪原创工具,要自己去写,做原创内容。笔者提醒您:创作原创内容时要注意内容的相关性,保证质量,可阅读性强,这样的文章必定会被收录的。
原因三、网站结构存在问题。
如果网站设计出了问题,比如采取许多对搜索引擎不友好的javascript,flash,iframe等来设计网站,或者存在广告弹窗等,都可能引起搜索引擎不收录。要知道蜘蛛是没办法读取javascript,flash,iframe里的内容的,不要过分追求网站美观,而忽略了网站的可用性,有些技术可以使用DIV+CSS来替代。此外,新网站是否改动频繁,不太稳定,包括标题、关键词、描述等,经常改动这些的话也会引起搜索引擎的疑惑,增加搜索引擎的不信任感。
原因四、robots.txt协议问题。
新建站,可能由于站长疏忽,写错了robots.txt里面的限制性语句,结果造成网站内页无法被收录。特别是那些对网站结构没把握的站长,很容易犯这样的错误。而搜索引擎的蜘蛛严格遵守着robots.txt协议,一旦robots.txt协议限制出现问题,必然会引起内页无法被收录,即便解除了robots限制,也会有一段时间的过渡期,过了过渡期才可能会开始爬行这些内容,开始收录。
原因五、内部和外部链接问题。
新网站内页不收录,还跟外链有一定关系,蜘蛛是顺着URL进入我们的网站,当外链建设太少时,蜘蛛很难发现我们的网站,即使发现了也还要经过考核期,所以,这就要求做好外链建设,每天都告诉蜘蛛这边有吃的,蜘蛛才会再次光顾您的网站,爬行次数多了,网页就被收录了。蜘蛛爬取是有规律的,三天打鱼两天晒网式的增加内页,蜘蛛的爬取频率就会降低,收录也就很慢了。此外,做好内链建设,也可以增加蜘蛛爬取网页的数量,有利于新网页的收录。
原因六、空间服务器问题。
如果空间服务器稳定性存在问题,在蜘蛛爬取网站时,正巧刚上服务器抽风,那么蜘蛛就会留下个不好的印象,但是蜘蛛还是会再次关顾,只有多次抓取失败后,才会不再来了。但是当下次抓取又失败时,这就很不好了。当失败次数多了,必然会影响新网站的网页收录。所以,网站空间稳定是网站正常发展的基础,不稳定的空间必然会给网站建设带来相当大的危害,要及时更换稳定性好点的才行。
总体而言,新网站首页收录内页不收录,说明你只成功踏出了一小步,只有脚踏实地更新原创文章发高质量外链,经常查看网站日志,保证网站结构对搜索引擎友好,网站的发展才能走上正途,内页被收录并展现给用户是迟早的事。笔者提醒您:只要你的网站对用户有帮助有价值,那么网页被收录是必然的,我们所要做的是有规律的更新即可。
本文出自云南盈科信息工程(http://www.ynynyn.com/),尊重作者劳动成果,请在转载时注明出处。