&">nbsp; 近日来,在交换链接的站长中,百度收录的页面数已经成为了一个重要的因素。虽然,这个页面数和流量没有什么直接的关系,有的站收录几十万页,但流量只有几百,有的站收录几十页,而流量上万。这就和google的PR值是一样的。有的PR6,但流量依然几百,有的没PR,流量几万,这都是正常的现象。但不管怎么说,收录的页面自然是越高越好,就象PR值一样。而且如果没有几个页面被收录,那么就算你优化再好,页面再漂亮,没被收录,自然也没排名。
首先,就是与众不同,百度的喜新厌旧是出了名的,只要你的网页内容与众不同,那一般就没有什么问题,但重要的是现在的大部分网站的内容都是采集而来的,或者大部分是采集的,对于百度来说,如果同一个类型的页面数量过多,就拒绝收录,这也是目前网站收录少的最大原因。
内容是一部分,其实百度更在意的是你的网页结构,比如同一种程序,那么,就算你内容再怎么修改,也是很难增加收录数量,治标不治本。只有从根本上改变网站的结构,这个是最好的办法。例如笔者朋友的一个网站,七步网(77bu.com),他只不过是把影视的目录页和封面页结合在一起,再做些稍微的修改,百度的收录就高达13W,并且在不段的增加,每次增加的数量都是以万计。
其次就是引导,这点很好理解,一般把自己的主页面,例如影视的二级页面,都在站内做好全站连接,这点现在大部分的站都是这样。但是,聪明的站长自然会注意到这个大众化的趋势,从而做些改变来显得自己的与众不同。其实很简单,呵呵,就是在主页推荐些影视,或者在全站的下面推荐些影视,地址全部连接到该影视的目录页,也就是增加目录页的权重。 通过几个站的收录情况,笔者发现,现在百度对于影视类的目录页收录兴趣远大于普通的封面页,权重也大大增加。
那么,按照这个理论,能不能让百度连影视的阅读页也收录呢?要至少一个影视网,如果连阅读页面也算上去的话,那至少几百万个,甚至上千万个页面,这就是个非常恐怖的数字。比如你site下起点,收录的页面也就高达480W,而网易,新浪之类的都是几千万的页面。
针对这个思路,笔者尝试做了个新站,把百度蜘蛛引过来,果然,马上被收录,并且以每周1000篇以上的速度增加,大部分都是阅读页面。因为对新站来说,百度有个考核期,不可能马上就全部收录,肯定有个过程,但如果按这样操作,继续在站外增加权重和站内优化,收录几十万应该没问题,所以建议站长往这方面考虑,而不只是考虑如何优化主页或者频道页。
很多朋友在论坛里发帖说自己的网站看了IIS日志后有被百度蜘蛛爬过但是没有收录的问题,这跟百度的搜索引擎的原理是有关系的首先,搜索引擎会建立一个网页地图(Webmap),记录互联网的链接结构,再使用网页抓取程序(Robot)根据网页地图来抓取(Crawl)质量好的网页,存储到网页快照数据库中。
然后,索引程序(Indexer)会将快照数据库中的网页编号存储到网页索引数据库中,在这个过程中,会利用相关技术去掉作弊网页(Spam)。当用户输入一个查询词搜索时,查询程序会使用这个查询词到索引数据库中比较,经过相关性计算后,按照相关程度对网页进行排序,相关性越高的排得越靠前。相关性的计算是包括各种因素的综合结果,例如:网站标题或网页内容对查询词的匹配、网页被链接的次数等。所以大家只要耐心等待搜索引擎的下次更新就可以看到自己的页面了。
百度收录我想这个问题,一直都困扰着很多做SEO的朋友,或者正在学习SEO的朋友。
那么今天论策就给大家简单说说百度收录技巧
首先要说的是网站本身的问题,很多人都喜欢在网站上线前,就想搞多点内容在上线,就去复制别人的文章或者别人的资料。也可以采取伪原创。
其实这点是错误的,当然网站上线有足够多的数据给百度爬虫爬是好事,但是如果你是新站的话,他爬回去的是重复的内容,那么搜索引擎对你又是一个怎样的看法呢?
我想不用论策说大家都知道了,这就百度收录技巧之一。
第二就是去引百度的爬虫,爬虫就是通过一个起点的网页来进行爬行和抓取内容的,所以新站上线,你找几个百度常更新的地方发点连接就可以了,这是百度收录技巧二。
第三就是
最后我给大家说说几个引爬虫的好地方,admin5 chinaz bianews这两个地方都是百度非常喜欢的地方,大家可以去试试,论策的方法只是个人建议,并不是权威,只是告诉大家一个思路而已,至于如何还是靠自己慢慢发现。
好了文笔到此为止吧。
本文由企赢在线(www.hnqiying.com)首创 转载请注明出处。作者:论策