网站不收录怎么办?权重不够,买点友链;外链不够,多发点;文章不是原创,好好写。一个问题,有那么多的答案,可是我们不能靠猜测去工作。今天我给大家说说我认为的网站收录的影响因素。
很久以前光年论坛的张国平老师就提出一个公式:网站收录量=页面抓取量×页面质量。收录本来就是靠蜘蛛抓取,能被蜘蛛留下的页面就是质量高的,这个公式的正确是大家不会怀疑吧?我们来看下面的分析。
页面抓取量应该和你的服务器,网站程序有关系的,如果它们对百度蜘蛛的访问不干涉、不限制,都很正常很稳定。另外外链的作用呢,基本就是两点1、提 高其他网站对你的投票数2、引蜘蛛。如果你的外链发到位了,能引来蜘蛛,而且服务器正常,那么你网站已经做好一半了。其实这个是很好做的,一 般站长进行网站建设会选择虚拟主机,找个有口碑的品牌,你的网站一般不会有这些问题,网站程序不是自己开发的话,那么主流的开源程序默认都不对蜘蛛进行干涉,所以程序也不会有问题,所以这个方面大家基本可以忽略。
页面有哪些类型呢?我认为页面有这些类型:1、链接型2、文字型3、图片型。如果一个页面既有图片又有文字,那么我们可以将其分到文字型,因为这种页面还是文章主导。链接型是一个页面里面内容以链接为主,最明显的是导航站的页面,其实门户也是一个链接页面。链接型和图片型不在我们的讨论范围之内,因为现在多数网站还是主打文字型,多数页面甚至全部都是文章。所以我说文章是目前收录的主导因素。
我们细细说下文章页面的细节问题。判断一个网页是好是坏应该有两个直接因素,文章的质量和页面的布局。这其中最主要的应该是文章质量,最难做的也是文章质量。布局设计到的是用户体验和内链的设计,这点只要遵循基本的seo标准不会出现大问题。我只说两点,第一:内链主要是形成一张链接网,为的是让蜘蛛好爬取;第二:内链主要是为了传递权重,比如栏目页、首页、专题页。抛开用户体验,一个seoer搞页面布局,这两点都做到就是很好了。
然后我们说文章的质量,文章质量这个概念太模糊了。其实站在站长的角度来说网站的质量也有两个点:1、是不是符合用户体验,可读性怎么样?2、不要让百度认为是伪原创,百度飘红不要多。第二点是多数seoer们所认为的。可读性这点应该可以做到,写文章一定要有相关性,而且最好是用户感兴趣的,这样降低跳出率,而有人研究说跳出率也是判断页面质量的因素之一。
剩下的重点是不要让百度认为你是伪原创,或者说原创度很低。搜索引擎判断文章是否为伪原创是有自己的机制的,一般有几种方法:
1、TF/IDF算法,将两篇文章分别用TF/IDF算法计算后,各产生一个内容特征向量,特征向量可以理解成某个词在文章中出现的频率或者次数吧。如果两篇文章的特征向量相近,搜索引擎就认为这两篇文章的内容相似,如果两个特征向量一致,就认为这两篇文章是重复的。
2、信息指纹技术,这种技术指截取一个词,一句话或者一段文字,将之转化为代码,然后这组代码就成为标识这个信息的指纹。如果两篇文章的信息指纹相同,搜索引擎就认为这两篇文章是重复的。
百度鉴证伪原创的方法肯定不止这些,还有一些我在这里没法写出来,都是些很复杂的算法。当然在这里说的或许早就过时了,我想表达的是不要进行伪原创,伪原创的文章瞒不过搜索引擎。
如果你的网站收录不增加,或者索引量不增加,那么你就可以在以上几个方面下工夫。以上仅仅是思想原创文章团队http://www.sixiang.cc/的见解,欢迎大家指正,转载请尊重原创信息。