实例对比分析原创和采集对搜索引擎的影响

  采集是指有着确定方向、明确目的的采撷和记录写作材料的一种活动。它主要指调查采访和查阅和搜集资料。采集最主要的作用在于为写作、分析、报表获取直接的和间接的材料。

  网络采集器是用来批量采集网页,论坛等的内容,直接保存到数据库或发布到网站的一种工具,是一个从目标网页中摘取某些数据形成统一的本地数据库的一个过程。

  这些数据本来只是在可见的网页中以文本形式存在。这个过程所需要的不仅仅是网页爬行器与网页包装器。一个复杂的数据抽取过程需要应付种种障碍,例如会话识别,HTML表单,客户端Java脚本,以及数据整合问题例如与数据集与单词集不一致的情况,以及缺失和冲突的数据。可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容。

  示范网站:

  原创站:http://www.58xiu.cn/ 十字绣城

  采集站:http://www.miaidao.cn/ 密爱岛论坛

  文中数据均来自站长站统计。

  一、基本介绍

  两站建站时间相差大概20天左右。

  密爱岛建站时采集数据3000多贴,目前共有贴数6000多贴。该站建成一个多月后PR值就达到了3.十字绣城全部由会员发贴,转帖占全部贴数的15%左右。该站直到2009年1元1日PR值才达到3

  .二、通过搜索引擎关键词来路分析

  密爱岛通过百度来的,能带来的贴子都是本站会员发问、发表的原创贴带来的。那些采集贴基本没有起到什么作用。每天通过百度来量100来IP。

  十字绣城,由于本站很多贴子都是图纸交流贴。一些会员在发贴时,除有一个文字标题外,内容是直接图片或图纸压缩包。能带事百度搜索的就那些除有文字标题,还有图片描述的贴子。每天通过百度来量1000IP。

  三、原创和转载收录情况

  密爱岛虽然有6000多贴,但目前GG收录2170页,百度收录900多页。

  十字绣城虽然只有5000多贴,但目前GG收录两千页,百度收录三千七百页。

  四、总结

  采集可以让会员一打开一个网站时,就感觉到这个站内容丰富。只能给会员一时的视觉冲击。并不招搜索引擎的喜欢。GG和百度对比,好像GG还好点,至少采集了这么多,GG很给面子的在一个多月就让我的采集站PR值是3了。但这个站通过百度来的量太少,每天也就100来个IP。

  十字绣城虽然内容是一点一点更新的。而且PR值升的也是很慢,但从百度来的量确还不错。这就不得不说,原创更受百度的喜欢。

  密爱岛上发一个贴需要过两天才能看到。而在十字绣城下午发的贴,基本晚上就可以看到收录了。显然这和网站的更新速度有关。

  所以,采集是做给会员看的。我们可以去采集,但一定要有原创。采集适合新站。当使一个新站看起来有一定的规模后,还是要多发原创贴,配合快速的更新,我想,搞好一个网站并不难。

  讲完了,顺便招下友情链接。要求PR值至少是2的,这样的站稳定些。我的QQ402825587

时间: 2024-08-03 17:09:32

实例对比分析原创和采集对搜索引擎的影响的相关文章

MySQL和MongoDB设计实例对比分析_MongoDB

下面通过一个设计实例对比一下二者:假设我们正在维护一个手机产品库,里面除了包含手机的名称,品牌等基本信息,还包含了待机时间,外观设计等参数信息,应该如何存取数据呢? 如果使用MySQL的话,应该如何存取数据呢? 如果使用MySQL话,手机的基本信息单独是一个表,另外由于不同手机的参数信息差异很大,所以还需要一个参数表来单独保存. 复制代码 代码如下: CREATE TABLE IF NOT EXISTS `mobiles` ( `id` int(10) unsigned NOT NULL AUT

实例分析网站更换服务器对搜索引擎的影响

网站更换服务器是网站经常需要遇到的不可避免的问题,可能的原因有很多,比如服务器硬盘损坏,服务器攻击,服务器不稳定,单线服务器导致的部份用户不能访问等等.但是,更换服务器如果操作不当非常容易被搜索引擎惩罚. 公司服务器由于网络的原因,原先是单线路的服务器,直接导致了部份联通线路用户无法访问的,最终决定更换服务器.本来是想通过换IP来避免被降权,从而防止排名往后掉,可灾难还是不可避免的发生了.换IP之后:   一.网站快照更新错误 网站快照是有更新,但是更新的是旧服务器的网站.   二.百度收录倒退

原创、采集对Google AdSense价格的影响

adsense|google|采集|原创 做Google AdSense的人认真研究一下: 基本上我个人认为,采集对于SEO,或者网站排名有不好的影响,不管是你采集别人还是别人采集你,对这些内容而言,都不是好事.搜索引擎喜欢的是独一无二的内容,如果还有其它的网站有相关的链接指向你的内容的话,搜索引擎会更为重视.当一份非常好的内容,被重复了千百遍之后,那么其价值也随之下降,虽然这样,搜索引擎还是努力的试图辨识出哪个是原创的,哪些是复制的内容. 通常,通过时间的先后,和被引用的数量,以及来自于权威网

php中随机函数mt_rand()与rand()性能对比分析_php技巧

本文实例对比分析了php中随机函数mt_rand()与rand()性能问题.分享给大家供大家参考.具体分析如下: 在php中mt_rand()和rand()函数都是可以随机生成一个纯数字的,他们都是需要我们设置好种子数据然后生成,那么mt_rand()和rand()那个性能会好一些呢,下面我们带着疑问来测试一下. 例子1. mt_rand() 范例,代码如下: 复制代码 代码如下: <?php echo mt_rand() . "n"; echo mt_rand() . &quo

原创、采集对Google AdSense价格的影响

做Google AdSense的人认真研究一下: 基本上我个人认为,采集对于SEO,或者网站排名有不好的影响,不管是你采集别人还是别人采集你,对这些内容而言,都不是好事.搜索引擎喜欢的是独一无二的内容,如果还有其它的网站有相关的链接指向你的内容的话,搜索引擎会更为重视.当一份非常好的内容,被重复了千百遍之后,那么其价值也随之下降,虽然这样,搜索引擎还是努力的试图辨识出哪个是原创的,哪些是复制的内容.通常,通过时间的先后,和被引用的数量,以及来自于权威网站的链接,可以作出一定的判断,可是难免有时会

分析原创、伪原创、采集收录及排名区别

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 最近两天一直忙着做项目,做本身网站开发和网站的代码优化,,连给自己定的每天在A5发一篇原创文章的要求都没有达到,真是有点郁闷了.但是总起来看,今天心情还是不错的,我的一个小站www.25stoneage.cn关键词做到了百度首页,还是令我很高兴的,闲话不多说,步入正题,我们来讨论一下原创,伪原创和采集的在收录和排名的区别. 相信做过站长的心里

对比分析垃圾站和正规站SEO优化的异同之处

刚接触做站的站长总是很容易纠结于一个问题,那就是到底是做正规站好还是做垃圾站好?似乎让人们比较容易接受的就是垃圾站的"寿命"总是长不过正规站,但又不得不承认做垃圾站能够更快地赚到钱,只要你的SEO优化技术到位.但一旦随着我们做站经历和经验的增长,这样的心态便会很快地消失,因为只要你做的站不违法,垃圾站确实是做站赢利的一条相对"捷径",而正规站更是值得站长长久发展的志向所在,如何让两种站都赢利才是作为站长最应该关心的问题. 无论做垃圾站,抑或是正规站,要想让网站获得较

谈谈原创、伪原创和采集内容对SEO的价值

一个完整的站点需要丰富的内容才能够撑起正常运营,然而对于个人运营的中小型站点而言,内容则是非常难获取的,特别是原创内容,如果每天都要自己动手操写的话,很少有人会坚持得下去,毕竟天天写,谁有这么多经验心得可写呢?当写不了原创时,伪原创内容就慢慢的开始占据站长更新内容的最佳选择了.在网络上很多站长都对伪原创抱以不耻的看法,但是在说别人伪原创的同时自己却是在一直的更新着伪原创,有的甚至是采集.不管是什么样的内容,笔者认为,只要在网络上会出现的那么一定有它的道理.今天笔者给大家讲讲原创.伪原创.采集三者

Swarm、Fleet、Kubernetes、Mesos - 编排工具的对比分析

本文讲的是Swarm.Fleet.Kubernetes.Mesos - 编排工具的对比分析,[编者的话]此篇文章是<Using Docker>一书的作者 Adrian Mouat 编写,详细对比分析了Swarm.Fleet.K8s以及Mesos的区别. 大部分软件系统是随时间演进的,新旧功能会交替,不断变化的用户需求意味着一个高效的系统必须能够迅速扩展或收缩资源.为了达到接近零宕机的需求,一个单独的数据中心需要自动地将故障转移到预设的备份系统. 在此之上,一些大型企业经常会运行多个这样的系统或