网页里注释的内容会被抓取吗?

  很多站长都知道网页代码里面有注释代码这么个东西,其形式是,在HTML里面注释的内容出现在网页源代码,而用户浏览网页的过程中是看不到的。因为注释内容在源代码展现又不会影响页面内容,所以很多人觉得蜘蛛会抓取注释信息并参与到网页的分析排名,于是在网页加入大量的注释内容,甚至直接在注释里面堆砌关键词。

  

  那么网页里注释的内容会被抓取吗?我们先来看看百度工程师是如何回答的:

  问:注释掉的内容否会被百度抓取分析?

  百度工程师:在html中的注释内容,会在正文提取环节忽略。虽然注释的代码不会被抓取,但也会造成代码冗杂的情况,所以能少则少吧。

  很显然,搜索引擎蜘蛛是非常智能的,在网页爬行的过程中是可以识别注释信息,直接忽视掉的,所以注释内容是不会被抓取,更不会参与到网页内容的分析中去。试想一下如果蜘蛛可以抓取注释,而这个注释代码就相当于一种隐藏文本,那么网站主体内容可以通过JS代码调用,仅供用户浏览,而把想要蜘蛛抓取的内容都放在大量的注释信息里面,这样网页展现给蜘蛛和用户的就是不一样的内容,如果你是灰色行业站,那么就可以给搜索引擎一个完全正规的内容展现,逃过搜索引擎的束缚,搜索引擎会官方允许你作弊吗?所以你不论在注释你添加多少关键词,对于排名也没有任何影响。

  那么注释里堆砌关键词会影响排名吗?也是不会的,因为搜索引擎本就直接忽视了注释,不过如何注释内容非常多,反而影响网页样式,影响网页加载速度。所以木木seo如果注释没有什么用,尽量删除保持代码最简化。我们经常说到网站代码减肥,简化注释信息就是减肥的方式之一,优化注释信息益于网站瘦身。

  当然,很多程序员和网页设计师会习惯给网页加注释信息,这是一个很好的习惯,合理的注释信息可以减少寻找信息的时间,让查询和修改代码更便利,所以建议在上线的网页简单的加入注释信息,比如网页各个板块的头尾注释、重要内容部分注释等等,而在线下备份的网页就可以更细化的加入各个部分的注释信息,方便技术人员浏览和修改,这样不仅有益于网页瘦身,同时不影响往后网页的修改。

  作者:木木SEO 文章来自:http://blog.sina.***.**/mumuhouzi 欢迎关注微信公众账号:mumuseo。

时间: 2024-08-03 18:37:08

网页里注释的内容会被抓取吗?的相关文章

百度工程师告诉你网页里注释的内容是否会被抓取

摘要: 很多站长都知道网页代码里面有注释代码这么个东西,其形式是!-注释内容-,在HTML里面注释的内容出现在网页源代码,而用户浏览网页的过程中是看不到的.因为注释内容在源代码展现 很多站长都知道网页代码里面有注释代码这么个东西,其形式是<!-注释内容->,在HTML里面注释的内容出现在网页源代码,而用户浏览网页的过程中是看不到的.因为注释内容在源代码展现又不会影响页面内容,所以很多人觉得蜘蛛会抓取注释信息并参与到网页的分析排名,于是在网页加入大量的注释内容,甚至直接在注释里面堆砌关键词. 那

如何实现对固定页内面内容的自动抓取?

问题描述 现在做一个B/S的程序,想实现在后台能自动抓取别的网站的天气预报内容,然后插入到自己的数据库中,不知道自动抓取的时机是什么?最好是能设置一个时间,在此时间时,然后就抓取内容插入到数据库中.不要那种点一个按钮触发的,要完全自动的,就像服务一样的.也不要C/S的小程序,大家给提供点思路好不好?很急. 解决方案 解决方案二:百度搜索"webservice接口天气预报"解决方案三:客户要求的不用webservice,必须抓取那个网页上的内容.现在的问题在于不知道如何触发写的那个程序执

Google工程师解释Googlebot抓取网页的原理

 前几天我们adsenseaece_39018.php" target=_blank>报道了Google的Matt Cutts确认了AdSense的Mediabot的确是会帮助Googlebot抓取网页的消息,但有部分人不相信Matt Cutts,或者不相信他能代表Google官方.作为Matt Cutts的blog的一名忠实读者,我觉得完全没必要花费篇幅再去特别说明Matt Cutts的权威性.我想说的是,Matt Cutts在是Google品质管理部门的一名高级软件工程师,外界所知的是

这种网页数据,怎么抓取

问题描述 有些网站,打开网页源代码,源代码里面没有自己想要的数据,而明明这些数据在网页上又是显示了的.那请问,这些数据该怎么抓取呢?在源代码里有的数据,我是能够抓取的. 解决方案 解决方案二:应该是用js从服务器取数据并显示.据说js执行完毕没有事件,因此只能设置个定时器,设置足够的时间,到时候用用Document取得DOM数据.解决方案三:那是通过js到后方取数据,然后动态显示上去的,你需要模拟它的提交参数,来获取内容,googleC#模拟提交解决方案四:说明这些数据不是这个网页返回的,而是这

分析搜索引擎如何首先抓取最重要的网页?

搜索引擎面对海量的网页,他们并不是平行的抓取每一个网页,因为无论搜索引擎数据库怎么扩张,都是无法跟上网页的增长速度,搜索引擎会优先抓取最重要的网页,一方面节省数据库,一方面对普通的用户也是有帮助的,因为,对用户来说,他们并不需要海量的结果,只需要最重要的结果.所以说一个好的搜集策略是优先搜集重要的网页,以便能够在最短的时间内把最重要的网页抓取过来. 那么搜索引擎如何首先抓取最重要的网页? 通过对海量的网页特征分析,搜索引擎认为重要的网页有如下的基本特征,虽然不一定完全准确,但是大多数时候确实是这

尽量让搜索引擎抓取和索引更多内容

SEO们经常头疼的一个问题,没有收录.索引就无从谈排名.尤其对达到一定规模的网站来说,使网站充 分收录是个颇令人费神的SEO技术,当页面达到比如说几十万,无论网站架构怎么设计.多么优化,100%收录都是不可能的,只能尽量提高收录率. 但有时候怎么阻止搜索引擎收录也可能成为一个问题,最近越来越成为问题.需要阻止收录的情况如保密信息.复制内容.广告链接等.过去常用的阻止收录方法包括密码保护.把内容放在表格后面.使用JS/Ajax.使用Flash等.今天看到Google网管博客一篇文章,这些方法都不保

如何让搜索引擎抓取AJAX内容解决方案_php实例

越来越多的网站,开始采用"单页面结构"(Single-page application). 整个网站只有一张网页,采用Ajax技术,根据用户的输入,加载不同的内容. 这种做法的好处是用户体验好.节省流量,缺点是AJAX内容无法被搜索引擎抓取.举例来说,你有一个网站. http://example.com 用户通过井号结构的URL,看到不同的内容. http://example.com#1 http://example.com#2 http://example.com#3 但是,搜索引擎

使用php方法curl抓取AJAX异步内容思路分析及代码分享_php实例

其实抓ajax异步内容的页面和抓普通的页面区别不大.ajax只不过是做了一次异步的http请求,只要使用firebug类似的工具,找到请求的后端服务url和传值的参数,然后对该url传递参数进行抓取即可. 利用Firebug的网络工具                                                               如果抓去的是页面,则内容中没有显示的数据,是一堆JS代码. Code                                    

c#用httpwebrequest如何模拟抓取这样的网页信息

问题描述 c#用httpwebrequest如何模拟抓取这样的网页信息 c#用httpwebrequest如何模拟抓取这样的网页信息,下面内容是用fiddler抓取的.CONNECT user.cloudcall.hk:8080 HTTP/1.0User-Agent: Mozilla/4.0 (compatible; MSIE 6.0;Windows NT 5.1) AppleWebKitHost: user.cloudcall.hk:8080Content-Length: 0Connectio