robots.txt和Robots META标签的使用

我们知道，搜索引擎都有自己的“搜索机器人”（ROBOTS），并通过这些ROBOTS在网络上沿着网页上的链接（一般是http和src链接）不断抓取资料建立自己的数据库。
对于网站管理者和内容提供者来说，有时候会有一些站点内容，不希望被ROBOTS抓取而公开。为了解决这个问题，ROBOTS开发界提供了两个办法：一个是robots.txt，另一个是The Robots META标签。

一、 robots.txt
1、什么是robots.txt？
robots.txt是一个纯文本文件，通过在这个文件中声明该网站中不想被robots访问的部分，这样，该网站的部分或全部内容就可以不被搜索引擎收录了，或者指定搜索引擎只收录指定的内容。
当一个搜索机器人访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果找到，搜索机器人就会按照该文件中的内容来确定访问的范围，如果该文件不存在，那么搜索机器人就沿着链接抓取。
robots.txt必须放置在一个站点的根目录下，而且文件名必须全部小写。
w3.org
http://www.w3.org/robots.txt
w3.org:80
http://www.w3.org:80/robots.txt
w3.org:1234
http://www.w3.org:1234/robots.txt
w3.org/
http://w3.org/robots.txt
2、 robots.txt的语法

"robots.txt"文件包含一条或更多的记录，这些记录通过空行分开（以CR,CR/NL, or NL作为结束符），每一条记录的格式如下所示：
　　　　"<field>:<optionalspace><value><optionalspace>"。

在该文件中可以使用#进行注解，具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始，后面加上若干Disallow行,详细情况如下：

时间： 2024-08-02 04:20:44

robots.txt和Robots META标签的使用的相关文章

robots.txt和Robots META标签

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅作者:平文胜我们知道,搜索引擎都有自己的"搜索机器人"(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库. 对于网站管理者和内容提供者来说,有时候会有一些站点内容,不希望被ROBOTS抓取而公开.为了解决这个问题,ROBOTS开发界提供了两个办法:一

robots txt 写法-robots.txt 写法 robots.txt 写法

问题描述 robots.txt 写法 robots.txt 写法 User-agent: * Allow:/html/ allow:/index.php$ allow:/index.html$ Disallow:/ 以上只收录html和首页,这样写对吗解决方案 SEO 必备--robots.txt写法robots.txt的详细写法实例分析Robots.txt写法解决方案二: 嗯,应该是对的,具体的写法可以去参考百度开发者网站上的,里面有各种详细的配置解决方案三: $表示匹配后面任意字符.h

Robots.txt编写似雷区稍有不慎“毒害甚深”（一）

每个人都有自己的隐私,网站也是这样,网站中也有不希望被蜘蛛看到的东西,比如会员密码等等,而想要遮挡住这部分隐私,一般情况下站长都会在第一时间想到Robots.txt.没错,Robots.txt文件的使用的确可以给蜘蛛指明道路,告诉它什么地方该去,什么地方不该去,也正是因为这点原因,很多站长都热衷于用Robots.txt,但是大家真的会用Robots.txt吗?对于它的编写规则大家又知道多少呢?本人不才,但对于这方面总归有点经验,在这分享出来,让大家有个参考,当然老鸟可以飞过了. Robots.t

Robots META标签和robots.txt文件

我们知道,搜索引擎都有自己的"搜索机器人"(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库. 对于网站管理者和内容提供者来说,有时候会有一些站点内容,不希望被ROBOTS抓取而公开.为了解决这个问题,ROBOTS开发界提供了两个办法:一个是robots.txt,另一个是The Robots META标签. 一.robots.txt1.什么是robots.txt? robots.txt是一个纯文本文件,通过在这个文

Robots.txt 协议详解及使用说明

一.Robots.txt协议 Robots协议,也称为爬虫协议.机器人协议等,其全称为"网络爬虫排除标准(Robots Exclusion Protocol)".网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取.也既是Robots的用法有两种,一种是告诉搜索引擎哪些页面你不能抓(默认其他的就可以抓):一种是告诉搜索引擎你只能抓取哪些页面(默认其他的不可以抓). 当一个搜索机器人(蜘蛛)访问一个站点时,它会首先检查网站根目录下是否存在robots.txt,如果存

robots.txt禁止搜索引擎收录的方法

搜索引擎一．什么是robots.txt文件? 搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息. 您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容. 二. robots.txt文件放在哪里?robots.txt文件应该放在网站根目录下.举例来说,当robots访问一个网站( 比如http://www.abc.

什么是robots.txt?_网站运营

robots.txt 文件对抓取网络的搜索引擎漫游器(称为漫游器)进行限制.这些漫游器是自动的,在其访问网页前会查看是否存在阻止其访问特定网页的 robots.txt 文件. 如何创建 robots.txt 文件? 可以在任何文本编辑器中创建此文件.该文件应为 ASCII 编码的文本文件,而非 HTML 文件.文件名应使用小写字母. 语法最简单的 robots.txt 文件使用两条规则: User-Agent:适用下列规则的漫游器 Disallow:要拦截的网页这两行被视为文件中的一个条目.您

网站优化：robots.txt使用教程

首先,我来介绍一下什么是robots.txt:robots.txt是搜索引擎中访问网站的时候要查看的第一个文件.Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的.当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面.最后,robots.txt必须放置在一个站点的根目录下. 大家可以参考一下谷歌.百度和腾讯的

META标签的常见用法

最近,Danny Sullivan谈到了如何处理的搜索引擎meta标签的问题,以下是一些关于在Google中如何处理这些问题的答案. 多内容数值我们建议你把所有的Meta标签内容放在一个meta中.这将使得meta标签更易于读取并降低发生错误的概率.例如: <META NAME="ROBOTS" C><metaname="robots"c> 如果一行包含对个meta标签,我们将会累加标签的内容,例如,我们会将 <META NAME=&

猜你喜欢

结合 PHP 使用 HTML 表单访问单个和多个表单值

访问能较容易地对用户通过 HTML 表单提交的信息进行操作的能力一直是 PHP 的优势之一.事实上,PHP 版本 4.1 添加了几个访问该信息的新方法并有效地除去了以前版本中最常用的一个方法.本文研 ...

使用Windows DNA 设计、部署和管理一个可伸缩的电子商务网站（2）--来自M$

window|电子商务|设计|伸缩记住记录需要大量的信息,这将允许我们对其他的服务使用那些资源.点击okey.下一个更改是直接进入注册中,工作于注册中的任何时间,记住你想要遵循人们常常讨论的这样一个 ...

分析emlog做站的几点优势与劣势

对于很多站长来说,除了耳熟能详的wp和zblog外,emlog博客也慢慢进入了人们的视野,因为本身足够的简单,所以发展非常迅速.今天就拿自己这几年对emlog的使用心得来总结下它建站的优势和劣势. 优 ...

2012再创新辉煌 SEOer我们该做些什么呢

告别2011,迎来一个充满挑战,充满竞争的2012,一个心灵重生的年代,2012我们需要拯救的不是国家,不是地球,而是自己.命运掌握在我们自己的手中,一切由我们自己掌控.不要被2012世界末日所迷惑, ...

Exchange的防垃圾邮件功能及防病毒功能配置详解

配置防垃圾邮件功能 n 垃圾邮件是指未经用户许可,强行发送到用户邮箱中的电子邮件 n 垃圾邮件具有以下特性: u 收件人事先没有提出要求或同意接收 u 收件人无法拒绝 u ...

MFC绘图1--使用不同DC

//使用HDC绘图 /* HDC hdc; hdc=::GetDC(m_hWnd); MoveToEx(hdc,m_ptOrigin.x,m_ptOrigin.y,NULL); LineTo(hdc, ...

LINUX下CRONTAB RELOAD简介

CRONTAB RELOAD简单研究: ==============================ORACLE下执行 ============================ [oracle@L-D ...

几何画板中怎么以线段为对称轴画对称点

步骤一绘制点和对称轴.打开几何画板,选择左侧工具箱"点工具",在画板空白处任意绘制一点A;选择"线段工具",在点A的附近任意绘制一条线段BC,线段作为对称 ...

photoshop调色的技巧？

"photoshop调色的技巧?"在网络上面收集了9组非常实用效果也很赞的调色方法技巧,非常简单粗暴,效果也非常好,有兴趣的可以自己收藏分类: PS调色教程

php实现多线程

有没有办法在php中实现多线程呢?假设你正在写一个基于多台服务器的php应用,理想的情况时同时向多台服务器发送请求,而不是一台接一台.可以实现吗?回答是当然可以,下面看解决方法回答: 当有人想要 ...

跟主板相关的五则故障

主板"罢工"时,出现的故障现象,可能多种多样.此时,你该采取什么应对措施,来将主板故障快速而有效地排除呢?为此,特意为各位网友提供一些相关故障的快速应对措施. 为什么主板无法正 ...

自定义Flex error tip 样式

核心代码 s="该分类下没有应用"; myTip = ToolTipManager.createToolTip(s,event.currentTarget.x + event.cu ...

GeoHash核心原理解析

http://www.cnblogs.com/LBSer/p/3310455.html 引子机机是个好动又好学的孩子,平日里就喜欢拿着手机地图点点按按来查询一些好玩的东西.某一天机机到北海公园游玩, ...

基于事件驱动的DDD领域驱动设计框架分享（附源代码）

补充:现在再回过头来看这篇文章,感觉当初自己偏激了,呵呵.不过没有以前的我,怎么会有现在的我和现在的enode框架呢?发现自己进步了真好! 从去年10月份开始,学了几个月的领域驱动设计(Domain ...

遍历-要将数据库中以字符串形式存在的表达式写入if..else if...else if代码中，怎样做到

问题描述要将数据库中以字符串形式存在的表达式写入if..else if...else if代码中,怎样做到如题,本来可以一直用if...else if... 把所有的表达式都遍历一遍以找出吻合的项 ...

巴西金融市场全线崩跌：股市暴跌9% 汇率暴跌7.5%

随着国内政治危机深化,巴西股市.债市.汇市周四全线暴跌. 此前有报道称,巴西总统特梅尔涉嫌收买已入狱的前众议院议长Eduardo Cunha,让后者闭嘴. 巴西圣保罗交易所Ibovespa指数周四下跌 ...

敦煌找到了一个支点用智慧旅游撬起一座智慧之城

人口仅20万,年接待游客人数超过800万",这就是敦煌,一个处于沙漠.戈壁包围的城市.敦煌的历史古老而久远,它是丝绸之路上的咽喉锁钥,在中华历史的长卷上谱写了光辉的篇章.因为历史和大自然的馈 ...

配置NFS服务器及客户端

网络http://www.aliyun.com/zixun/aggregation/10619.html">用户信息服务(NIS)使你可以在你的网络中创建账户并在所有的系统共享.这个账 ...

Java反序列化漏洞利用的学习与实践

本文讲的是Java反序列化漏洞利用的学习与实践, 利用DeserLab 建议你在阅读本文之前,先阅读<攻击Java反序列化过程>,这样你就会对java反序列化有一个比较清晰的认识.除此之外 ...

诺基亚展示柔性屏幕：可折叠10万次

在http://www.aliyun.com/zixun/aggregation/33721.html">2014年信息显示学会(SID)会议上,诺基亚展示了两款高分辨率可折叠OLED ...

两个List View记录移动

问题描述两个ListView记录移动两个ListView记录移动C# 解决方案解决方案二:在ListView2中创建新的ListViewItem,其内容来自于ListView1中的要移动的ITEM ...

触摸屏-linux输入子系统测试部分的问题(int)count/sizeof(struct input_event)

问题描述 linux输入子系统测试部分的问题(int)count/sizeof(struct input_event) int main(void) { int buttons_fd; int key ...

关于java中applet问题，我的程序无法在html中显示出来，请问哪出问题了。

问题描述关于java中applet问题,我的程序无法在html中显示出来,请问哪出问题了. 该程序是要画一个余弦图形. import java.applet.*; import java.awt.* ...

编程-C++新手问题(死亡循环体)

问题描述 C++新手问题(死亡循环体) case 3: //题三 { while (x == 1) { cout << "编程实现:从键盘输入任意多个整数(以输入字符a结束输入) ...

全球移动IM势力图:微信稳步上升 BBM冲击市场

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 移动互联网时代,移动聊天工具已经抢走了传统社交网络的风头. ...

13招神技让你在数据科学和数据分析工作中脱颖而出

然而,可悲的是,只有不到30%的数据科学项目最终实施了.我备受打击的意识到我的努力被浪费了.但是,我不是唯一的一个.几乎,每一个分析家都有同样失望的感觉. 即使在今天,数据科学行业面临的真正挑战是企业 ...

点击新闻&amp;quot;添加&amp;quot;按钮提示　路径不是合法的形式。请各位朋友忙我看看问题出在哪！

问题描述点击新闻"添加"按钮提示路径不是合法的形式.更新.编辑.删除功能都是正常的．//添加新条目privatevoidButton2_Click(objectsender,S ...

中电信号百业务规划：加强支付与积分体系建设

10月12日下午消息,中国电信集团公司.中国电信号百信息服务公司的副总经理高宏亮表示,号百业务是中国电信转型的重要业务,未来将在接入.支付体系与积分合作三方面推进此项业务发展. 2009年APEC经济 ...

急救！关于将字符串转变为uniqueidentifier为什么老出错？？

问题描述帮忙看一下吧,SQL数据表有一个字段是uniqueidentifier类型的．向这个表中这个字段插入字符串:这个字符串是一个QueryString.newGuid(Request.Query ...

php xmlreader simplexml DOMDocument等读取xml的例子

要处理 XML 文件,有两种传统的处理思路: SAX 和 DOM . SAX 基于事件触发机制,对 XML 文件进行一次扫描,完成要进行的处理: DOM 则将整个 XML 文件构造为一棵 DOM树,通 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.022 s.