什么是robots.txt?_网站运营

robots.txt 文件对抓取网络的搜索引擎漫游器(称为漫游器)进行限制。这些漫游器是自动的,在其访问网页前会查看是否存在阻止其访问特定网页的 robots.txt 文件。

如何创建 robots.txt 文件?

可以在任何文本编辑器中创建此文件。该文件应为 ASCII 编码的文本文件,而非 HTML 文件。文件名应使用小写字母。

语法
最简单的 robots.txt 文件使用两条规则:

  • User-Agent:适用下列规则的漫游器
  • Disallow:要拦截的网页

这两行被视为文件中的一个条目。您可根据需要包含任意多个条目。您可在一个条目中包含多个 Disallow 行和多个 User-Agent。

应在 User-Agent 行中列出什么内容?
user-agent 是特定的搜索引擎漫游器。网络漫游器数据库列出了许多常用漫游器。您可设置应用于特定漫游器的条目(通过列示名称)或设置为应用于所有漫游器(通过列示星号)。应用于所有漫游器的条目应与下列条目类似:

User-Agent:*

Google 使用多种不同漫游器(用户代理)。用于网络搜索的漫游器是 Googlebot。Googlebot-Mobile 和 Googlebot-Image 等其他漫游器遵循您为 Googlebot 设置的规则,您还可为这些特定漫游器设置附加规则。

应在 Disallow 行中列出什么内容?
Disallow 行列出了您要拦截的网页。您可列出具体网址或网址模式。条目应以正斜杠开头 (/)。

  • 要拦截整个网站,请使用正斜扛。
    Disallow:/
  • 要拦截目录及其中的所有内容,请在目录名后添加正斜扛。
    Disallow:/private_directory/
  • 要拦截网页,请列出该网页。
    Disallow:/private_file.html

网址区分大小写。例如,Disallow: /private_file.html 将拦截 http://www.example.com/private_file.html,但允许 http://www.example.com/Private_File.html

更多内容请访问:http://www.google.com/support/webmasters

 

仅当您的网站包含不希望搜索引擎编入索引的内容时,才需要使用 robots.txt 文件。如果您希望搜索引擎将网站上的所有内容编入索引,则不需要 robots.txt 文件(甚至连空文件也不需要)。

示例:

------------------------------------------------------------------------------------------------------------------------------------------

#
# robots.txt for NetMao Movie
# Version 2.0.x
#

User-agent: *
Disallow: /admin/
Disallow: /inc/
Disallow: /html/
Disallow: /templates/

以上是小编为您精心准备的的内容,在的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索什么是robots.txt?
网站robots.txt、网站robots.txt怎么写、网站没有robots.txt、网站的robots.txt文件、修改网站的robots.txt,以便于您获取更多的相关知识。

时间: 2024-07-28 21:17:31

什么是robots.txt?_网站运营的相关文章

百度排名下降的主要原因分析(站长必看)_网站运营

当搜索引擎的算法改变或者加强时,导致一些网站的某些关键字排名消失,一些管理员就说他们的网站消失了.实际上并非如此,在搜索引擎算法改变或加强时会引起一些页面丢失,或者是过滤.惩罚了某一些页面而不是整个网站.   如果是网站的所有页面都消失了(在google中可以直接搜索网站的URL可以得知),可能会是由以下原因造成的:   a.你的服务器在关键的时候出现了故障不能正常访问:  b.你的网站存在robots.txt问题:   c.由于采用不正当的优化手法,你的网站被搜索引擎从其索引中清除了:   如

舍卒保帅:巧用robots.txt提升网站权重

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 这不是什么绝窍,而是向大家提供一种思路. 目前采集站很多,加上百度算法频繁调整,被降权,被K成光杆司令的站比比皆是. 我的新站易拍屋www.epioo.com就更不例外了.这是一个网摘类站点,在会员收藏网页的同时不仅给网页截图还保存原网页代码,即完全备份一个页面,存在高度复制性. 刚开始的时候百度收录3千页每天就有1千多IP,可是好景不长,几

用google 赶快来赚美金附图文使用教程第1/2页_网站运营

申请地址: 透过 Google AdSense 使您的网站产生收益 这就是Google新推出的AdWords 推介广告,当用户通过您的推介注册了Google AdWords,并且花费了第一笔 USD100.00 的广告费,Google就会将 USD20.00 存入您的帐户. * Google AdWords 让广告客户制作广告并在 Google.com 以及 Google 内容网络中加以展示,而内容网络就包含了像您网站这样的 Google AdSense 发布商网站.广告客户可以选择自己的目标受

GOOGLE网站向网站管理员提供的建议一定要看的_网站运营

网站管理员指南 遵循以下指南将有助于 Google 查找.检索您的网站并对其进行排名,这是确保在 Google 搜索结果中列出您的网址的最佳途径.即使您选择不采纳这些建议,我们也强烈建议您密切关注"质量指南",该指南对可导致网站从 Google 索引中彻底删除的一些违禁行为做了简要说明.一旦网站删除之后,Google.com 或 Google 所有合作伙伴网站的搜索结果中都不会再显示该网站. 网站设计与内容指南: 网站应具有清晰的层次结构和文本链接.每个网页应至少可以通过一个静态文本链

什么是真正的网站优化(网站优化的真正含义)?_网站运营

根据新竞争力网络营销管理顾问的研究,网站优化就是通过对网站功能.网站结构.网页布局.网站内容等要素的合理设计,使得网站内容和功能表现形式达到对用户友好并易于宣传推广的最佳效果,充分发挥网站的网络营销价值.  网站优化设计的含义具体表现在三个方面:对用户优化.对网络环境(搜索引擎等)优化,以及对网站运营维护的优化. (1)对用户优化: 经过网站的优化设计,用户可以方便地浏览网站的信息.使用网站的服务.具体表现是:以用户需求为导向,网站导航方便,网页下载速度尽可能快,网页布局合理并且适合

关于网站运营几点个人的体会_网站运营

首先说明,此文不是本人原创而成,在原文的基础上加入了本人多年的运营经验总结.如果有什么问题可直接留言到我的BLOG.  运营者涉及的知识非常多,包含了软件.数据库.搜索引擎.网站布局.市场营销.经济管理等各个方面的知识和智慧.所以在此希望大家能理解并将眼光看得更宽一些,而不是仅仅将关键词选择.链接building作为运营者的核心考核.当然关键词选择是一种智慧之间的感悟,比如机票预定.机票预订,你说客户会输入什么来搜索呢?这是一种大概率事件或者小概率事件的抉择,对于某个关键词,排名会带来的实际的转

创业如何选择WEB开发语言_网站运营

在打算开发一个网站时,选择什么语言,是首先需要面对的问题.目前主流的WEB开发语言有ASP.NET.PHP.JSP; 作为MS上世纪老将ASP,就不再提及,如果是因为维护方面的原因而必须使用,可考虑升级到ASP.NET,而作为新开发一个语言,实在找不到理由再使用它了; 以下将对这三种语言做对比,以供权衡: 上手度 .NET: 5分 PHP:3分 JSP:1分 如果你是一个WEB方面的新手,这三门WEB语言的学习成本差别很大.ASP.net 作为微软的产品,继承了其一贯的特点,方便上手,易用;甚至

使用CDN的优势以及小贴士分享_网站运营

什么文件适合用CDN加载 CDN主要适用于一些静态资源文件的加载,比如javascript文件.css样式文件.字体.图片.视频等其他资源文件.这些文件我们往往放到自己的一些前端服务器中做处理(nginx),使用CDN就可以免除前端服务器部分工作了. 使用CDN的好处 提升网站的性能 使用CDN最大的益处是为你的服务器提供"分流",节省了你的带宽,减少了服务器的压力,很多CDN厂商提供的资源访问服务加载速度还是比较快的(墙内除外). 文件缓存 对于那些被普遍使用的资源文件(比如jque

搜索引擎不收录网站页面的常见原因解析_网站运营

搜索引擎不收录网页的原因:  1.网页使用框架:框架内的内容通常不在搜索引擎抓取的范围之内. 2.图片太多,文本太少. 3.提交页面转向另一网站:搜索引擎可能完全跳过这个页面. 4.提交太过频繁:一个月内提交2次以上,很多搜索引擎就受不了,认为你在提交垃圾. 5.网站关键词密度太大:不幸的是搜索引擎并没解释多高的密度是极限,一般认为100个字的描述中含有3-4个关键词为最佳. 6.文本颜色跟背景色彩一样:搜索引擎认为你在堆砌关键词欺骗它. 7.动态网页:网站的内容管理系统方便了网页更新,却给大部