站长新闻

您的位置：老客外链 > 站长新闻 > SEO >

robots.txt和robots Meta标签的介绍

文章来源：未知作者：老客SEO 人气：20 2019-12-01 10:46:36

　　robots.txt基本介绍

　　robots.txt是一个纯文本文件，在这个文件中网站管理者可以声明该网站中不想被robots访问的部分，或者指定搜索引擎只收录指定的内容。

　　当一个搜索机器人（有的叫搜索蜘蛛）访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果存在，搜索机器人就会按照该文件中的内容来确定访问的范围；如果该文件不存在，那么搜索机器人就沿着链接抓取。

　　另外，robots.txt必须放置在一个站点的根目录下，而且文件名必须全部小写。

　　robots.txt写作语法

　　首先，我们来看一个robots.txt范例：

　　# Robots.txt file from http://www.aaa.com

　　# All robots will spider the domain

　　User-agent: *

　　Disallow:

　　以上文本表达的意思是允许所有的搜索机器人访问www.aaa.com站点下的所有文件。

　　具体语法分析：其中#后面文字为说明信息；User-agent:后面为搜索机器人的名称，后面如果是*，则泛指所有的搜索机器人；Disallow:后面为不允许访问的文件目录。

　　下面，列举一些robots.txt的具体用法：

　　允许所有的robot访问

　　User-agent: *

　　Disallow:

　　或者也可以建一个空文件 “/robots.txt” file

　　禁止所有搜索引擎访问网站的任何部分

　　User-agent: *

　　Disallow: /

　　禁止所有搜索引擎访问网站的几个部分（下例中的01、02、03目录）

　　User-agent: *

　　Disallow: /01/

　　Disallow: /02/

　　Disallow: /03/

　　禁止某个搜索引擎的访问（下例中的BadBot）

　　User-agent: BadBot

　　Disallow: /

　　只允许某个搜索引擎的访问（下例中的Crawler）

　　User-agent: Crawler

　　Disallow:

　　User-agent: *

　　Disallow: /

　　另外，有必要进行拓展说明，对robots meta进行一些介绍：

　　Robots META标签则主要是针对一个个具体的页面。和其他的META标签（如使用的语言、页面的描述、关键词等）一样，Robots META标签也是放在页面的＜head＞＜/head＞中，专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。

　　Robots META标签的写法：

　　Robots META标签中没有大小写之分，name=”Robots”表示所有的搜索引擎，可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项：index、noindex、follow、nofollow，指令间以“,”分隔。

　　INDEX 指令告诉搜索机器人抓取该页面；

　　FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去；

　　Robots Meta标签的缺省值是INDEX和FOLLOW，只有inktomi除外，对于它，缺省值是INDEX,NOFOLLOW。

　　这样，一共有四种组合：

　　以下是引用片段：

　　＜META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”＞

　　＜META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”＞

　　＜META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”＞

　　＜META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”＞

　　其中

　　以下是引用片段：

　　＜META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”＞可以写成＜META NAME=”ROBOTS” CONTENT=”ALL”＞；

　　＜META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”＞可以写成＜META NAME=”ROBOTS” CONTENT=”NONE”＞

　　目前看来，绝大多数的搜索引擎机器人都遵守robots.txt的规则，而对于Robots META标签，目前支持的并不多，但是正在逐渐增加，如著名搜索引擎GOOGLE就完全支持，而且GOOGLE还增加了一个指令“archive”，可以限制GOOGLE是否保留网页快照。例如：

　　以下是引用片段：

　　＜META NAME=”googlebot” CONTENT=”index,follow,noarchive”＞

上一篇：网站的相关性权威性实用性下一篇：怎么利用Tags进行SEO

站长新闻

robots.txt和robots Meta标签的介绍

相关文章

站外优化可助关键词排名暴涨!不可忽略

做推广优化收录久不见效?你网络SEO姿势不对!

网站权重下降，原因有哪些?如何处理?

SEO新手如何写出高质量的原创文章呢?

为何网站内容稳定更新还没有关键词排名?

百度SEO优化是如何判断网站的质量吗?

网站优化效果好,文章内容质量是核心

联系我们

站长新闻

robots.txt和robots Meta标签的介绍

相关文章

站外优化可助关键词排名暴涨!不可忽略

做推广优化收录久不见效?你网络SEO姿势不对!

网站权重下降，原因有哪些?如何处理?

SEO新手如何写出高质量的原创文章呢?

为何网站内容稳定更新还没有关键词排名?

百度SEO优化是如何判断网站的质量吗?

网站优化效果好,文章内容质量是核心

其他工具

热门商品

多多上货助手

天涯论坛发帖

伪原创工具

软文推广营销,新闻源发布推广,媒体发稿投放

发新闻稿 门户行业地方网站媒体新闻发布发稿套餐 网络宣传推广

联系我们

发新闻稿门户行业地方网站媒体新闻发布发稿套餐网络宣传推广