站长新闻

robots.txt协议的写法，对其SEO的作用

文章来源：老客SEO 作者：老客SEO 人气：10 2019-10-18 09:00:59

f04da2db11220faeba191b

1，robots.txt是什么鬼?

我们都知道txt是纯文本的意思，而robots是机器人的意思，所以robots.txt文件就是给机器人看的，那么也就是给我们搜索引擎蜘蛛看的；robots.txt遵循的一个规范文本，它告诉搜索引擎（Google、百度、360、搜狗等）哪些网页可以抓取，那些网页不可以抓取。蜘蛛 spider（Googlebot/Baiduspider）来抓取你的网站页面的时候，会首先访问你的网站/robots.txt路径看是否存在，如果没有则全站抓取，否则按照设置规则进行抓取和索引。

比如：淘宝的robots.txt规则：

User-agent: Baiduspider

Disallow: /

User-agent: baiduspider

Disallow: /

它的意思就是屏蔽百度蜘蛛的抓取；

2，robots.txt作用

（1）、屏蔽一些死链，屏蔽一些关于网站后台，内部信息，会员资料的页面，对网站的隐私有明显的保护效果；比如前几年淘宝的支付宝用户信息泄露事件，一时间许多用户的资料都在谷歌搜索页面出现，支付宝也怪不了goole，所以后来淘宝屏蔽了搜索引擎的全站抓取。

（2）屏蔽动态页面，比如我们通过url重写将动态网址静态化为永久固定链接之后，就可以通过robots.txt设置权限，阻止Google或百度等搜索引擎索引那些动态网址，从而大大减少了网站重复页面，SEO优化起到了很明显的作用，重复页面多了必定给搜索引擎不好的印象！

3，robots.txt存放位置：

一般我们创建好robots.txt直接上传到网站根目录下面，放于其他目录均为无效；因为一个robots.txt只能控制相同协议，相同端口，相同站点的网页抓取策略。

4，robots.txt的写法：