站长新闻

您的位置：老客外链 > 站长新闻 > SEO >

运营笔记：是时候了解蜘蛛爬取原理了！揭秘收录难题！

文章来源：未知作者：广州灯光租赁公司人气：20 2020-10-12 15:40:14

很多人在做SEO的时候，搞不清蜘蛛爬取的原理或者对收录索引都搞不清关系，这篇文章主要针对实战来讲解蜘蛛和收录的关系，不讲原理，只讲干货和经验。

首先我们提到蜘蛛可能就可能想到IP，比如以下这些；

220.181.108.89专用抓取首页IP 权重段，一般返回代码是304 0 0代表未更新。

220.181.108.94专用抓取首页IP 权重段，一般返回代码是304 0 0代表未更新。

220.181.108.97专用抓取首页IP 权重段，一般返回代码是304 0 0代表未更新。

220.181.108.80专用抓取首页IP 权重段，一般返回代码是304 0 0代表未更新。

220.181.108.77 专用抓首页IP 权重段，一般返回代码是304 0 0代表未更新。

是不是很难理解？但是如果做过网络维护、或者局域网组网的就能明白，其实每个IP对应的就是一台电脑，每组服务器组对应的就是网段。

比如，220.181.108.x这个网段，我们暂且叫收录服务器组，这个服务器组下面有电脑ABCDE，对应的IP，每台电脑上装着相应的收录程序。

那么这样是不是清楚了呢？比如你提交一个链接到百度，那么相当于把这个链接提交到收录服务器组的C号电脑。

比如你提交了1、2、3个链接，这三个链接分别提交到了收录服务器组的C、D、E号电脑，所以你查看日志的时候会发现，这三条链接对应不同的IP，也就是对应着不同的电脑。

那为什么提交3条链接会提交到三台不同电脑呢？我个人猜测，或许提交的数据太多，同一台电脑处理不了，所以采取了分布处理方式。（个人猜测，并非是研究证明，或许是更高级的处理方式）。

我昨天针对这个做了一个测试，写了3篇原创文章，发布后，我以最短的时间查看蜘蛛爬取情况，结果这三篇文章，分别爬取的IP是；

116.179.32.135——服务器1

220.181.108.122——服务器2

220.181.108.180——服务器3

第一篇文章写完后，文章过几分钟秒收录，然后我模仿第一篇写作框架，继续写第二篇，第二篇也过几分钟秒收，然后接着写第三篇，可惜的是，第三篇没有收录。

但第二天，这三篇全部收录，也就是说，第三篇变成了隔天收录。

我又查看了116.179.32.135这个IP，这个IP属于山西省阳泉市联通，目前很多人都奇怪现在出现了116.179.32.X网段的蜘蛛，现在可以确定的是，这个网段就是百度蜘蛛，除了nslookup可以验证外，以下几点也是证据；

另外百度李总裁老家也是阳泉的，所以几个证据足以说明，搜索服务器一部分也搬到了山西。

结合上面实战的经验包括以往收录爬取的蜘蛛分析，只要是链接提交到116.179.32.135，或者220.181.108.122、220.181.108.180等等，那么链接必定收录，所以唯一解开收录密码的难点在于，如果控制链接提交到这些服务器？

甚至有人戏谑称，220开头的是官方蜘蛛，而116开头是老家蜘蛛，呵呵，希望大佬一起来研究这个问题。

上一篇：运营笔记：网站推广最容易忽略的一件事，看你中招没？下一篇：运营总监平时是做什么的？揭秘运营总监地位和公司排位！

站长新闻

运营笔记：是时候了解蜘蛛爬取原理了！揭秘收录难题！

相关文章

站外优化可助关键词排名暴涨!不可忽略

做推广优化收录久不见效?你网络SEO姿势不对!

网站权重下降，原因有哪些?如何处理?

SEO新手如何写出高质量的原创文章呢?

为何网站内容稳定更新还没有关键词排名?

百度SEO优化是如何判断网站的质量吗?

网站优化效果好,文章内容质量是核心

联系我们

站长新闻

运营笔记：是时候了解蜘蛛爬取原理了！揭秘收录难题！

相关文章

站外优化可助关键词排名暴涨!不可忽略

做推广优化收录久不见效?你网络SEO姿势不对!

网站权重下降，原因有哪些?如何处理?

SEO新手如何写出高质量的原创文章呢?

为何网站内容稳定更新还没有关键词排名?

百度SEO优化是如何判断网站的质量吗?

网站优化效果好,文章内容质量是核心

其他工具

热门商品

多多上货助手

天涯论坛发帖

伪原创工具

软文推广营销,新闻源发布推广,媒体发稿投放

发新闻稿 门户行业地方网站媒体新闻发布发稿套餐 网络宣传推广

联系我们

发新闻稿门户行业地方网站媒体新闻发布发稿套餐网络宣传推广