站长必备技能:网站日志分析
一,首先了解一下什么是网站日志:
网站日志确切的来讲应该是服务器的日记;是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件。
二,网站日记的作用:
网站日志既然是记录我们网站运营的情况,那么我们就可以很容易的通过网站日记去发现用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。你还可以通过网站日记查看搜索引擎蜘蛛的爬取情况;比如:哪个IP的百度蜘蛛在你网站访问了多少时间,访问了哪些页面,是什么时候来访你的网站的;返回的HTTP状态码。
在某种情况来来说,搜索引擎蜘蛛来访问你的网站也是有规律的,那么我们在更新网站内容的时候也需要按照他的规律来更新,假如你的网站蜘蛛基本是晚上8点来访你的网站,那么你内容在8点前更新,那么久有利于网页的收录。
三,查看网站日志的方法:
(1)vps服务器的查看方法:
打开IIS,找到你的网站,右键属性;如下图。
(2)点击上图的属性我们回来到网站日志存储的路径如下图:
(3)根据上面提供的路径我们打开c盘找到logFiles这个文件夹:下面就能看到我们网站日志了。
(4)其他空间或者服务器查看网站日记的方法应该是大同小异;
比如阿里云空间就可以直接在控制面板上查看。
四:网站日志怎么看怎么分析
例如这段日志代码:
2016-02-11 01:16:30 W3SVC1291449064 115.28.73.82 GET / – 80 – 220.181.108.84 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 301 0 64
注释:这一记录表示百度蜘蛛在2016-02-11 01:16:30这一时间爬过网站根目录,通过返回的301状态码表示蜘蛛认为网页内容没有更新或没有修改,64表示蜘蛛下载这一页面的字节大小
再来看一个例子:
2016-02-08 11:44:36 W3SVC1291449064 115.28.73.82 GET / – 80 – 123.125.71.107 Mozilla/5.0+(Windows+NT+5.1;+rv:6.0.2)+Gecko/20100101+Firefox/6.0.2 301 0 1236
注释:表示2016-02-08 11:44:36这个时间段;用户IP:123.125.71.107访问了我们的网站(115.28.73.82是我们服务器的IP)用户的操作系统跟浏览器Windows+NT+5.1;+rv:6.0.2 Mozilla/5.0+ 1236表示字节;301返回的状态码;GET代表请求方式。
五;各大搜索引擎蜘蛛的英文名称:
百度蜘蛛:Baiduspider谷歌蜘蛛:googlebot搜狗蜘蛛:sogou web spider好搜蜘蛛:haosouspider必应蜘蛛:bingbotSOSO蜘蛛:Sosospider雅虎蜘蛛:Yahoo! Slurp
总结:作为站长我们必须懂得网站日志的分析,并且把它当作自己的习惯让自己经常看,这样更利于我们对网站的了解对百度蜘蛛爬取的了解!