从一个站的统计数据谈seo和搜索引擎
用一个站的统计数据来谈seo及搜索引擎
从事互联网2年,一直从事技术,但在网络运营方面却是一片空白,真的很尴尬。前阵子决定自己做一个站训师,为以后从技术转向运营做铺垫。
由于没做过运营和网站推广,运营方面的朋友也不多,不太可能做链接交换。而我只是做站,只是一点点的流量交换真的对不起别人。想了想,对我来说最快最可行的网站运营方法就是seo,用seo做网站运营和网站推广,更接近技术,上手更快。所以我看了很多seo信息,不管是来自seo教程网站还是那些利用seo作弊获取流量的网站。我能读的都读了。但是写这篇文章的目的不是告诉你如何使用seo教程,更不是教你如何用seo作弊。毕竟刚学,seo教材资料也挺多的。我的写作当然没有别人的好。我只是想用我米站的一些数据来建立一些关于搜索引擎和seo的假设,然后推测一些结论。最后可以再讨论一下,希望能共同进步。
好了,废话少说,先说说我米站的基本情况。我的网站是一个小说导航网站(http://www.duomimi.com/,小说迷之家)。基本思路是把各大小说网站的小说素材全部收集起来,然后整理出来放到我的网站上。用户访问我的网站,可以同时搜索到几大小说网站的所有小说素材,点击观看。同时他们还可以看到各个站的排名、推荐、更新等信息。好了,不说了,不然大家都以为我在AD。
首先是网站开发。界面仿照hao123,采用最简单方便的asp访问。也是因为我的400mb虚拟空间只支持asp和access。系统只有四个页面,分别是index.asp(首页)、list.asp(列表页)、search.asp(搜索页)\bookReader.asp(详情页),一天就能完成。其中主页还做了一个生成静态页面的模板(由于服务器空间有限,无法将所有页面生成为静态页面,非常遗憾!将动态页面生成为静态页面是非常重要的。搜索引擎更喜欢静态页面,所有官方对搜索引擎的描述中都有说明)。下一步是数据收集。首先选取了5个小说网站,分别是起点中文、小说阅读、茶、潇湘、新浪阅读。然后,编写一个程序来自动收集数据并将其保存在sqlserver数据库中。花了两天时间。大概收集了19万条,最后手工将数据导入access(这里还有一个小插曲,因为access数据库是单文件单用户的,所以功能非常有限。不能写保存过程,只能用asp的Recordset对象翻页。每次你把所有符合条件的结果都放入内存,然后分页,我的19万条数据每次都放入内存,然后我从里面取出20条。可以想象速度和占用的内存量。所以这里教你一个小技巧,就是在每一条要分页的数据上加一个字段,标明它出现的页数,这样你每次只需要寻找这一页的数据。而且,如果将来数据增加或减少,您只需使用加比树算法再次更改页字段即可解决问题。另一个令人头疼的问题是access没有全文检索。所以数据搜索基本靠喜欢。我做过测试,如果数据量超过20000,可能会出现内存溢出。这个问题没有别的办法解决,只能自己建立倒排索引。这是我在使用access处理大量数据时遇到的两个问题和解决方法。抛砖引玉吧。)
网站建成后,完成数据收集,安装51la免费流量统计,做好搜索引擎跟踪器,开始实验。我已经上线20多天了,没有做任何推广。我只在贴吧里发了帖子(还好有个帖子被顶起来了)。流量中,60%来自百度搜索引擎,16%是回头客,16%是贴吧(即置顶帖),其余来自其他搜索引擎。基本统计和记录如下:
(这里有个问题。去年9月份左右申请了自己的域名和空间,但是放了一个垃圾系统之后就再也没管过。所以在我痴迷之前,这个域名已经被bd和gg收录了,但是只收录了不到10页,所以我没有花太多时间让搜索引擎收录我,只是让搜索引擎重新检索我的网站)
我再给你看两个数据,就是bd和gg的搜索机器人(bot)每天拿我网站的次数。(如图)
好吧!现在,让我们开始分析。首先,我们来谈谈网页的设计。没有框架,没有多余的ajax,所有内部链接都加了标题,没有关键词隐藏堆砌,没有同色链接。也就是说不存在seo作弊。(注:以下假设和分析仅代表我目前的部分观点,不一定正确。希望大家也能分析一下,指出我哪里错了)
1现象
这是我在题目里写的:——朵咪咪的花式小说家-青春校园|散文|奇幻小说|小说连载|灵异恐怖|短篇小说|小故事
灵异推理|童话寓言|言情小说|网络小说|历史武侠|武侠小说。搜索结果显示我在“青春校园短篇小说”的长尾里
关键词是第一。
假设:
页面的关键词主要是根据标题标签中的关键词来确定的,但是把标题中的关键词堆起来是没有用的。只有第一个关键字将作为你的网页的主要关键字,相关排名将建立在搜索引擎的索引上。
2现象
同时bd录了1170,gg录了17。非常不同
多假设:
前人说的是对的,bd对新站感兴趣,而gg对新站有考验期的,考验时间肯定在20天以上!
现象3
bd机器人每天搜索的次数变化很大,而gg每天的搜索的次数比较稳定。但是bd搜索的页数和收录的页数差不多,而gg搜索的页数和收录的差很远
假设:
bd对于新站是来着不惧,有多少收多少。只要是爬下来的页,只要没有作弊,都收录上去先。而gg爬的页不会马上放上去。是扔了还是放在什么地方了就不知道了。
现象4
假设主页的深度是0,主页上的内链接是1,深度为1的页上的内链接为2以此类推,深度越潜的页面搜索的次数越多
假设:搜索引擎对深度潜的页面更感兴趣,可能使用这种方法来判断更新的数据,当确定潜层页面的数据都没有
变化了才继续往下爬。所以做站一定要时常更新,而且把更新的东西放得越潜越好,不要藏起来。
现象5
搜索引擎收录的页面中我的search页面比例最大(bookreader页是我后来加上去的以前没有)。
假设:搜索引擎不喜欢列表页,更喜欢详细页,作为判定的方法估计主要是通过内链接的数量来判断,我的search页的内链接很少,基本都是外链接。所以它把我的search页当成是详细页了。
现象6
我在期间加了一个页面bookreader页,用户点击小说名称后不再直接打开小说页面,而是进入我的bookreader页面,就是说我把以前的外连接变成了内链接。结果第二天,几乎所有的搜索引擎的搜索数量都变少了。
假设:搜索引擎很讨厌对页面内链接的改变。所以尽量不要随便改动页面的内链接。
现象7
每次搜索一次list页会隔比较长的时间再搜索下一个页,而bookreader和search页则会相隔的时间较短。
假设:由于list的内链接多,而bookreader和search页内链接多,所以可能bd每天收录的新链接数是有一个极限的。就是说,每天就收你这么多个链接,而这个数量应该对不同的站不同,我计算一下,我的站应该是在3000~4000左右
现象8
今天bd对我的搜索次数忽然有几十变成1000多
假设:现在还没有弄清楚怎么回事,要看以后的变化,可以肯定的是我没有对站做过什么改动,只是每5分钟更新一次主页而已。难道是对我的站升级了??
目前为止就想到这8个现象,以后我会继续跟踪并回帖分析的。算是抛砖引玉吧,希望大家一起来讨论
相关文章
-
你认为按职称加工资好还是按工龄加工资好?
文章来源:老铁商城2020-01-06 -
月薪5万,要求你出国务工2年,中途不得回家,你愿意吗?
文章来源:老铁商城2020-01-06 -
公司派我去非洲工作,每天1000元补助,要不要去?
文章来源:老铁商城2020-01-06 -
是什么让你坚持上班没有离职呢?
文章来源:老铁商城2020-01-06 -
我已60岁,企业破产了,负债一千多万,怎样东山再起?
文章来源:老铁商城2020-01-06 -
如果腾讯、阿里、百度同时聘用你,你会选择哪一个公司?为什么?
文章来源:老铁商城2020-01-06 -
如果你痴迷钓鱼,每月给你10000块,钓遍全国的工作你愿意干吗?
文章来源:老铁商城2020-01-06