归类影响网页排序的几个重要因素
对于中文网站来说,在百度获得好的排名就是SEO工作成功的关键。百度的排序算法异常复杂,但是依据公开的文档,大致可以归类影响网页排序的几个重要因素。
1.页面相关性
页面相关性即用户检索的词和网页内容的匹配程度,比如用户搜索“睡眠面膜”,那么排在前面的页面应该都是和睡眠面膜相关的页面,即搜索到的结果应该是和关键词密切相关的,越相关的页面,在排序方面越会获得更高的加分。如何评价一个页面是否和搜索词汇相关,从算法上来说,有几个重要的指标。
?关键词密度,即当前该关键词在页面文字分词结果中的比例。
?关键词是否出现在重要的位置,如果关键词出现在页面的标题、Meta(兀素可提供相关页面的元信息)、H1~H6等位置,就认为越重要,越相关。
?关键词是否获得外部和内部的投票,比如站内、站外锚文本支持等,获得的投票越多,就会越相关。
2.权威性
主要含义如下。
?权威性包括网站域名是否为政府专用的。gov类,网站的所属权是否为权威的公司或者部门。
?是否普遍受欢迎,包括网站的点击率,即用户在所有搜索结果里面点击打开这个页面的比例;用户在网页的访问特性,比如网页访问时间、跳出时间等。正常来说,搜索引擎很难获取到网站的用户行为数据,但是,目前大部分的网站依赖搜索引擎的网站统计来做流量统计和用户行为分析,因此,搜索引擎以这些数据作为参考就很容易了。比如很多网站站长选择使用百度统计进行网站统计和分析,那么,百度通过借鉴百度统计的用户行为数据进行排序也不是一件很困难的事情了。
3.时效性
网页内容如果与信息相关,那么内容的时效性也是一个排序的依据,因为从用户角度来说,也是希望看到最新鲜的内容。但是时效性和检索词的关系很大,不能全部套用。信息相关的网页一般包括如下。
?新闻网站,各种门户网站的新闻网页,比如新浪新闻、搜狐新闻、网页新闻等。
?即时信息互动网站,比如微博类网站。在搜索引擎显示微博结果的时候,总是优先展现最新的信息,甚至直接按照时间进行倒排序。
4.准确性
页面内容是否能够满足用户检索的需求,甚至满足用户的延伸需求等。满足用户的检索需求即用户打开搜索结果页,里面的内容正是用户需要的。而延伸用户的检索需求,比如用户搜索“SPF15防晒指数”,搜索结果页打开一看,是一个关于SPF15防晒指数的介绍页面,那么页面就具有相关性。如果该页面还有一些很实用的内容,比如SPF15和SPE30的效果相差有多大,SPF的指数是如何定义的,对于用户了解SPF来说,就非常有帮助,这类内容就属于满足用户的延伸需求的内容。
搜索引擎在对搜索结果进行排序的时候,会考虑以上重要的方面,但是整体来看,相关性是第一位的。因此,在对网站进行SEO优化时,一定不能脱离相关性这个基础。在实际网站运营中,很多门户网站会采用投机取巧的方法,利用热词来形成很多文章。比如家居类的网站,每天的新闻中会使用热词做标题,甚至以一些热点事件作为标题,但是文章的主题内容和热词没有任何关系。从短期来看,因为门户的权重比较大,这些文章的标题会吸引来大量关注热词或热点事件的访客,但是因为主题内容不相关,用户过来后会立刻离开,对用户和搜索引擎来说都是一种欺骗,这种行为注定不能持久,最终导致整个新闻或者信息频道,甚至是整个网站彻底被搜索引擎屏蔽。作为SEO人员,必须要意识到这种做法的风险性极高,避免自己做此类事情,也需要严格监督编辑人员不能做此类事情。
随着搜索算法的优化和互联网内容的丰富,以及网民的需求提升,为了能更加符合用户的搜索期望,搜索引擎目前逐渐把地域、业务领域、时效性等因素作为排名的参考依据,而不仅是参考网页的信息。
另外,地域因素在排序中逐渐加大了比例,即在对关键词排名的时候,会参考用户所在地的IP归属,尽量返回和用户目标一致的网页。比如一个用户在北京搜索“旅游”一词,会把“北京”这个地域当作参考因素,和关键词“旅游”放在一起作为参考,对网页进行过滤,因此,北京相关的旅游网页会获得更好的排名;如果在上海搜索“旅游”这个词汇,在返回的结果中,很多是上海相关的旅游网页,就不必奇怪了。
搜索引擎会通过机器学习等方法,对和地域有紧密联系的领域的词汇做专门管理,这类词汇如旅游、天气、交通、酒店、机票等。用户在搜索这些领域的词汇时,搜索引擎会把用户IP所在地域和关键词组合进行查询,返回更符合用户期望的信息。当然这里“地域”这个信息在组合条件中所在的权重,每个搜索引擎是不一样的,这也是不可公开的。在移动端搜索中,地理位置的信息可以通过Meta进行配置,通过定义省份、城市、经纬度的方式进行精准定位,关于移动端的精准定位可以参考本书移动搜索部分的内容。
时效性因素即用户查询某些领域的词汇时,返回最接近的网页数据。比如查询“奥斯卡”这个词汇,搜索引擎偏好显示最近的奥斯卡信息的网页。查询“奥运会”等信息,情况也是如此。
在判断时效性方面,可以基于不同的计算方法。比如通过获悉网页上的时间信息,或者通过分析前后页面的时间信息,来估算对应页面的时间信息。
个性化因素即用户查询词汇的时候,搜索引擎会依据用户的搜索习惯、喜好等,自动返回一些和客户喜好、习惯更相关的词汇。搜索引擎之所以能做到这一点,是因为每个客户在浏览网页的时候,会从客户端请求服务器,服务器会记录用户状态,并返回浏览器一小段文本信息,该小段文本信息就是Cookie(储存在用户本地终端上的数据)信息。主流的浏览器比如IE和Firefox等都支持coolkie的机制,即用户访问哪些网站和网页信息,实际在本地都做了记录。搜索引擎在进行结果推荐的时候,会调用Cooke的数据进行参考,判断用户的偏好,在此基础上,返回和用户偏好最相关的搜索结果,从而展现给客户的是更多个性化的内容。举个例子,某个SEO人员特别关注自己网站的某个关键词排名,可能在谷歌里天天搜索同一个关键词,然后点击自己的网站。可能有一天,当他再搜索这个关键词的时候,搜索引擎自动把他的网页放到了第一位。但是,另外一个SEO人员在同一个地区,搜索同一个关键词,上述网页的排名没有显示在前10位中,这就是Cookie记录的偏好结果的影响。目前,个性化因素已经在搜索引擎和众多商业领域中使用,都是在努力满足用户的偏好需求。
其外,小说、游戏、影视、品牌等领域的搜索引擎都开始逐步设立偏好标准。比如搜索一本小说,会尽量返回小说网站的页面,而搜索一部电视剧,会尽量返回视频网站的页面,这样做的好处是能缩短大部分用户的查询距离,使用户尽快点击搜索结果页,提升用户体验。