如何判断一篇文章是否原创
如何判断文章是否原创
文章是否原创,搜索引擎在技术上应该无法做出绝对正确的判断,甚至是大致正确。无数站长辛辛苦苦的原创文章,往往排在很多垃圾博客的转载甚至收藏里。到目前为止,我认为搜索引擎判断一篇文章是否原创的标准有以下几点:文章被收录的时间,网站上的链接,网站的权重。
文章收录时间:十年前你的文章被收录,十年后我的一篇一模一样的文章被收录。当然,你的文章是原创的。但是收录时间短不好判断,因为权重高的博客收录更快。我的文章是五天前发表的,但是没有被收录。结果你转载了我的文章,几分钟后就收录了。如果搜索引擎认为你的文章是原创,我的是抄袭,那我岂不是太委屈了?
网站上的链接:这应该是判断原创标准最重要的一点。如果你的文章末尾有一句话:文章转载于某个SEO博客,或者网站的某些关键词上有该关键词的链接,那么判断你的文章是否转载自该博客应该会更准确。因为如果链接到文章的页面,判断还是比较准确的,如果链接到站点的域名,还是比较难判断的。你不能总是把你的文章链接到他的博客上。结果你所有被他转载的文章都被搜索引擎认为是原创了吧?
网站权重:这个SEO的人应该能多了解一点。搜索引擎认为一篇高权重、高PR的博文更有可能是原创的。
其实判断一篇文章是否原创还有一个标准,就是查看网页的创建时间。比如你文章的页面是去年创建的,而我的是今年才创建的,而且文章内容一模一样,那么十有八九我会转载你。如果还是不能理解,就想想我们常用的Word和Excel。经常看到他们最后一次修改时间吗?我们经常利用复习时间来安排。我相信这种记录修改时间的技术对于百度和谷歌来说绝对不是问题。这个技术问题应该是任何一个程序员都能解决的吧?不知道现在百度和谷歌有没有用这个技术?当然这个技术也是有缺陷的,就是如果我的文章是原创的,那么我可能会经常修改,所以我的文章最后一次修改的时间可能比转载我的文章要晚。这个搜索引擎可以记录同一篇文章的所有修改时间来解决这个问题,这个技术也很容易实现。但有两个问题:第一,这意味着多少工作量?百度和谷歌索引的不是电脑上的东西,也不是网站上的东西,而是几千亿的页面。记录每个页面的修改时间,对于搜索引擎服务器的工作量和响应能力来说,不知道意味着什么样的压力;另一方面,即使判断页面是首次创建的,如果站长删除了首次创建页面的原始内容,换成了另一个人的文章,又如何判断呢?
写了这么多,可以看到每种判断方法都有自己的优缺点,搜索引擎应该也特别希望做出正确的判断。但是,不考虑技术问题,光是评判标准就够让人抓狂的了。毕竟搜索引擎只能按人的命令运行。如果不能给出绝对正确的判断标准,那么搜索引擎就无法解决这个问题。
相关文章
-
你认为按职称加工资好还是按工龄加工资好?
文章来源:老铁商城2020-01-06 -
月薪5万,要求你出国务工2年,中途不得回家,你愿意吗?
文章来源:老铁商城2020-01-06 -
公司派我去非洲工作,每天1000元补助,要不要去?
文章来源:老铁商城2020-01-06 -
是什么让你坚持上班没有离职呢?
文章来源:老铁商城2020-01-06 -
我已60岁,企业破产了,负债一千多万,怎样东山再起?
文章来源:老铁商城2020-01-06 -
如果腾讯、阿里、百度同时聘用你,你会选择哪一个公司?为什么?
文章来源:老铁商城2020-01-06 -
如果你痴迷钓鱼,每月给你10000块,钓遍全国的工作你愿意干吗?
文章来源:老铁商城2020-01-06