次世代搜索引擎,百度谷歌的挑战者出现了
大家这两天刷微博时,可能刷到过这样一个话题。
大意是出现了一个新的搜索引擎,叫【Magi】。
其名字源于日本动画【新世纪福音战士】里的超级电脑 Magi。
非常牛X。
从名字的寓意和一些大佬的评价中。
大家或许隐约能感觉到这款搜索引擎跟百度、搜狗有所不同。
甚至有一些野心。
既然如此,我们不免要问 Magi 几个问题。
-
你是谁?
-
准备干嘛?
-
你跟传统搜索引擎有什么区别?
当然,问问题的是大家,回答问题就是我了。
Magi 是什么?
输入一个关键词就能见分晓,比如骗子。
先别管得出的结果是孙宇晨、李笑来还是马云哈
我们注意下这个搜索结果的构成。
上方左侧是一些标签化的、逻辑自成一体的数据。
上方右侧是标签化数据的来源。
下方则是一大堆相关链接。
这些标签或链接,都是 Magi 机器学习的结果。
并非我们常见的关键词命中。
假如我们在百度搜索骗子。
得出的结果通常不会这么规范。
甚至有些模糊。
看起来只是关键词和网站权重累积的结果。
所以在 Magi 官方的定义中。
Magi 是基于机器学习的信息抽取和检索系统。
它能将任何领域的自然语言文本中的知识提取成结构化的数据。
就跟我们手动画满思维导图的笔记本类似。
只不过笔记本提炼的是语文、数学某一科内容。
Magi 则自行提炼互联网所有文本。
最终呈现出现的结果都有一套自己的结构、模式。
Magi 准备干嘛?
我们已经知道 Magi 会主动提炼互联网上所有的文本。
背后的逻辑或技术叫机器学习。
得到的结果是结构化的,有自己的模式。
那么想象一下,在脑海中问自己一个问题:
潮老师是谁?
通常大脑会有一个加工的过程。
2018 年我第一次看到他的视频。
男性,是个数码博主,隶属锋潮评测室等等。
但实际上我们脑海可以直接浮现出答案:
他是锋潮评测室的数码编辑。
因为我们大脑在长期进化和思考的过程中。
已经形成了一套模式。
可以迅速理解这个问题关键所在。
并给出精确的答案。
Magi 检索提取信息的过程也是这个意思。
通过不间断的机器学习。
理解繁杂信息中的关键内容。
得出准确的回答。
举个栗子:
比如我们搜索【特斯拉 型号】两个关键词。
看 Magi 的结果:
它可以直接给出有哪几个型号。
而谷歌、百度、DogeDoge 则是根据关键词和网站权重排名的链接。
需要我们自己点进去挖掘有用的东西。
要是搜索结果前面是广告。
后面有几百页。
工作量可想而知。
所以 Magi 正在做的是:
收集并自行理解互联网的海量文本。
当用户搜索时,给出直观、准确的回答。
对使用者而言,Magi 主动学习的过程。
其实是人们与搜索引擎新的、更高效的交互方式。
这种新的交互方式。
对个人、企业都是一种进步。
当然,因为机器学习的特殊性。
这个准确又有两层含义。
一是实时性。
它可以7*24 小时不断的学习。
大概 5 分钟就能了解突发新闻知识。
二是可信度。
随着学习内容的增加,它可以自行纠错,评估结果的可信度。
跟传统搜索引擎的区别?
在第二个问题中。
我们已经有了一些结论。
相对传统搜索引擎,Magi 有两个优点:
首先,Magi 搜索是主动学习理解用户的过程。
而不是人为操纵的竞价排名。
用户也就可以跳过无数下一页。
直达准确结果。
这是对百度等传统搜索引擎营销平台的革新
第二个优点则是更快和主动纠错能力。
促使搜索结果可信度有不断提升的可能性。
在传统搜索引擎中,除非用户主动查看、更新。
搜索通常结果都是固定的。
无论正确还是错误都不会随时间修正。
可信度就成了搜索结果价值的体现。
想象一下,要是百度有这样一套系统。
莆田系肯定都是 0 分可信度。
毫无价值。
But!
Magi 的缺点也很明显。
这种明显是从目前来看。
因为每次要学习大量文本。
所以搜索过程稍显漫长。
因为刚开始学习,学习成绩一般。
得出的结果有的准确,有的不准确。
只能搜索文本,图片、视频则不行。
……
起码现在完全无法取代百度。
偶尔还会遇到 504 警告。
当然,我觉得目前最严重的问题还不是功能和稳定性。
而是其搜索结果具有倾向性或偏见。
缺少传统搜索引擎的过滤机制。
机器学习前景再广阔。
再理性无差别。
人为干预也还是有必要。
一条尾巴
事实上,有少量搜索引擎,比如专业搜索引擎 WolframAlpha 已经这么做很久了。
但一个主动学习,而不是被动优化的搜索引擎。
Magi 确实是国内公众熟知的首个。
并且其理念符合今天 AI 用于辅助人类决策的趋势。
但怎么说呢。
Magi 本质是一种搜索技术。
Magi 搜索则是一张壳。
百度、搜狗、360 任何一家都可以借鉴。
这是 Magi 作为先驱者的意义。
最终更好还是更坏却是未知的。
微信搜索【锋潮评测室】