人工智能是泡沫 还是场史无前例的变革?
文/陆奇、梅姗姗
来源:YCombinator创业孵化器(ID:YCCN-startups)
这是陆奇博士关于《技术驱动带来的创业机会》演讲的第七篇。
今天的内容里,博士分享了自己对未来人工智能时代的预测,并深度分析了这个时代存在的各种创业机会。
在这个系列的第一篇文章里,我提到了Alvin Toffler的第三次浪潮理论。
简单的来说,未来是知识驱动的时代。这是过去60年才开始的,却是速度、规模和效应最快的。通过知识的重组,人类可以用更少的资源,更快速创造可以满足需求和欲望的东西。所以能否最快速的获取知识,是接下来这个时代,决定企业生死存亡的重要指标。
今天我就来讲一下这个未来时代,也可以叫它人工智能时代。要讲的比较多,但主要是对未来的预测,毕竟我们还在这个时代的非常早期,
先来说一下前端输入输出领域有哪些存在大量机会的领域。
输入来讲,触摸已经有了,上次(????戳)讲到乔布斯首先看到了这个技术的价值,并且用iPhone推动了这个技术的发展,做的非常好。这里还要提的是听和看,就是听觉和视觉技术。
输出的话,主要是自然语言对话和机器的自主运作体系,这里可以是人在帮助的输出,可以是机器的自主输出,比如机器人,自动驾驶车辆等等,也可以是各种形态输出的混合。
我展开来说一下。
听觉的定义性能力起点是2006年,是多伦多大学的教授Geoffrey Hinton和我在微软的前同事邓力的合作,内容是通过机器的深度学习提高语音识别的正确率。深度学习,过去我们叫它“神经元处理”,80年代曾经火过一次。
06年Geoffrey Hinton发了一篇论文,讲的是自己研究出的一个可以让神经元快速学习的公式,邓力看到以后,联系到Geoffrey,跟他一起把这个公式用在了语音识别技术上。从06年到09年,语音识别的字差率,句差率从27%,28%左右不断下跌,跌倒接近于人的水平,甚至超过了人的水平。
视觉的定义性能力起点是12年,斯坦福的视觉实验室的Alex Berg和李飞飞的ImageNet一起,然后视觉的识别率开始往下掉。李飞飞训练出的视觉网络基本上现在已经跟人的能力一样,也有的已经超过了人的能力。
自然语言处理跟通用人工智能有紧密的联系,这个能力我个人认为还需要很多年,因为这个技术非常难,目前还没有比较好的定义性能力,但每年都进步很多。
以上是一些基于输入和输出的思考。总结一下,接下来的时代,是知识驱动的时代。人工智能技术的发展,尤其是目前深度学习技术的发展,给了我们一个前所未有的能力,就是机器开始可以自动学习特征表达的能力。
这个能力的出现,将极大的加快我们获取知识,建立模型的速度。因为这次不光是人在获取知识,我们还可以通过建立人工高智能机器,让机器也同时高效的获取知识,从而创造和累计之前时代不可比拟的巨大财富。所以这是一个跨时代的变革。
这样的技术发展方向,基本上是打开了一切机会窗口,任何交互形态都可能实现,所以我建议创业者可以在了解这些技术核心的基础上,挖掘这些技术可以带来的,更多的定义性体验。
接下来我说一下人工智能时代的核心技术。
传感器将是非常重要的领域,比如声音的麦克风阵列,摄像头,激光雷达,各种光学传感器,各种低功耗的传感器,还有对隐私保护有帮助的传感器,这些都将成为投资的前沿领域。
芯片几乎要重做。简单的说,传统的X86也好,ARM也好,都是基于冯·诺依曼结构(Von Neumann architecture),就是一种将程序指令存储器和数据存储器合并在一起的计算机结构。它在今天有很大的局限,包括数据的维度不能太高,计算的效益也有局限。
在未来的时代,计算机结构到底会变成什么样,还需要一定时间来演变。指令级可能还会使用X86或者ARM,因为指令还是需要一个中央处理器来调动资源的,但主要的计算,推理,或训练,我觉得都会用其他的结构来做。所以整个芯片的体系会被改变。但我个人认为,这个领域定义性的体验还没找到,至少目前还没看到。
再简单说一下后端。
今天的人工智能,离真正工程化还有一定的距离。在第五篇文章里(????戳),我提过互联网时代,软件的工程化发展过程。人工智能还没有达到像当时软件工程一样可以系统的训练模型,或者系统的通过模型帮助我们处理数据,这里面还有很多工作需要做。
比如5G。5G的技术非常复杂,现在才刚刚开始,但这个技术可以带来的商业机会也非常多,因为它的应用范围非常宽泛。
芯片也一样,像因特尔或高通(Qualcomm )这种横向的芯片时代,将一去不复返。基本上未来的芯片工业,都将跟大的垂直领域有关,就是针对某个领域(domain),专门研发最适合其迭代发展的芯片。
框架和工具已经有一些不错的体系,但要达到可以大规模的做深度学习训练,建立大规模的推理系统,数据系统,还需要一定的时间。
后端杀手级的应用,我觉得目前主要会出现在感知和认知领域,感知的技术发展目前是领先的。从我的观察和YC的投资角度来说,计算机视觉一定会大有前景,将有很多企业会进入这个领域。这里面后起之秀的机会也会非常多。
基于所有这些,我总结了下面这张图。如果你是人工智能创业,或人工智能创新,如果你想通过人工智能技术来创造商业价值,创造财富,这张图可以告诉你,你的企业最核心的模式是什么,然后你可以根据这张图,延展出属于自己的实践方法。
人工智能的核心是数据。数据从来不是无中生有得来的,任何数据都是观察自然现象,物理环境,人类现象后的一个数字化表达。数据是知识的载体,它的内涵是知识,所以我们首先要找到渠道获取数据。获取数据离不开传感器,这也是为什么我前面说传感器领域将大有可为。
第二我们要从数据中获取知识,然后运用这些知识来达到我们的目的。这里面的运作逻辑一般是:软件+硬件+算法,在早期甚至必须要软硬件结合才行。
然后,在达到我们创造社会价值的目的后,不可避免的会有新的数据产生。所以这个流程是一个闭环。做人工智能创新创业,必须要建成这样一个闭环,一定要找一个比较全的应用才能达到闭环。
最后我强调一点,数据必须是活的,是不断迭代的,而不是一次性的。一次性的数据是没有用的,因为人类社会在变,物理环境在变,知识因此也在不断的变。只有数据是活的,这个闭环才成立,才能真正打造一个健康的人工智能的业务和生态。