专访小鹏汽车首席科学家郭彦东:汽车领域已开启AI竞争时代
“在AI领域的认知中,汽车产业就像是‘皇冠上的明珠’,因为在汽车场景里几乎包含了所有AI相关的视觉技术的落地点。而在汽车领域,AI能力的竞争已经开启,‘真AI’和‘伪AI’的区别开始显而易见。”
“波士顿动力机器人打人视频里的机器人离现实还有距离,但把道德规范(比如计算机不能杀人类这样约束)加到AI研发中已经开始变得有必要。如果机器人在训练更新时接触到脏话,他真的能学出脏话。不停地教他说儒雅的话,他就是一个儒雅的机器人。”
“很多创新都来源于组织架构的创新,以前很少看到车企把人工智能、互联网、自动驾驶作为一级中心来做,现在已经有这样的趋势。”
“为什么计算机视觉已经能够测谎,却不能分辨驾驶状态下前方是镜面还是真的蓝天,这个问题很有意思。”从事人工智能及计算机视觉工作十四年,郭彦东对自己的研究领域依旧保持着敬畏与好奇。他选择加入小鹏汽车,也是因为“在AI领域的认知中,汽车产业就像是‘皇冠上的明珠’”,而他想从实验室中走出来,在场景中解决算法问题。
应搜狐科技邀请,小鹏汽车Chief Scientist & AI产品中心副总经理郭彦东分享了参加全球顶级计算机视觉大会CVPR的感受,以及小鹏在AI研发等领域的最新动态。
“今年CVPR有三个技术尤其有意思,一个是数据生成,二是神经网络自学习,三是成像系统。”
数据生成指的是用计算机仿真技术与平台生成虚拟的数据与场景。郭彦东表示,无人驾驶对数据依赖性很强,但不一定所有的数据都能在真实场景都能找到,有些场景比如车辆碰撞,车商也是是不希望它发生的,怎么样得到这样的数据来训练模型?就可以通过数据生成技术模拟。
“小鹏汽车即将升级的疲劳预警与分神提醒技术(系统在司机驾驶分神时发出提醒),里面一个很重要的功能模块就是通过头部转动角度和停留时间判定司机分神行为,郭彦东表示,头部转动的训练数据就可以通过数据生成模型来大量获得,从而减少了昂贵,漫长的数据采集,也降低了隐私风险。”
网络自学技术指的是用计算机进行深度学习,不仅学网络参数,还学网络结构。郭彦东提出,这个技术本身虽然并不是今年才有的,但是今年趋于更加成熟,可能距离真实应用在实际场景中已经很近了,或是一个临界点。
深度学习在2012年首次在图像分类上大幅度超过传统技术,在那个时候,神经网络的结构通常是研究员来根据经验设计的,网络的具体参数是从数据中学习获得的。人来设计结构,数据来更新参数的模式一直持续到现在。2014年Facebook在LFW( Labeled Faces in the Wild 国际权威人脸数据库之一)上超过人类,2015年微软在图像分类ImageNet上超过人类都是这种模式。
然而,深度学习的一个重要组成部分就是端到端的学习,数据驱动式的学习。所以,数据,任务是否可以不仅仅更新参数,也更新神经网络结构?这个问题越来越受学者的关注。随着这个方向的研究越来越深入,这样的技术也距离实际应用越来越近。
那么,随着计算机自我学习能力的上升,人类安全会不会受到威胁,比如说机器人能力超越了人类与人类为敌?
对于搜狐科技的疑问,郭彦东笑着说起前段时间网络流传的“波士顿动力”机器人打人视频,他说这种程度的机器人离现实还有距离,还没到那个阶段,但现在需要讨论的是,在大量数据学习的过程中如何把道德规范约束加入。比如类似计算机不能杀人这样大的约束,加在AI上面去做,其实开始变得有必要。
“举个以前真实发生的例子,一个聊天机器人,在训练的时候接触到了脏话,就真的在对话中说学出不合适的话。然而如果不停教他说一些很儒雅的话,就是一个儒雅的聊天机器人。”
成像系统包括激光雷达、毫米波雷达、摄像头等成像系统。这些系统用于收集数据,并提供给计算机进行算法使用。
郭彦东解释道,成像系统收集的数据是交给计算机还是给人,这两者之间的目标和目的是不一样的。比如朋友圈发布的潜水蓝色照片很漂亮,但对于视觉系统来说,我们更希望“看”到的海底世界是不受水的影响的“真实”的样子(好像水是完全透明的),这样才能知道眼前是什么种类的鱼,知道珊瑚有没有生病。对于水下自动机器人来说,这样的“真实”场景的成像才是最有效的。
“成像系统如何软硬件一起设计?比如在极端的天气下,包括下雨,这种成像系统的设计会在计算机视觉或者无人驾驶里面扮演越来越重要的角色。” 小鹏G3搭载先进的成像系统:在车内的近红外智能摄像头可以全工况,不分昼夜的识别司机,并对分神、疲劳提供预警提示;在车外的摄像头首次在量产车中Sony ISX019影像传感器,具有宽动态范围等优良的成像特性。
擅长用简单的语言和事例解释清楚复杂的高新技术,这或许和郭彦东走出实验室去验证理论有很大关系。
“在AI领域的认知中,汽车行业就像是‘皇冠上的明珠’,因为在汽车场景里几乎包含所有AI相关的视觉技术的落地点。”郭彦东这么解释自己加入汽车行业的选择:“真正落地场景当中有很多问题是算法并不能解决的,怎么样让算法在应用场景当中一个一个克服应用新的挑战和困难,都需要以前在研究院里面的科学家也好研究员也好走出来,走到场景里面解决问题。”
目前,郭彦东在小鹏汽车的任务是负责给小鹏汽车安装上“眼睛”(摄像头),并给小鹏汽车赋能感知与认知(大脑)。
6月中旬,小鹏G3进行了OTA升级(Over-the-Air Technology,指的是用流量下载新应用),升级后车辆达到L2自动驾驶水平。
OTA升级的主体是车联网,值得注意的是,和部分车企采用合作的方式搭载互联网公司研发的车联网系统不同,小鹏采用的是自家的车联网系统。那么,为何小鹏在自动驾驶和车联网上都坚持自研,而非合作的方式?
在郭彦东看来,能够随着用户的用车习惯,拿到一手的用户需求,对于OTA来说尤为关键。“双向透明在任何商业合作当中都是难以实现的,但是有自研部门就不一样,比如在小鹏汽车,技术是自主研发的自研技术,数据都是自己公司的车身数据,真实场景数据与互联网、人工智能技术相互透明,紧密耦合,为产品的快速迭代,OTA升级打下坚实的基础。”
下一步,小鹏汽车将通过OTA开放疲劳分神。“今年已经进行了3次OTA升级,其中有一些亮点的功能,比如基于人脸识别的ID 登录与车辆个性设置,比如把ICA的功能通过OTA升级给用户使用,包括接下来会OTA的疲劳分神提醒。”
自动驾驶功能升级方面,据郭彦东介绍,计划今年年底上市的小鹏P7,搭载的硬件将满足L3的要求。
最后,郭彦东回答了如何看待互联网企业加入自动驾驶研发的问题。
“很多创新都来源于组织架构的创新,怎么让自动驾驶中心更好地跟整车的技术中心融合,本身需要大的创新和探索。小鹏汽车从管理团队来看,同时具有来自互联网、整车制造、战略等层面的独特基因,这塑造了小鹏汽车独特DNA。以前很少看到车企把人工智能、互联网、自动驾驶作为一级中心来做,现在已经有这样的趋势。”