雷锋网按:12月17日,在北京举行的第七届全球新能源汽车大会(GNEV7)上,地平线机器人CEO余凯发表了《未来汽车的技术起点》的主旨演讲,聊了聊怎么样通过技术变革使交通出行更加安全、便捷以及有趣。余凯是前百度研究院执行院长,曾领导百度深度学习研究院(IDL)、多媒体技术部(语音,图像)、图片搜索产品部等团队。年以来,余凯发起和领导了百度大脑、百度自动驾驶、BaiduEye以及DuBike等一系列创新项目,并连续三次荣获公司最高荣誉——“百度最高奖”。
12月19日,雷锋网第期硬创公开课将特邀余凯博士为大家做一期以
为主题的演讲,分享他对今年AI现象的看法以及对未来的展望。
《人工智能的冰与火之歌:回顾,展望》
以下为余凯在GNEV7演讲全文(雷锋网作了不改变原意的删减):
前面很多嘉宾谈到了变革:大数据、人工智能技术、自动驾驶。今天我从一个技术专家的角度给大家阐述技术创新可能给汽车行业带来的影响。
年的7月,我创立地平线,实际上开始做的事情听起来比较非主流、反主流,我定义地平线是嵌入式人工智能的领导者。
什么叫嵌入式人工智能?
它并不是通过云端联网,在数据中心进行大规模计算去实现人工智能,而是在本地计算,在不联网的情况下实时的做环境感知、人机交互以及决策控制。
大家想象一下自动驾驶这样一个场景:一个小朋友突然横穿马路。我们要把信号传到云端做处理做决策,这可能是灾难性的,如果网络条件不稳定怎么办?
实际上,嵌入式人工智能就是完全低功耗的本地化计算,
很多场景都需要这样的解决方案。
地平线其实是想做嵌入式人工智能的领导者。
这里面包括从软件、硬件甚至处理器的架构重新定义怎么去实现低功耗、高性能的计算。
主要应用的场景毫无疑问第一个是自动驾驶,第二个叫SmartLive(智能生活)。
权威报告显示,年世界上每十辆车中将有四辆具备一定程度的自动驾驶功能——可能是辅助驾驶,甚至高速路的全自动驾驶及非高速路的自动驾驶在那时也能实现。
如此大的产业机会源于中国汽车市场已经跃居世界第一。但令人尴尬的是,全世界范围内每十万人的交通事故死亡率,中国是世界最高。那么,怎么样通过技术变革使交通出行更加安全、更加便捷以及更加有趣?
百年历史的汽车行业实际上来了野蛮人,这些野蛮人来自互联网公司,我也是其中的一位。野蛮人也需要进化。
未来,自动驾驶会像程控交换机改变电信行业一样,会重构整个交通出行产业。这里面互联网企业、车厂、传统的供应商都必须拥抱这个趋势,并且找到自己的位置。
我们永远会低估人类对懒惰的追求,计算机交互从键盘到鼠标再到触控,越来越方便,人们在越来越懒惰的状态下做这些事情。如今,我们还需要花几个月的时间学习开车作为生活必备技能,但15年、20年以后我们还需要这些吗?我认为对用户体验无止境的追求会驱动产业变革。
当然,从技术角度讲,必须承认的是,无人驾驶谈何容易?报道显示,年9月份——年11月份期间,Google的无人驾驶汽车在无人为干预情况下发生了13次碰撞事故,在42万英里的行驶过程中一共发生了次人为的干预。即便是Google这样的公司目前还做不到“无人驾驶”,同时,就算
车上的传感器与计算设备加起来可以买好几辆车,但稳定性和可靠性依然无法保证。
以我的亲身经历来看,百度和宝马合作的第一辆无人驾驶汽车,后备箱塞满了机器,根本别想放行李,这个问题到今天都没有解决。像百度、Google、优步这些无人驾驶汽车,每开两个小时就要找个地方散热,整个系统的可靠性、稳定性是个巨大的问题。
我从一开始负责百度无人车的时候就想,一定要对汽车产业多年在驾驶安全方面积累的技术有足够的敬畏之心,所以我们开始的时候就找了传统车厂宝马来合作。
汽车产业的OEM(原始设备制造商)跟Tier-1(一级供应商)在无人驾驶方面持“渐进”观点——
从辅助驾驶到半自动驾驶再到全自动驾驶;从有限场景的园区、高速公路到非限制场景再全天候。
这种渐进式发展路线从今天看是比较现实主义的,我也认为是可取的。
但是,历史上也不乏
由于某项新技术的变革,改变了整个外部生存环境的例子,以一种颠覆者的姿态入场。
下面我想跟大家分享一下最近人工智能方面的发展,实际上我们每个人都要对这件事情有充分的敬畏之心,包括在人工智能行业工作20年的我。
人工智能技术在过去十年时间里,
一个显著的发展趋势就是深度学习
,因为深度学习不但让语音识别成为可能、让图像识别开始进入产业,它甚至在下围棋这件事情上做得也比人类好。
其中,增强学习不光是感知的问题,更加是决策、连续决策的问题。优化一个长期的目标,不光可以让下棋做得更好,同时加速自动驾驶的发展。
最近,我们看到在整个行业里面包括Google、地平线都在研究基于增强学习的自动驾驶决策系统。
另外一个就是计算,计算的摩尔定律、架构的重新设计。
NVIDIA从去年八、九月份开始到今天股票涨了5倍,因为其新的计算架构使得人工智能的计算能够提升两个数量级,让深度神经网络计算更加高效。正是这样的需求,让这家公司的价值从一百亿涨到五百亿。
最近,特斯拉宣布明年所有的新车上会装8个环视摄像头,都是高清的,底层有NVIDIA的DrivePX2计算平台,当然还有12个超声传感器,包括前方的毫米波雷达。
但是特斯拉的自动驾驶技术并不完善。
这是典型的“技术未动,数据先行”,是新的思维和方法论。
特斯拉可以从车辆实际运营中积累两种数据:
第一种是路况就是环境的实时数据;
第二类数据是说在这样的环境和路况下面司机怎么操作、怎么决策。
这个过程可以积累十亿英里的驾驶员决策数据,背后是一个深度神经网络在云端不断学习,学习人是如何操控的。这与我们过去的思维:工程师自己写规则、调试不一样,完全是机器自主在学习。
到年,特斯拉将具备ForwardFacingRadar能力,这是大数据驱动的自动驾驶,我们对此要给予充分