专访DeepScale:深度学习加前融合,这家公司想做自动驾驶领域的感知方案供应商

Forrest Iandola

多传感器融合目前看来已经成了通往自动驾驶的必由之路,更多的传感器数据往往也意味着更高的安全性。但数据融合并不是一件简单的事。

DeepScale是硅谷一家专注于自动驾驶感知技术的公司,其CEO Forrest Iandola在本月接受雷锋网采访时表示,他们能将深度学习同时用于摄像头以外的传感器数据上,如雷达与激光雷达,并在较为廉价的嵌入式设备上提供感知解决方案。

Forrest在加州大学伯克利分校攻读博士学位时,主要研究深度神经网络及其应用,重点关注加速及改进用于计算机视觉的深度学习,目前已发表20多篇论文。2015年他与导师Kurt Keutzer联合创立了DeepScale。

他告诉雷锋网,如果分析现有量产车辆以及自动驾驶原型车对于雷达与摄像头等数据的处理,就会发现摄像头数据上会用到深度学习技术,但雷达数据处理还是用的传统算法,没有深度学习灵活。这也是DeepScale的不同之处。

他们的另一个创新之处体现在多传感器数据的融合算法上。“我们做的是利用原始数据的前融合(Early Fusion),在做目标检测前就进行融合。”

在融合算法上,通常的做法是让摄像头、雷达、激光雷达等传感器数据分别进行物体检测,各生成一个物体列表。如果在雨天激光雷达的效果受到影响,或者在逆光时摄像头难以正常发挥,那各自生成的列表会不一样,在做最终判断时需要再次计算,而部分信息会在确认时被丢弃,这也降低了系统的安全性。如果用原始数据进行融合,信息会更完整。

DeepScale用于测试多传感器融合的方案

Forrest告诉雷锋网,其多传感器融合方案的优势,一是体现在物体检测的准确性上,二是跨传感器的可移植性(Portability)上。“用传统的方法,如果有新的激光雷达,则需要开发新的检测算法,而我们的方法可以用很小的工程开发来完成融合。现在有数十家公司在做传感器,我们不用为每一家的传感器重新开发。”

传感器是实现自动驾驶的瓶颈之一,也因此有一批新兴公司扎根其中,比如Luminar,LeddarTech,速腾,光珀,Cepton,Oculii等。如果对传感器没有特殊要求,无疑可以让分工更明确,加速自动驾驶的落地。

DeepScale的另一个特点,则是自行设计了深度神经网络,这样可以在物体检测上满足精度及计算上的要求。Forrest表示,他们开发的神经网络可以运行在高通的车规级骁龙处理器上。“我们没有用现有的网络,而是自行从新开始设计了深度神经网络。这样可以加入新的功能,比如融合算法,我们还开发了新的数据转换层。”

仍在做研究时,Forrest就与同伴一起发布过自己的神经网络SqueezeNet,这一网络并不能直接用于自动驾驶,但它在让模型尽可能简单的基础上,实现了合理的精度。

在创立DeepScale之前,Forrest曾在UCB的ASPIRE实验室工作,当时他参与了一个美国国防部高级研究计划局DARPA资助了1500万美元的项目。项目的主要任务是将计算机视觉技术置于无人机上,而他们的主要工作就是优化能耗。他表示,“当时在解决问题中,我们要选择合适的硬件,开发最好的library,开发最合适的模型和算法”,而这也是他们现在能用上的经验。

以下为雷锋网与Forrest采访的摘录:

雷锋网:你怎么定义DeepScale和它在自动驾驶行业的位置?

Forrest:我们是一家软件公司,取决于与哪家OEM合作,我们会成为Tier 1或Tier 2供应商。有时与车厂合作,有时也与T1合作,向车厂提供完整的解决方案。两种典型的情况。

我们不是开发自动驾驶整体解决方案,而是只开发感知系统软件,是自动驾驶构成的一部分。

雷锋网:多传感器的前融合在学术研究上是一个相对成熟的领域吗?

Forrest:研究的人相对比较少。深度神经网络是一个有研究很多的领域,在语音识别、目标检测、图像及视频识别、文本分析上都有很多应用。但传感器的融合在DeepScale之外,还主要是人工设计的算法,很少用深度学习,甚至没有用机器学习的方法。总体上虽然已经有了一些研究,但仍有很多开放的问题待解决。

雷锋网(公众号:雷锋网):那有待解决的问题还有哪些?

Forrest:除了很多方法没有利用原始数据,这会带来一定的局限外,如何做到传感器的时间同步也是一个重要问题。传感器有不同的采样速率,一个传感器可能是每秒30次的采样,另一个可能是40帆每秒,在如何融合上我们有一些成果了。时间序列神经网络(Time
Series Neural Network)帮了很大的忙,RNN(递归神经网络)也很有用,解决了不少问题。

雷锋网:雷达上的原始数据你们用的是频谱(Spectrum)吗?如何做数据融合?

Forrest:第一步是我们与一些雷达公司有合作,他们会为我们提供原始数据。这方面我们有一些进展,用机器学习的方法取得了一些不错的成果。可以透露的是,这有点像语音识别,你可以用原始波形(Wave
Forms),或者用FFT(快速傅里叶变换)做一系列的处理,再喂给神经网络,这是一个还没解决的问题。

雷锋网:你们对传感器的配置没有具体要求?

Forrest:我们在配置上很灵活,主要看合作的OEM想达到什么样的效果。在城市路段和高速上所用传感器是不一样。想达到什么样的功能,想要系统多可靠,这决定了用什么样的传感器。

雷锋网:让业界采用你们的方案是否存在哪些阻碍?

Forrest:有不少公司开发出了车载的智能传感器,里面也集成了处理算法,对这些公司来说,我们的技术是颠覆性的(Disruptive)。车厂也不可能同时用这两种方法,所以我们在与汽车行业对用新技术做计算感兴趣的公司合作,希望能将计算中心化。

雷锋网:是因为习惯了传统的方案而不愿意接受新的技术?

Forrest:这对每家公司来说都不一样。如果对精度和系统安全没那么敏感,就不需要。

雷锋网:那是否意味着你们更偏向于L4-5级别的全自动驾驶,而不是L2-3级?因为后者已经有Mobileye这样的公司了?

Forrest:我们L2-5级别的方案都做。L2-3的定义很广泛,现在L2级自动驾驶的功能和它未来有的功能差别很大,比如像紧急制动系统这样的功能就还不完美,还有很多工作要做。车厂也对有更多的安全功能很感兴趣。我们也不是想挑战Mobileye,但在L2-3领域还有很多待解决的问题。

在L4-5级上,会加入更多的传感器,会面向更多的场景,而我们系统的好处是对传感器的改变适应性很好,我们可以支持高端和低端的传感器,且不用做太多的前期开发。

雷锋网:你们开发过程中遇到的主要挑战是什么?

Forrest:取决于自动驾驶车辆要达到什么样的功能,我们的一个目标就是要达到相应的感知精度要求。另外就是要在车规级的硬件和处理器上完成实时计算。DeepScale的一个优势是我们擅长重新思考神经网络的设计,以在更小的处理器上运行。

英伟达等GPU公司在PC和服务器上,以及未来的汽车上都有很好的应用。但也有一些应用场景,就算是英伟达最便宜的芯片也不能满足OEM的需求,但我们能将深度神经网络运行手机和车载硬件上。这也是我们的一个特点,很多公司或者在GPU上做深度学习,或者在其它硬件上做非深度学习的传统的计算机视觉。

雷锋网:你们现在主要支持哪些计算平台?

Forrest:与我们对传感器的要求不多,可以换到新的传感器而不用做过多的开发一样,我们自己的深度神经网络软件框架可以移植到不同的处理器平台上,比如高通、英伟达、TI等,我们未来会运行上所有的平台上。

雷锋网:现在你们深度神经网络的功能有哪些?

Forrest:目前我们主要关注的是物体检测,包括物体的种类、运行路线、距离等信息;还可以分析3D点云,即环境的3D形状是什么,从一个摄像头到多个传感器的数据都可以分析。还有Occupancy,也就是道路上可以行驶的空间。

雷锋网:你如何看待以摄像头或激光雷达为主的自动驾驶方案?

Forrest:我是一个很务实的人,我觉得更多的传感器意味着更安全。各种不同的技术路径都有自己的价值,但重要的是取决于想要做什么和达到什么样的效果。如果只是做Demo,只想在限定区域内运行,可能一个摄像头就够了,如果是要解决安全问题并且要量产,不确定。

雷锋网:你们未来的主要工作是什么?

Forrest:招人,软件开发,获取更多数据,寻求更多合作都是。在一个漂亮的Demo与量产之间,还存在很大的鸿沟,安全性上也需要不断提升。

本文作者:张驰

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-31 06:17:47

专访DeepScale:深度学习加前融合,这家公司想做自动驾驶领域的感知方案供应商的相关文章

深度学习那么火,它究竟能做些什么?

说到深度学习,你可能很难理解.但举个例子估计你就能明白,家里的水管坏了,上淘宝买了一根,然后几乎每天都会收到淘宝推送的水管信息--相信有这样经历的人不在少数.其实这就属于深度学习所要解决问题的范畴,但从当前的情况来看,这一问题无疑还没很好的得到处理. 当然,这只是深度学习最终应用的一个体现,即利用大量的数据分析用户需求,并匹配其需要的信息,购物平台如此.现在很多资讯推荐APP也是如此.除此之外,深度学习最终价值的体现其实还有很多,比如AlphaGo大战李世石,背后深度学习起着非常重要的作用,再比

Uber前高管成立新地图公司,为自动驾驶提供路线服务

雷锋网消息,据Theinformation报道,最近Uber几位离职员工成立了一家自动驾驶地图公司rideOS,以帮助Uber和Lyft这样的出行公司开发自动驾驶车辆. 该公司的创始人包括:Chris Blumenberg,在加入Uber前他曾在苹果地图部门任职:Bill Chen,曾领导过特斯拉自动驾驶的地图和导航项目,也与Chris是Uber和苹果的同事:Justin Ho,Uber自动驾驶车项目的早期缔造者.这家公司才刚成立不久,融资情况还不得而知. 目前还存在其他专注在自动驾驶地图领域的

这家公司想用三明治取代RSA安全标准

本文讲的是 这家公司想用三明治取代RSA安全标准,一家爱沙尼亚的安全公司Guardtime近日宣称,其无密钥认证签名技术将最终取代RSA认证和数字签名.这个号称要取代RSA的新安全标准,有着一个奇怪的名字:BLT(三明治,培根B,生菜L,西红柿T). 我们知道世界知名的数据安全公司RSA所提供的RSA认证和数字签名,其签名算法和标准已经使用了30多年,而且在未来很长的一段时间里,很可能仍然会大行其道.但另一方面,世间万物都有其生命周期,RSA认证和数字签名退出历史舞台也不是不可能的事. Guar

2017GAITC专访 │ 深度学习分论坛主席季向阳

 [CAAI导读]从AlphaGo进去公众视野的那一天起,它就为普通百姓普及了人工智能这一概念.而人工智能也从幕后走到了台前.虽然有着无数赞美,但伴随而来的也是舆论对于人工智能的大讨论.  2017年5月21日至22日,由中国人工智能学会.中国中文信息学会主办的"2017全球人工智能技术大会"将在北京国家会议中心拉开序幕.本次大会为中国人工智能权威大会,以"交叉.融合.相生.共赢"为主题,将汇聚多位全球人工智能学术界和产业界著名学者.顶级专家和业界精英. 为了探寻这

自动向你的宝马车播放捷豹广告,这家公司要做高速公路上的“分众”

雷锋网(公众号:雷锋网)消息,你在Google.百度.淘宝.京东上的每一次搜索.点击.购买.收藏,都会被庞大的广告系统记录和分析,成为向你进行精准推荐的依据.我们已经对互联网上的广告无比熟悉,甚至有时不堪其扰,有人感叹,我们这个时代最聪明的人,正在研究怎么让人点击更多的广告. 但你或许没有想到,这个广告推荐系统其实是可以延伸到线下的.<麻省理工科技评论>最近报道了一家叫Synaps Labs的创业公司,他们就要收集并分析"线下cookies",把传统的电子广告牌也变成智能推

与戴尔分家后 这家公司都做了些什么?

如果是一家工业制造公司拥有25年历史,并位居行业领先地位,应该是个不错的成绩.但是自网络出现这几十年内,就有一家公司拥有超过25年的历史,并长期深耕网络安全问题,帮助企业解决网络安全风险,那么这个成绩一定更为斐然. 2016年这家拥有25年历史的网络安全公司SonicWall宣布从戴尔软件集团剥离,成为一家独立公司.Francisco Partners的首席执行官Dipanjan"DJ"Deb表示:"SonicWall聚焦于新一代网络安全,对于全球40多个国家的客户及渠道合作

这家公司想让普通医院,也有机器学习能力

Health Catalyst公司发布了免费开源机器学习和人工智能工具.这是一家美国医疗数据管理分析服务公司,他们的创始人全都来自于一家美国顶尖的医疗保健系统.他们掌握浩繁的数据资料,对数据分析方法了如指掌,在结果优化方面具有丰富的经验. 创立公司初,他们主要为诊所和医院创建数据库.之后他们逐渐意识到只做基本的数据管理是不够的,他们需要能够帮助他们的客户找出数据的趋势.制定针对性计划.加强医疗流程标准化,或者其他有组织性的变革,来促进持续的临床医疗的提升.经过了数年的错误尝试之后,他们实现了突破

这家公司想成为大数据营销领域的“BAT”

3月29日晚间消息,大数据精准营销平台亿玛在线今日宣布,已于3月23日正式在新三板挂牌,股票代码为836346.在公布的2015年财报中,亿玛在线全年营收6.63亿元人民币,营收规模暂居新三板互联网营销版块第一. 亿玛在线创始人柯细兴在接受新浪科技采访时表示,将以挂牌为起点,在精准营销和电商导购领域继续拓展,提升业务规模,向互联网营销领域的独角兽地位冲刺. 据了解,亿玛在线是业内唯一同时拥有电商销售和精准营销两大业务板块的大数据营销公司,主要服务于大型B2C电商.在线品牌商以及互联网金融.游戏等

复杂的中国驾驶场景,正是深度学习的优势

导读 深度学习十分适合高度复杂场景下的自动驾驶应用,尤其与增强学习相配合,能让从感知到执行的过程变得简单. 谷歌和李世石的人机大战引爆了公众对于人工智能的关注,也让基于深度学习的人工智能成为汽车业界关注的重点,那么深度学习在智能驾驶的应用场景下有什么帮助呢? 自动驾驶最先出现在美国,而不是欧洲或者日本,更不是中国,非常关键的一个原因在于,美国的驾驶环境相对于其它地区而言,是最简单的,无论是道路情况还是驾驶习惯.这就意味着,开发一个自动驾驶原型产品的技术难度可以大大降低. 这种高度复杂的场景很难用