【智驾深谈】George Hotz,桀骜不逊的自动驾驶破局者


左为 2007年 GeoHot 展示其成功破解苹果第一代 iPhone,右为 Engadet 日前采访 common.ai 新车发布时,一身西装革履的 GeoHot。图片来源:thenexttech.startupitalia.eu;engadget.com

当我前天在 Engadget 看到 GeoHot 近照时,一种违和感油然而生。这种感觉来自两方面:一方面,你一个从 16 岁就开始干破解营生的人,一个被所有人都认为是 Hacker 的人,酷、黑、炫这些词常伴身边的人,不是从来一件帽衫穿过夜么,怎么还装模作样穿个西装呢?另一方面,说好的碾压特斯拉呢?驾驶位敲键盘是什么鬼?右边大屏幕跑个 Ubuntu 啊?真的能用吗?我相信这也是广大群众想要吐槽的地方。

但是,在深入了解 GeoHot 和他创办的自动驾驶公司 comma.ai 的近况之后,我改变了先前的差评。首先是西装的问题,最近一次关于 GeoHot 的新闻,是他在4月初拿到了 310 万美元融资,如果说之前的破解都是爱好的话,那么这次 GeoHot 可能真的认真了——

此刻他再也不是地下室折腾破解的一个人,而是要向广大用户持续交付产品的创业者。

然后是完成度的问题,Engadget 发布了一个短视频,在拉斯维加斯正常车流中,GeoHot 演示了目前的技术进展,完成度颇高。跟之前临时拼凑起来的开发版不同,本次演示的版本去掉了激光雷达,也去掉了游戏摇杆,只用了一个前置摄像头,以及一个草草贴在前保险杠上的毫米波雷达。

进入自动驾驶模式的时候,有类似 Tesla 的叮咚切换声,转动方向或刹车则会退出自动驾驶模式。值得一提的是,整个驾驶过程,我看到了 GeoHot 与车辆之间非常好的交互,他能够不断提醒和指导车辆的行为,这是此前任何一个自动驾驶系统没有展现的。

在谈到自动驾驶的功能选择时,他倾向选择 Tesla AutoPilot 这种渐进式路线,先做超级 ACC,并坚信这是全自动驾驶的基石。他还谈到,汽车工业发展到今天,很多车都带有电子助力转向(EPS)功能,包括一些低端车型,comma.ai 有能力跟 EPS 的控制器通信,从而完成自动转向的功能,让广大的驾驶员都能够用上,达到所谓的“Ghostriding for the masses” (注:Ghostriding 指驾驶员不用控制车辆,而继续乘车前行的样子),这也是他们年底产品的定位:


是的,面向全体开车的美国人,GeoHot 要拯救他们的驾驶体验

桀骜不驯的CEO

看完了 Demo,再聊聊 GeoHot 本人。在网络上,GeoHot 基本上就是不服气的代名词,他桀骜不逊、极具冒险精神,并且经常语出惊人。当天演示时,Engadget 的记者临时提议在 Facebook 上做一个直播。

面对突如其来的请求,其实一个初创团队的 CEO 往往会考虑很多,比如万一过程中系统崩掉了怎么办?万一泄露了技术细节怎么办?万一处理不了当时的交通状况怎么办?是的,确实有一万个万一,但 GeoHot 立刻就答应了,一方面跟这哥们的情商比较短路有关系,另一方面,也是更重要的一方面,应该是他对 comma.ai 的热爱和自信。

视频很长,让我们充分体验了目前系统运行的状况,也充分验证了 GeoHot 确实是一个话唠,整个17 分钟的视频基本都是在啰嗦自己的理念,吐槽别人的产品,以及各种像嗑药之后的激动不已。所以啊,拿到了投资和穿了西服都改变不了一个人的天性。

长视频中他不断用手势和喊话向 Mobileye 示威,并且他也并不在乎暴露在研系统的问题,比如毫米波雷达对静止车辆和地面的区分不好,而他目前使用的摄像头也质量一般,因此会遇到跟车不停的情况,对此他毫不遮掩,就是这么自信。

更加“可耻”的是,GeoHot 还在 Reddit 无人车论坛上开了一个帖子,号称“像我开问”。这里罗列一些,让大家开心一下:

  • 问:比较一下 comma.ai、Google 和 Tesla
  • 答:Google 全自动驾驶,太远了。Tesla,贵。我们,便宜。
  • 问:Mobileye 说深度学习不靠谱
  • 答:当年马车也说火车不靠谱

另外,虽然是在创业做自动驾驶项目,GeoHot 仍然保留非常敏感的互联网思维。Comma.ai 正在研发一个叫做 Chffr 的 App,会在接下来的6月发布,它试图通过互联网思维中的众包众筹或者群体智能的力量,来收集更多的驾驶数据,优化自动驾驶系统,而用户则获取一种称为 Comma 的积分,在年底系统发售的时候,优先获得超值体验,不得不说这是个集营销、用户习惯培养和数据收集为一体的好办法。以及,他在车里面装的是一个硕大的触摸屏,上面甚至安装了 Chrome 和 Spotify……

策略+学习才是王道

从方法上来讲,目前的自动驾驶汽车可以划分为两大阵营:一种是感知-决策-控制,然后不断闭环,每个模块用不同的方法力争最好,很多情况下需要专家提供基于经验的规则;另一种则是 GeoHot 采用的办法,叫做 End-to-End,端到端方法,指以摄像头的原始图像作为输入,直接输出车辆的速度和方向,中间用某种数学模型来拟合逼近最优驾驶策略,目前常用的就是深度学习模型,其优点是不会漏掉任何原始数据中的有用信息,缺点是不能对信息进行有效取舍,会影响输出效果。对此,GeoHot 给出的解决办法是,先完成学习版,后面逐步添加规则来预防系统的死角。

另外,GeoHot 还提到了防御性驾驶的概念,即车辆除了对当前路况有所判断以外,还需要对未来进行预估,这也是自动驾驶领域中的难题之一,而 GeoHot 还是打算使用深度学习模型解决。

 

不管 GeoHot 最后成功与否,这哥们仍然是一个激情澎拜的人,他不迷信权威,乐于动手和思考,热爱自己的梦想,这样的人值得敬佩。

文章转自新智元公众号,原文链接

时间: 2024-11-07 04:20:48

【智驾深谈】George Hotz,桀骜不逊的自动驾驶破局者的相关文章

【智驾深谈】Mobileye,用单目视觉点亮自动驾驶

早期做自动驾驶的小伙伴几乎每个人都自己动手写过车道线识别程序,OpenCV写写,霍夫变换写写,模板匹配写写,再复杂一点弄个RANSAC,或者滤波投票.然而一遇到光线变化就挂了,遇到天气变化也会挂,车速高了也挂,总之各种挂.体验了各种挫败感之后,大部分人都转而投向激光和差分的方案,丢下一句"现在视觉还尚未成熟"之类的话. 我之前也一直这么认为,视觉太难做,直到我有一天看到了Mobileye的结果,漂亮得一塌糊涂,比如上图里这种,从没有车道线的地方都能推理出车道线(传说中的HPP,Holi

【智驾深谈】从滴滴Uber合并看中国智能出行“三国演义”

智能出行已俨然取代移动互联网,成为新一波产业浪潮.从互联网格局看,BAT之外,4年内即出现第4极,垄断中国互联网出行市场,并意图独霸未来智能出行市场. <经济学人>杂志本周发表封面文章称,以往,中国互联网公司被认为只会模仿美国同行,而滴滴和微信过去几年的发展表明,中国互联网公司已经有能力展开自主创新.尤其是在滴滴收购Uber中国之后,这些中国本土的自主创新正成为美国同行的效仿对象. 上一个移动互联网浪潮,中国在十几年的时间内,靠BAT成为互联网的一级,至少在中国市场占据了主导权.滴滴合并后,智

【智驾深谈】特斯拉发布新一代 Autopilot 勇闯 L5,续写冰与火之歌

12月31日,2016年的最后一天,特斯拉对外宣布,开始在1000辆汽车上推送软件更新,如果一切顺利的话,下周更多的汽车将会接收到升级推送.本次更新包括了Autopilot 的交通感知巡航控制功能.前方碰撞预警和自动转向(Autosteer),其中,Autosteer 是 Autopilot 的旗舰功能,但是目前只能在"低速"下启动.特斯拉对此次升级非常慎重,软件团队在公司的内部视觉团队(特斯拉视觉).机器学习技术和数据收集车队中加入安全特性后才会展开升级推送. 早在今年10月Auto

【智驾深谈】深度学习驱动的自动驾驶新主流框架盘点(附3篇论文)

大背景 基于深度学习架构的人工智能如今已被广泛应用于计算机视觉.自然语言处理.传感器融合.目标识别.自动驾驶等汽车行业的各个领域,从自动驾驶初创企业.互联网公司到各大OEM厂商,都正在积极探索通过利用GPU构建神经网络实现最终的自动驾驶.   高阶ADAS系统的开发以至自动驾驶系统的开发都有赖于一套能够完整支持开发.模拟测试.原型制作和量产的开放式解决方案.本文将介绍基于深度学习架构的自动驾驶平台,这一架构将成为未来实现自动驾驶的集成平台中的重要一环.   深度学习是什么   深度学习是目前人工

【智驾深谈】一张图看清自动驾驶产业

自动驾驶三层次 通常来讲,自动驾驶技术可以划分为三个层次,感知->认知->行动,然后不断循环.参考上面一张网图,其中行动层包括转向.油门和制动三大控制器(以及执行机构),感知部分包括两方面,感知环境的激光雷达.毫米波雷达.摄像头.组合导航设备,感知车辆自身的包括轮速计和三大控制器的反馈量,而认知部分,包括决策和规划,是通常意义上的人工智能所在. 1. 行动层 首先谈谈行动层,即三大控制器,VSI并没有在图中标出相关的企业,看似与自动驾驶高大上的技术没关系,但这一块却是不容忽视的,尤其是在国内.

【智驾深谈】Tesla致命车祸的必然性:谈自动驾驶的三个命门

一个"量身定做"的事故 首先我们先来复盘一下整个事故,谈一下为什么我们觉得这个事故是"量身定做"而且必然的.先总结:一如既往蓝天白云且风和日丽的天气,一辆横在路上的白色重卡,一个热衷尝试新技术且对此深信不疑的驾驶员,一条笔直到让人犯困的公路,一套尚在完善的自动驾驶系统,车-路-人联手为新锐车企Tesla乃至整个自动驾驶产业"量身定做"了一个大新闻. 先上几张图,下面俯视图是事故发生的路段,一看就是事故多发路口,没有信号灯,横向是高速,纵向却有车流

【智驾深谈】李德毅院士:深度学习将成为智能驾驶的新维度

上期智驾深谈聊到智驾三层次:感知层.认知层和行动层. 实际上感知层面上,无论车道线.交通标志还是车辆识别,都已经大规模采用了深度学习技术:行动层由于汽车工业百年的发展和积淀,已经可以很好地由现代控制理论解决:所以就剩下认知层,还真是个大号的硬钉子. 一个好的认知模型需要对环境有精准的理解和预判,还需要据此做出下一步的决策和规划,这里面的挑战就是复杂的动态交通环境.在深度学习出现之前,很难有一个模型能够很好地对此建模.预测和决策.而李德毅院士的工作,就聚焦在利用深度学习技术,解决智能驾驶中认知的问

【智驾深谈】George Hotz 开源代码复现与分析(80G数据云盘下载)

GeoHot智驾系统开源这件事情还是很多人关注的,也问了很多问题,其中包括渐进式路线的车企,直接L4的互联网企业,很多创业团队和风投.先回答一个问到最多的问题:这代码离实际路上能用还差很多. 对于大公司来讲,车企做渐进式ADAS其实都是工况分解而来,流行使用状态机,深度模型是个黑盒子他们肯定不喜欢. 互联网企业愿意尝试新方法,但这个系统其实还需要在车辆控制方面做大量的改进才能够跟现有系统对标. 对于创业团队来讲,这个系统是个很好的参考,可以学习一下深度学习,以及comma.ai是如何短时间内聚焦

【智驾深谈】Tesla再现匝道口致命隐患:谈高精地图和定位的重要性

一起"莫名其妙"的事故 上图是WSJCD获取的车祸现场图片,可以看到车辆已经彻底翻了过来.首先关于这次翻车事故,因为影响面比较小,因此我并没有拿到足够多的证据证明车祸发生在匝道口,是我看到新闻后一下午的推测,但是关于匝道口是L3杀手这件事情,大家应该是有共识的,所以就当个引子说事吧. 如上图,新闻是这样描述的(国内见到一些新闻的翻译有一些问题),大概下午五点钟,天气和能见度都很好的情况下,一个画廊老板在Pennsylvania Turnpike向东行驶,到了Bedford出口附近,突然