左为 2007年 GeoHot 展示其成功破解苹果第一代 iPhone,右为 Engadet 日前采访 common.ai 新车发布时,一身西装革履的 GeoHot。图片来源:thenexttech.startupitalia.eu;engadget.com
当我前天在 Engadget 看到 GeoHot 近照时,一种违和感油然而生。这种感觉来自两方面:一方面,你一个从 16 岁就开始干破解营生的人,一个被所有人都认为是 Hacker 的人,酷、黑、炫这些词常伴身边的人,不是从来一件帽衫穿过夜么,怎么还装模作样穿个西装呢?另一方面,说好的碾压特斯拉呢?驾驶位敲键盘是什么鬼?右边大屏幕跑个 Ubuntu 啊?真的能用吗?我相信这也是广大群众想要吐槽的地方。
但是,在深入了解 GeoHot 和他创办的自动驾驶公司 comma.ai 的近况之后,我改变了先前的差评。首先是西装的问题,最近一次关于 GeoHot 的新闻,是他在4月初拿到了 310 万美元融资,如果说之前的破解都是爱好的话,那么这次 GeoHot 可能真的认真了——
此刻他再也不是地下室折腾破解的一个人,而是要向广大用户持续交付产品的创业者。
然后是完成度的问题,Engadget 发布了一个短视频,在拉斯维加斯正常车流中,GeoHot 演示了目前的技术进展,完成度颇高。跟之前临时拼凑起来的开发版不同,本次演示的版本去掉了激光雷达,也去掉了游戏摇杆,只用了一个前置摄像头,以及一个草草贴在前保险杠上的毫米波雷达。
进入自动驾驶模式的时候,有类似 Tesla 的叮咚切换声,转动方向或刹车则会退出自动驾驶模式。值得一提的是,整个驾驶过程,我看到了 GeoHot 与车辆之间非常好的交互,他能够不断提醒和指导车辆的行为,这是此前任何一个自动驾驶系统没有展现的。
在谈到自动驾驶的功能选择时,他倾向选择 Tesla AutoPilot 这种渐进式路线,先做超级 ACC,并坚信这是全自动驾驶的基石。他还谈到,汽车工业发展到今天,很多车都带有电子助力转向(EPS)功能,包括一些低端车型,comma.ai 有能力跟 EPS 的控制器通信,从而完成自动转向的功能,让广大的驾驶员都能够用上,达到所谓的“Ghostriding for the masses” (注:Ghostriding 指驾驶员不用控制车辆,而继续乘车前行的样子),这也是他们年底产品的定位:
是的,面向全体开车的美国人,GeoHot 要拯救他们的驾驶体验。
桀骜不驯的CEO
看完了 Demo,再聊聊 GeoHot 本人。在网络上,GeoHot 基本上就是不服气的代名词,他桀骜不逊、极具冒险精神,并且经常语出惊人。当天演示时,Engadget 的记者临时提议在 Facebook 上做一个直播。
面对突如其来的请求,其实一个初创团队的 CEO 往往会考虑很多,比如万一过程中系统崩掉了怎么办?万一泄露了技术细节怎么办?万一处理不了当时的交通状况怎么办?是的,确实有一万个万一,但 GeoHot 立刻就答应了,一方面跟这哥们的情商比较短路有关系,另一方面,也是更重要的一方面,应该是他对 comma.ai 的热爱和自信。
视频很长,让我们充分体验了目前系统运行的状况,也充分验证了 GeoHot 确实是一个话唠,整个17 分钟的视频基本都是在啰嗦自己的理念,吐槽别人的产品,以及各种像嗑药之后的激动不已。所以啊,拿到了投资和穿了西服都改变不了一个人的天性。
长视频中他不断用手势和喊话向 Mobileye 示威,并且他也并不在乎暴露在研系统的问题,比如毫米波雷达对静止车辆和地面的区分不好,而他目前使用的摄像头也质量一般,因此会遇到跟车不停的情况,对此他毫不遮掩,就是这么自信。
更加“可耻”的是,GeoHot 还在 Reddit 无人车论坛上开了一个帖子,号称“像我开问”。这里罗列一些,让大家开心一下:
- 问:比较一下 comma.ai、Google 和 Tesla
- 答:Google 全自动驾驶,太远了。Tesla,贵。我们,便宜。
- 问:Mobileye 说深度学习不靠谱
- 答:当年马车也说火车不靠谱
另外,虽然是在创业做自动驾驶项目,GeoHot 仍然保留非常敏感的互联网思维。Comma.ai 正在研发一个叫做 Chffr 的 App,会在接下来的6月发布,它试图通过互联网思维中的众包众筹或者群体智能的力量,来收集更多的驾驶数据,优化自动驾驶系统,而用户则获取一种称为 Comma 的积分,在年底系统发售的时候,优先获得超值体验,不得不说这是个集营销、用户习惯培养和数据收集为一体的好办法。以及,他在车里面装的是一个硕大的触摸屏,上面甚至安装了 Chrome 和 Spotify……
策略+学习才是王道
从方法上来讲,目前的自动驾驶汽车可以划分为两大阵营:一种是感知-决策-控制,然后不断闭环,每个模块用不同的方法力争最好,很多情况下需要专家提供基于经验的规则;另一种则是 GeoHot 采用的办法,叫做 End-to-End,端到端方法,指以摄像头的原始图像作为输入,直接输出车辆的速度和方向,中间用某种数学模型来拟合逼近最优驾驶策略,目前常用的就是深度学习模型,其优点是不会漏掉任何原始数据中的有用信息,缺点是不能对信息进行有效取舍,会影响输出效果。对此,GeoHot 给出的解决办法是,先完成学习版,后面逐步添加规则来预防系统的死角。
另外,GeoHot 还提到了防御性驾驶的概念,即车辆除了对当前路况有所判断以外,还需要对未来进行预估,这也是自动驾驶领域中的难题之一,而 GeoHot 还是打算使用深度学习模型解决。
不管 GeoHot 最后成功与否,这哥们仍然是一个激情澎拜的人,他不迷信权威,乐于动手和思考,热爱自己的梦想,这样的人值得敬佩。
文章转自新智元公众号,原文链接