机器人路萌的前身——Segway Robot是建立在九号平衡车基础上的一款可以骑行的智能机器人,在2016年CES开幕主题演讲中由Intel CEO首次发布。Segway Robot 具备骑行、变形、跟随、自主导航、语音交互、互联智能家庭设备等能力,同时也是一个开放的平台,激发富有创造力的极客们扩展出更多的功能和应用。2017年CES主场馆外一个真实停车场上,Segway Robot 以全新的外观设计亮相,并正式命名为“路萌”,它与宝马做了一个智能泊车助手的应用。
2017年1月,新智元对蒲立进行采访,他谈到了“路萌”的几个关键技术。
以下是新智元对蒲立,以及赛格威机器人商业和开发者计划负责人张佳辰的采访
新智元:路萌的深度视觉技术是自己做的还是合作的?
蒲立:深度视觉我们跟英特尔深度感知计算事业部有合作,主要硬件是英特尔提供的,但是我们在软件和集成上面做了很多工作。
新智元:在软件方面,你们是怎么做视觉处理的?视觉对你们来说是否是一个难点?
蒲立:一定是的。因为视觉算法需要在不同的环境,不同的光照,不同的场景下去完成任务,它需要有非常强的适应性。现在我们也用了新的深度视觉的算法,让它达到最稳定的状态。这方面我们做了很多算法,不管是技术研发还是在已有的模块基础上进行调优和集成,都做了大量的工作。
赛格威机器人商业和开发者计划负责人张佳辰:视觉是我们非常非常重要的一块,所谓 Loomo(路萌),就是光和移动。光就是在做计算机视觉。但是这同时也是一个机器人平台,就是除了视觉之外,其实我们也有超声等传感器。另外我们通过硬件扩展的方式去添加其他的模块,包括一些开发者比较感兴趣的模块。机器人是多传感器的融合,单个方案肯定有它的局限性。但是有了这样的平台,一方面在视觉这条路上可以走的非常非常深,同时也允许它和其他的感官结合。就像我们人走路一样,不光靠视觉,也靠听觉,也靠脚感受到怎么往前走,这些信息结合起来,其实是能够找到适合不同环境的,最高表现水平的应用的。
新智元:可以进一步解释一下深度视觉吗?
蒲立:我们现在用手机摄像头拍摄的一张图片,里面只有二维的信息,它是没有距离信息的。你只能看到它的颜色,亮度等等这些信息。但是深度视觉传感器能够测量从拍照的位置到拍照对象的距离。这个距离实际上构建了周围环境的三维地图。通过这个地图可以判断哪儿有障碍物,哪些是允许机器人走过的部分,哪些是不能去的部分。我们机器人的一个很大特点,就是它在室内室外都可以进行自动导航移动。
新智元:路萌在 CES 做泊车助理的时候,好像各方面还挺稳定的,但是在其他场景下是否也可以回得到顺畅的应用?
张佳辰:泊车的场景,我们当时是在一个真实的停车场,我们并不是挑了一个空地,它是CES外面一个实际使用的停车场,所以说在这种环境下它的表现是体现实际场景水平的。 我原来是做产品经理的,我们很强调的一点是产品和市场能不能找到技术成熟度和市场接受程度的平衡点。现在能看到有很多这样的场景到达了这个平衡点,所以我们的机器人已经做到了足够有用的水平。
另外,你说的这个情况其实是个精度的问题,我觉得一方面是技术在不断提升,另一方面还要看客户能不能接受。现在我们的客户应该说水平还是比较高的,他们也看到了“路萌”实体机器人,他们觉得这个精度现在是可以解决他们行业中的痛点的。
蒲立:实际场景,肯定先从简单的问题解决起,这个过程当中我们用了很多学习算法,这个过程是一天天完成的,而且在这个过程当中我们不断的积累更多的数据,当这个机器人见到的场景越多,它会形成一个数据的规模效应,因为它有记录的能力,这些数据都会被放到云端去。
在越来越多数据的基础上,它学习的效果会变得越来越好,能解决问题的场景也越来越多,从原来只能解决比较简单的场景,逐渐过渡到比较难的场景也能实现。
新智元:在开发者项目中,开发者和你们的数据是放在一起,还是开发者只可以获得训练支持?
张佳辰:数据合作肯定是我们在开发者项目中重点之一。我觉得首先开发者计划是一种合作共赢的计划,我们是会分享给开发者相关的数据。另外我们在默认情况下,会邀请开发者向我们分享他们的数据,是非常紧密的合作。所以我觉得你说的这两种模式都是存在的。
新智元:在做路萌机器人中遇到的最大的技术方面的难点或者阻碍是什么样的?
蒲立:几个方面,在目前阶段来讲的话,更多是在硬件集成方面。我们做的是一个消费级产品。这个看似很简单的事情,实际上很复杂。
之前,一个机器人爱好者想买一个机器人,他是没办法去京东或者亚马逊上下单直接买到有这么多传感器和计算能力的机器人的。这个过程相当于我们重新创造了一个新的产品形态,这个过程是没有前人经验可以参考的,所以我们要去对很多不同的设计进行验证,才能达到像今天看到的“路萌”。它在CES宝马的展示现场能够连续三天,每天工作十个小时,每十五分钟跑一趟,在这样的工作强度下面可以达到一个比较稳定的状态。我觉得这在硬件中是非常困难的部分,但是我们非常高兴,自己已经把这部分基本上解决了。
新智元:最大的技术难点在硬件这块,就是集成这块。软件呢?
蒲立:硬件是在集成这方面。软件的话我觉得是一个持续的难点,因为大家也能看到,人工智能不管视觉还是听觉,还是交互方面的技术,其实都是在慢慢往前演进的,大家在不断把这个边界往前推,这个过程肯定是持续的。我们的优势在于软件系统可以不断迭代升级,就像我们手机APP一样,因为是基于安卓系统的,它每两个月会升级一次,可以把原来软件上没解决的问题解决掉。
新智元:现在做机器人挺多的,竞争也比较激烈,你是怎么看待的?
蒲立:我觉得我们应该是第一个把移动机器、行动机器人做到消费级产品状态的,所以我们在这个领域还是占有一定的领先优势。这个领先优势不仅在于赛格威在过去十多年连续在移动技术上的积累,也来自于我们跟行业巨头,比如英特尔的合作,这方面我们还是很有信心的。
机器人形态是人工智能在现实世界里的一种表现形式,就是把人的一些智能的行为或者智能的能力变化成一个用机器实现的方式。我们也看到,很多机器人都是在桌面上运行的,并不能移动,我们是在市场上唯一既可以在室内,也可以在室外移动的机器人。这种能力把它的应用范围极大的扩展了,相比于其他消费级机器人产品来说,我觉得我们产品是非常有竞争优势的。
张佳辰:其实我个人倒并不特别觉得机器人行业的竞争是非常激烈的,因为现在并不是很多人已经有购买机器人的需求了,所以要看一下是机器人哪个更好,要对它进行参数上的比较,谁更便宜,谁的性能更好,那是一个强竞争业态下市场的格局。 现在的情况是,机器人肯定要做,因为已经有很多人觉得,如果家里有一个机器人,或者像多拉A梦这样智能的助手是很好的。但是问题是怎么场景化,让大家真实的看到一个机器人在什么场景里能提供什么服务。目前还是在这样的阶段。所以,现有的技术水平能够解决什么样的市场问题,把它场景化,把它落地,这是我们更加关注的问题。另外,还应该关注新的形态,新的服务是不是比以前的做法更好了,不管是更有效,还是更有趣了。所以我觉得这个行业还是在早期,更多的是每一个公司思考走自己的路,可能会过相当长一段时间,才会进入完全竞争市场格局中去。当然我觉得你说的也对,各个公司肯定有资源、资金等方面的竞争,这些是间接的东西,主要的我觉得是走自己的路,更场景化落地,让它更有趣,比更前更好。
新智元:这个消费级的机器人可能会卖多少钱?
蒲立:这是一个按照消费级产品来设计的机器人。消费级产品意味着什么呢?就像 Apple 一样,当 Apple 7 出来的可能是第一个星期就会有人在网上把它拆解了,每一个零部件,每一个芯片是什么型号,这个价钱是多少,最后都能加出一个成本价。我们既然是按照这种方式做,所以这里面是没有秘密的。在消费级产品领域里,价格本身不是一个秘密。只不过在现在阶段我们还没有做好最终定价的策略,所以今天还不能说出来一个数字,但是我想说的是我们的产品是按照消费级产品设计的,所以它的价格也是消费级产品逻辑的方式。
以下是蒲立在 2017 年 1 月新智元百人会闭门论坛上的演讲内容:
从Segway到9号平衡车,再到路萌机器人
蒲立 :首先非常感谢新智元能给我们这次机会,今天想跟大家介绍我们赛格威集团新的产品线 Segway Robotics。赛格威和 Ninebot 的 9 号平衡车大家都比较熟悉,已经成为了很多人的代步交通工具,而现在我们又要在赛格威基础上做机器人,使其注入人工智能的力量。
首先,赛格威的发明就是为了更好地提高轮子的效率。在这之前,轮子能够高效行动的范围是非常有限的,汽车和自行车只能去到有公路、主干道、还有一些支线的地方;写字楼和公园都是进不去的。人每天的短距离交通还是一个非常低效的状态。
如果我们把这个细化到每个场景里面,可以看保安每天在商场、办公楼需要每天走10多公里,这个过程都是靠双腿完成的。我们也有很多时候突然接到一个电话,说下楼取个快递,然后就得下楼走上三五百米把快递取回来。
另外,很多国家也有老龄化问题非常严重,老人是有很强的社交需求的,每天需要跟其他老人沟通,很多时候会有一位阿姨会推着老人每天到公园里面去走上一个小时,跟别的老人做交流。但是这一个过程当中是需要阿姨(也就是人力)推着他走,很多国家老龄化的问题在未来的5-10年里面会变成一个巨大的社会问题,30%甚至更多的人都是需要坐在轮椅上行动不便的,单纯凭人力肯定是解决不了这个问题的。
最后一个场景是工厂和仓库。亚马逊以前检货的工人每天需要走20多公里,现在独轮车已经替代了步行。
这些问题其实很早就被人注意到了,所以大概16年前,美国发明家Dean Kamen就想发明一个能够让人非常高效灵活的交通工具,这就是Segway的诞生。但是大家也知道Segway的故事并不是一开始就特别成功,原因在于它的设计太超前,导致价格非常高。
2001年第一代产品发布的时候大概是6000美金,这是一个类似于奢侈品的价格,但是它的技术和影响是仍然存在的。大概10多年以后,中国企业Ninebot 做了一件事情,就是用新的技术、新的驱动电机电池改造了原始的 Segway 这个产品,实现了价格的大幅下降。
现在我们最新一代9号平衡车是2000人民币,这个价格的变化就导致了一个奢侈品变成了一个大众的消费品,能够让大家在每天生活当中把它用起来。NineBot的9号平衡车的续航能力、通过能力、可靠性,跟原始的Segway可能有些差距,但是在满足人类需求上是完全可以胜任的。而后来 NineBot 又收购了Segway。
现在我们就在可以看到这样一种场景,一个人本来在写字楼的13楼上班,想下楼买杯咖啡,然后骑着9号平衡车就去了,一路上整个过程是不需要下平衡车的。
在人工智能这个时代,人工智能深入各个方面的时代,为什么我们不能把人工智能的元素也注入到平衡车上面,让骑车的人就不要骑了,让平衡车自己下楼买杯咖啡,其实这个过程也是可以实现。
我们大概在一年前在 CES 2016 开幕主题演讲上发布了我们的基于9号平衡车底盘的一个机器人概念产品,下面是我们的底盘,在它上面就是英特尔的深度视觉传感器。在过去一年里面我们做的就是把这样一个原型机变成了一个真正量产的产品,在今年的CES上我们推出Loomo,中文名字叫路萌。
路萌身上有非常多的传感器,比如高清摄像头,深度视觉传感器,障碍检测传感器,以及触摸传感器等等,所有这些集成到一个实体里面,就成为了世界上第一台消费级行动机器人。
这意味着三件事情:
第一,这个机器人身上的每一个部件都至少有百万量级的存量,比如我们用的底盘是百万量级的,这意味这个机器人背后不是只有我们一家公司,我们能够享受它背后整个供应链体系的规模效应带来的一个价格优势。
第二,机器人路萌在设计的时候是完全按照消费级的标准设计,因为各个国家都会有相关的安全标准,强制或非强制的,我们完全是按照这样一种标准来设计,这个标准就让它能够符合消费产品的耐用性和易用性的要求。
第三,我觉得也是非常重要的一点,就是这个东西不再是遥不可及的,正因为前面两个条件的满足,它会变成一个量产化的产品,这就意味着个人用机器人不再只是在电视上的展品,而是我在网上下单就会送到门口的这样一个东西。
商业场景百花齐放,宝马率先加入开发者计划
路萌机器人应该以一个什么样的方式做到商业化落地呢?首先,路萌是凝聚了部件、硬件和软件一个智能行动的解决方案,这个解决方案包含几个部分:走路、看路、记路。
走路的部分就是我们Segway高灵活性底盘。看路的部分就是我们的深度视觉障碍检测硬件,再加上一些算法。还有一个方面就是记路,因为人在走路的时候得提前想好我要去什么地方,对于机器人来讲也需要这些东西,类似于我们每天用的百度地图、高德地图,所以我们会提供一个面向机器人的云端地图,这个地图存的不是给人看的一些信息,而是面向机器人的,让机器人能够识别的图象上面的特征,或者图像上面抓取的一些信息。
硬件从现在阶段里面就是路萌这个机器人产品,软件会以一个SDK的方式提供给第三方开发者,或者说其他的合作伙伴,然后他们可以基于这样的硬件软件平台,来做他们的应用开发。所以大家可以看到有一些例子,比如说有养老、速递、巡逻、教育、运送搬运等等。在每一个方面我们都会选择一些有一定实力的开发者,让他们去在我们提供的这个会走路的人基础上做更多的事情。比如养老这个领域的一个公司,会把帮助老人做智能轮椅这样一个应用。
我们目前是以一个开发者计划的方式去推向市场的,这个开发者计划第一阶段实际上已经结束了,在2016年的1月CES发布之后,我们收到好几千个开发者申请。在其中我们选了几家,宝马就是其中之一,我们跟宝马合作形式就是我们把机器人的硬件和软件SDK的部分提供给他们,他们在上面做一个基于安卓的app应用开发。
宝马做了一个智能泊车助手的应用,在CES的主场馆外面的一个真实停车场上面,每15分钟就会有人去体验一下这个宝马的自动驾驶汽车,就是最新的5系汽车,而机器人路萌等自动驾驶归来的时候,它会在停车场路口或者一个固定的地方迎接乘客,显示说:“你好,欢迎你回来,请你在这儿下车”。然后这位乘客就在这里下车,路萌会引领自动驾驶汽车找到一个空闲的车位,然后再倒车入库。
实际上很像在美国在很多酒店的泊车人员,路萌就是可以代替这些泊车人员的一种很好的体验。整个这件事情非常有意思的就是,我们把路萌的硬件和SDK交付到宝马德国总部到CES展示,一共只有35天的时间。
这个demo当时是在拉斯维加斯演示了3天,每天持续8-10个小时时间,15分钟演示一次,机器人是一直在不停地工作。想象一下在一个室外工作场景,人每天工作8个小时,连续3天还是挺辛苦。路萌完全可以胜任这样一个工作,所以我们觉得这是一个非常好的应用展示。
我们从 2015 的 CES 到现在已经收到了数千个来自全球各地的机构和个人开发者的申请。这里面有学校,可能他们想要做的应用是教育科研类的;有大的一些IT行业的公司,可能像谷歌、Amazon这样的公司,他们可能想做跟这个机器人应用相关开发的公司;还有一些公司像一些银行,他们想做的就是终端应用,想把机器人放到他们的门店里,能够代替原来在门口迎接顾客的一些人,来做一些简单的宣讲。
我们看到实际上这个模式非常有意思,有一些东西在终端应用的地方他自己就能开发。有一些东西是需要一个中间的解决方案提供商,将我们的机器人智能行动能力集成到他现有的系统里面,然后提升已有客户的产品体验,然后达成客户和他之间的一个共鸣方式。所以我们也是想在这些方面做一些更多的探索。
这就是我们今天对SEGWAY Robotics的介绍,我们希望是将我们的智能行动能力,解决方案能够带给更多的开发者,在更多的场景里面实现那些真正能够提高效率的应用,谢谢各位!
观众提问环节
提问:如果是平衡车的话,它上面有个“脑袋”怎么去骑?
蒲立:实际上它可以变形的,它是一个机器人,当我摁一下它的变形键,它会自动变成一个平衡车。大家可以看它的头是可以上下运转的。头可以翻下去之后就变成一个平衡车,站上去就可以骑了。
提问:这个“脑袋”的成本是多少?
蒲立:因为我们目标是做一个消费级的产品,所以我们所有做事的方式都是按照消费级产品来做的,就像苹果7出来以后,可能过了一个星期网上就有拆解每一个芯片多少钱,其实我们这个是类似的,如果看一下开始卖了,大家拿到之后一拆就知道里面有一个英特尔的硬件,这些都是百万量级销量的部件,大家都清楚它的价格,也没有什么秘密。但是我们还在最后做一个核算,没有给出一个准确的数字,所以这个价钱应该是一个良心价,因为定价方式是这样一种定价方式,不会太偏高。
提问:我们在CES上面体验这个泊车机器人的时候会有一个疑问,既然它是一个无人驾驶车,它应该跟停车场之间应该可以有自动的通讯,或者说如果有一个智能停车场的话可以自动分布泊车位,为什么需要一个机器人,难道你这个机器人可以跟乘客进行语音交互吗?
蒲立:没错,其实这个机器人本身是语音交互功能的,就像刚刚视频里你也看到了,这个语音除了提供自动的智能行动能力之外,因为我们知道机器人是在跟人并行的环境下运行,所以一定要跟人交流,所以我们这个SDK里面也包含了语音和交互方面的接口。
那么为什么是一个自动驾驶车还需要机器人来引导。其实宝马想提供的是一个Valet Parking体验,不是说单纯的让乘客下车了。其实它是一个服务,这个服务可以有很大的延展性,比如现在只是立了一个牌子,但是以后可以扩展到app,这个人下车之后可能想去酒店大堂不知道怎么走,这个机器人就可以带它过去。您就把它想象成一个停车场的工作人员。我觉得任何科技进步都不是完全替代人,只是说让我们的生活从这种非常繁重的事情里面解放出来。
提问:你预计这个停车场需要几个这样的机器人?
蒲立:其实停车场里面有很多工作需要做,比如要问路,要泊车,而且有很多问题就是我们在停车场里面找不到车在哪,但是机器人可以来回扫,就知道车在哪儿,门口有个机器人你去问它的时候,它就能带你过去,这些事情都是可以做的。
提问:现在机器视觉已经不是个技术问题了,其实充电才是一个比较大的技术问题,您能说一下路萌的充电时间是多少吗?它的运行时间是多少?
蒲立:目前来讲它的电池是跟我们的9号平衡车底盘是一样,9号平衡车一个人站在上面大概七八十公斤,带着这个重量可以16公里/小时的速度跑上23公里,然后冲一次电这个电池大概是3-4个小时,所以您可以看到这个过程实际上是载重的,但是当它不载重的时候,从早到晚8-10个小时没有问题,然后晚上进行充电。
提问:其实CES上面有很多无限充电的技术,有没有考虑过无线充电?
蒲立:让机器人回到充电桩自动充电这个技术不是一个复杂的事情,而且这个技术已经出现很多年了。您提到无线充电可能更多的是从效率来讲,我们这里因为是一个功率的充电组,所以还达不到。
提问:现在还没有量产,你可能也很难预计,但是我觉得路萌不是便宜的东西,因为原先的平衡车是用非常大众的价钱,现在路萌的价钱大概在什么区间?
蒲立:Intel 的 RealSense 系统其实不贵,它第一代是为笔记本电脑设计的,我们选择RealSense,就是看好它大量级的,我们目标就是把它做成一个消费级的产品,所以每一个传感器像比如说我们超声传感器,也是跟汽车上的超声雷达是一样的,尽量选用已经有的有量产的,最后我们只是做了一个集成,但是这个集成的工作比较复杂,因为这样一种产品形态把这些东西集成到这样一种形态里面是没人做过的,我们做的其实是这样一个事情。
提问:现在养老领域有没有服务家庭的这么一个产品?
蒲立:这个目前还没有一个解决方案,但是应用场景方面我们跟新加坡的合作单位讨论的比较多,他们的研究提到,新加坡的老人很多都住在楼里面,60%被送去医院的老人都是因为老人长时间没喝水,脱水导致的,这个也是刚才新加坡的那位教授提到的,实际上只需要做一个很简单的事情,就是观察老人有没有脱水的症状,如果有的话递一杯水,或者提醒他去喝水就好了。这个领域是可以很容易提升的。
提问:我们以前对机器人的印象是它的运动距离比较短,对环境的光照条件也受一定的影响,然后噪声也比较大。你怎么看?
蒲立:您提的这个问题非常对,其实这个问题也是一个技术方案的选择,我们现在用的这个型号的是一个双目的方案,在一些暗光条件下需要一个辅助投射光源,这个在我们机器上也有。室内室外更多的是区别于在光照变化的复杂程度上面,室外场景,特别是一些室外的大平面那种场景,对于白墙,对于双目成像是非常困难的,但是我们在设计的时候所有都考虑了互补,或者说冗余,比如说地上既有光学原理,也有一些其他的,结合起来就达到一个比较好的效果。
文章转自新智元公众号,原文链接