从2份专利文件,一窥Amazon Go到底藏了什么黑科技?

今天的Amazon Go刷爆了国内外的社交媒体。

Amazon Go令人惊艳的地方,就是你可以径直走进超市,选好货品之后立马离开,不用在收银台前排长长的队伍,等待结账。

甚至还莫名有一种从商店“抢劫”的快感。

我们说,移动支付颠覆了既有商品交易方式,那么这种“抢劫式”的Amazon Go甚至连“交易感”都消灭了。

总之,人们被这种新奇的似乎隐含了某种黑科技的新型购物方式所吸引。不仅是普通人,就连斯坦福教授李飞飞、著名科技出版公司O'reilly创始人Tim O'Reilly都特地发推点赞。

李飞飞:计算机视觉十分显著和绝妙的应用!

Tim O'Reilly:零售业的未来,我对此已经期待很多年了。

Amazon Go的亮点

用户进入商店,穿过闸机的时候打开手机让其识别,这时手机里的系统启动,并随时准备更新物品清单。令人惊艳的部分就是,在用户拿走或放回物品的一瞬间,手机里的系统会自动更新清单。最后,用户拿着物品满意地离开,手机自动扣款。

这里面到底有什么黑科技呢?就官方发布的视频来看,技术亮点有三个:机器视觉、深度学习算法和传感器融合

但仅有这几个关键词还是不够的,雷锋网遂向亚马逊在职员工进行采访,但是对方表示Amazon Go还属于保密项目,公司要求不能对外透露任何细节。

不过在Quora上,有一位名为Brian Roemmele的网友挖出了几年前亚马逊提交的两份专利文件,里面描绘的系统跟如今的 Amazon Go非常相似。这两份文件名称为:“侦测物体互动和移动”(Detecting item interaction and movement)和“物品从置物设备上的转移”(Transitioning items from the materials handling facility),两文件分别于2013年和2014年申请(感兴趣的朋友可以在公众号回复关键词“专利”,下载2份专利文件)。

这两份专利文件都描绘了十分庞杂的应用场景,包括:货仓、船运、零售市场等,所以很多人当初在看到这份文件时,都以为这是亚马逊为自己的仓储系统量身定制的,不过今天一切真相大白。

这两份专利分别讲了什么?

“侦测物体互动和移动”(Detecting item interaction and movement)这份专利的摘要是:

用户从一个货架上拿起或放下一个物品,货物管理系统可以侦测到这个动作,并且更新用户移动设备里的清单。

“物品从置物设备上的转移”(Transitioning items from the materials handling facility)这份专利的摘要是:

物品被识别,并且当用户正在拿起物品时,物品自动与用户发生关联。 当用户进入或穿过一个“转移区”(Transition Area),被拿起的物品将自动转移到用户,而不需要用户有任何的输入。

总的来说就是,被识别的物体与用户发生关联,能自动更新清单,并在“转移区”进行自动交易(“转移区”在Amazon Go里指的就是商店的出口)。

我们可以从下面一张图里,一窥 Amazon Go 的基本原型。

图中代号为208的物体都是摄像头,大约有10多个(有一些被人体挡住)。208摄像头分别置于天花板(如图左右两边各有一个比较大的摄像头)、货架两侧和货架内部。文件里描述到,天花板上的208用来采集用户和货品的位置、货架两侧的208用来捕捉用户的图像和周围的环境,货架内的208用来确定货品的位置或用户手的移动(进入和离开货架)。

而从视频里,我们隐约能够看到安置在货架内部的摄像头。

另外,专利文件里还补充道:这里的摄像头可以是多种类型的,可以是RGB摄像头,或深度感知摄像头。除了摄像头之外,也可以有其他输入设备,比如压力传感器、红外传感器、体积位移传感器、光幕等等。压力传感器可以侦测物品移出和进入的时间,红外传感器可以用来区分用户和的手和物品。

我们具体并不清楚Amazon Go到底在多大程度上使用了计算机视觉技术。比如说,当用户进出商店时,都需要对用户进行识别,文件里反复提到可以用人脸识别技术实现,但是又会继续补充说明可以通过手机等移动设备来侦测。

Quora网友Anurag Ranjan是一位机器视觉和深度学习领域的准PhD,他分析称:

Amazon Go使用商店里的摄像头识别出了用户,可能针对用户拍了几张照片,依靠一些标准的深度学习网络形成了一幅特征图,比如Resnet,、GoogLeNet 或者 VGG 这样的。总之,当用户踏进店里的那一刻起,Amazon Go就知道用户长什么样了。

但是根据专利和既有经验来看,在整个过程中用计算机视觉来追踪用户,代价太高了。我们大致可以确定的是,货架上的一排排摄像头应该就是对用户进行“动作识别”,并且识别出物体是否被拿走(这里也或许是传感器实现的)。

不过整个过程中的难点是,如何将物品与用户进行唯一绑定

云从科技高级算法工程师周翔告诉雷锋网(公众号:雷锋网),Amazon Go具体用到哪些技术,目前我们只能够猜测,他提到可能的实现机制是:

通过手机做到了精准定位人,然后物体的具体位置可以大概确定,一旦人附近的物品离开,同时最近的人的ID就会关联这个物品ID。

置物架肯定用到了压力传感器,一旦物品离开,就会明确知道什么物品在什么地点离开,一旦物品回来,压力传感器同样会感应到。

深度学习可能是学习了人的购物习惯,可能用到计算机视觉做了人的动作识别,然后根据物品与人的ID进行关联,也就是二次确认。同时分析一个人的购物喜好,推测他会买的东西,提前做一些预判。

周翔提出,可能Amazon Go根本没有用到人脸识别的技术,“国外对人脸的隐私权是比较高的,未经允许采集他人的人脸会被起诉的”。雷锋网也关注到,在李飞飞的那篇推文下,有网友对此持抵触态度,认为如果是人脸采集,侵犯了自己的隐私。

Amazon Go的出现惊艳了很多人,不过并不是所有人对此表示欢迎,除了上文提到的隐私问题外,有不少人担忧,如果这种技术大范围普及(我们知道亚马逊是多喜欢2B业务),大量超市收银员将会失去工作,毕竟亚马逊在视频里承诺要在 2017年初,于西雅图上线第一家Amazon Go。

不过这种技术究竟有多少“实操性”,还是存在很多的疑惑的,例如:

  • 如果好几个人挤到一起买同一类东西(比如商场打折抢货,这是经常发生的),那么物品与人的ID关联还能保持精准吗?
  • 如果用户把商品放回的位置是错的呢,这样也会被收费吗?
  • 如果有人搞怪,将自己家空果汁瓶取代商店里的新鲜果汁,那么Amazon Go识别的出来吗?

“所以,这里要求购物的人得非常有素质才行”,周翔对雷锋网说道。我们对Amazon Go的诸多疑惑,或许过几个月就能在西雅图见分晓。

相关文章:

深度丨 Yoshua Bengio 得意门生详解机器学习生成对抗网络(含86页PPT)

本文作者:亚萌

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-20 03:20:28

从2份专利文件,一窥Amazon Go到底藏了什么黑科技?的相关文章

苹果专利文件显示iPad将配备前置摄像头

苹果在中国申请的一项专利技术显示:未来的iPad平板电脑将可以横向放在一个底座上 北京时间9月26日晚间消息,据国外媒体报道,苹果在中国申请的一项专利技术显示,未来的iPad平板电脑将可以横向放在一个底座上. 这份专利文件的设计图显示,新款iPad将具备一个30针Dock接口,可以横向插在一个底座上.此外,新款iPad还具备一个"智能边角",可能是方便用户在阅读电子书或其他文档时自动翻页. 设计图还显示,iPad屏幕上方出现一处小孔,可能是用于安装摄像头,从而支持FaceTime视频通

苹果专利文件显示未来iPhone可获取海量信息

近日曝光的一份苹果http://www.aliyun.com/zixun/aggregation/18846.html">专利申请文件显示,未来iPhone将拥有非常广泛的用途.利用近距离无线通讯技术或条形码扫描技术,未来iPhone用户可以实时获 取大量商品信息,以及该商品相关的促销等信息. 这份题为<提供商品和服务内容相关信息的系统与方法>(System and Method for Providing Content Associated with a Product o

微软申请端对端加密技术 专利文件公开

近日,美国专利和商标局USPTO一份微软递交的端对端加密方案(end-to-end encryption)的专利申请文件被公开,这份专利文件申请的是"通过运行验证软件为硬件设备进行端对端加密的安全技术".该专利申请文件描述了一种 用户.设备端.应用/服务端的端对端的数据加密方法,或将进一步提高微软多平台系统未来的安全性,目前微软桌面系统已经集成了BitLocker数据加密 技术.     对于微软为何要申请新的端对端加密技术,USPTO Applicaton #20160099811号

六张图看懂 Amazon Go智能购物,专利文件解密AI 核心技术细节

亚马逊Go推广视频:1分钟,颠覆你对线下实体购物的认知 几天前,就在亚马逊迎来可能是公司史上最大的 Holiday Season时,亚马逊发布了一段介绍旗下新的零售商店 Amazon Go 的视频,消费者可以直接走进商店,拿下货架上的货物,然后离开.整个过程不需要排队,也不用结账. <福布斯>的记者 Ryan Mac 说:"这看起来非常有趣,充满了未来感,但是,至少目前为止,这一切还都只是宣传." 每年从感恩节到圣诞节的长假中,亚马逊都会成为媒体上的最大赢家.2013年,B

这份内部文件可以告诉你苹果对大屏iPhone的真实

摘要: iPhone 6 将采用更大尺寸显示屏的传闻已经被粉丝和媒体传得几成事实了,苹果似乎肯定会在今年秋季再次推出一款(或者两款)放大后的 iPhone. 为什么?根据一份机密文件(最先由 iPhone 6 将采用更大尺寸显示屏的传闻已经被粉丝和媒体传得几成事实了,苹果似乎肯定会在今年秋季再次推出一款(或者两款)放大后的 iPhone. 为什么?根据一份机密文件(最先由 recode 公布),是用户对大屏及平价智能手机的强烈需求,运营商的压力以及竞争对手的成长三个因素的重压下使向来 "固执&q

这份内部文件可以告诉你苹果对大屏的真实想法

摘要: iPhone 6 将采用更大尺寸显示屏的传闻已经被粉丝和媒体传得几成事实了,苹果似乎肯定会在今年秋季再次推出一款(或者两款)放大后的 iPhone. 为什么?根据一份机密文件(最先由 iPhone 6 将采用更大尺寸显示屏的传闻已经被粉丝和媒体传得几成事实了,苹果似乎肯定会在今年秋季再次推出一款(或者两款)放大后的 iPhone. 为什么?根据一份机密文件(最先由 recode 公布),是用户对大屏及平价智能手机的强烈需求,运营商的压力以及竞争对手的成长三个因素的重压下使向来 "固执&q

HTML乱码 只能另存一份html文件才能解决这个问题

问题描述 HTML乱码 只能另存一份html文件才能解决这个问题 网上下载的五星评价插件,html文档打开以后字体乱码. 解决方法: ① <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> 还是不行 ② 文本文档方式打开,重新另存为,格式保存为 utf-8 还是不可以解决乱码的问题 最终解决办法:webstrom 打开另存为 ...html,换了一个标题重新保存了一份

2.4万份敏感文件被盗美军遭“最严重网络袭击”

南都讯 美军主管网络安全事务的国防部副部长威廉·林恩14日称,今年3月五角大楼遭受历史上最严重的一次网络袭击,计有2.4万份敏感文件被盗走. 林恩当天在位于华盛顿的美国国防大学发表演讲期间披露了3月份五角大楼遭受网络袭击的情况.他称,攻击者当时侵入五角大楼一家承包商的电脑系统,一次性盗走2.4万份敏感文件,但他没有说明承包商身份及被盗文件重要程度,也未谈及承包商电脑被入侵时的其它细节. 据信这是美国军方迄今遭受的"最严重网络袭击".林恩去年8月曾披露,2008年美军网络遭遇过一次猛烈袭

windows-请大家帮帮忙,能安装JMF的拷一份dll文件给我吧,我电脑悲催地无法安装。。。

问题描述 请大家帮帮忙,能安装JMF的拷一份dll文件给我吧,我电脑悲催地无法安装... 我下载了jmf-2_1_1e-windows-i586.exe总是安装不上,找不到原因,向导都没进去,直接提示:corrupt cabinet file! 暂时是解决不了,不知道哪位大神能帮帮我... 如果不行的话只能讨点dll文件了,我已经下了JMF的jar包,就少了那些dll了... jmacm.dll jmdaud.dll jmutil.dll jmgsm.dll jmam.dll jmcvid.dl