格灵深瞳让计算机看懂这个世界

摘要: 站在风口上,猪都能飞起来。但关键是下一个风口会在哪里?不同的人肯定有不同的看法,比尔盖茨给出的答案:IT界的下一个大事件是 计算机视觉(computer vision) 与 深度学习(deep

站在风口上,猪都能飞起来。但关键是下一个风口会在哪里?不同的人肯定有不同的看法,比尔·盖茨给出的答案:IT界的下一个大事件是 计算机视觉(computer vision) 与 深度学习(deep learning) 的结合。今年6月中旬访问北京时,他到访的第一家创业公司也是一家计算机视觉的公司。

这家公司就是格灵深瞳,今年6月刚刚获得来自红杉的数千万美元A轮融资。近期,我们也和格灵深瞳的创始人何搏飞聊了下计算机视觉和格灵深瞳正在做的事情。我也把其中很有意思的点也整理了出来。

让计算机可以看懂这个世界

几千年前,人类就已经发明了文字;几百年前,人类已经制造传递了声音;直到最近几十年,人类才发明了动态图片,也就是视频。与文字、声音相比,视频承载了更丰富的信息量。要完全提取、“读懂” 视频里的信息量,即使对人来说,也都不是一件容易事。试想下,当玩着手机去看电视时,我们会丢失掉多少信息呢?虽然机器缺少大脑,不会思考,但与人相比,也有计算能力强的优势。如果我们可以教会计算机看懂这个世界,是不是就会有质的改变呢?

那要如何才能教会计算机看这个世界呢?十几年前,学界还专门有场争论。本世纪初,有不少专家认定,凭借着现有的摄像头,加上强大的算法,就能建立起一套完善的计算机视觉机制。当时,还有一些人不这么看,当时还在布朗大学读书的格灵深瞳创始人赵勇,就是其中之一。赵勇他们觉得,我们看到的这个世界是三维的,而传统的计算机视觉机制用到的是二维的摄像头,无法还原这个世界的真实情况,在这个基础上完成的视觉分析,也会大打折扣。这样的想法,在当时看起来离经叛道,十几年后才被业界逐渐认可。

做第一个将计算机视觉商业化的公司

事实上,教机器看懂这个世界,很多年前就有人在做了,只不过采用的是“摄像头+强算法”的理论框架。Google、百度也有在做,但不同的是他们想做的还是搜索、社交。格灵深瞳则想要将计算机视觉商业化。用何搏飞的话说,他们想“做第一个将计算机视觉商业化的公司”。

提到格灵深瞳或者打开他们的官网,好多人估计都会以为这是一家做智能安防摄像头的公司。这个定位只是表象,其实更确切的形容也许是“计算机视觉以及人工智能”,他们想让计算机像人一样主动获取视觉信息并进行精确的实时分析。安防“摄像头”只不过是一个商用的具体表现。

大家都知道,安防是个大市场,这个市场到底有多大呢?我们就来简单的列两个点:(1)去年中国智能手机的销售额是3200亿,而安防设备的销售额则达到了4000亿;(2)杭州最大的公司是阿里,那第二的公司是谁呢,是做安防摄像头的海康威视,已经在深圳上市,市值去年已经接近中兴的两倍。

而如此大的市场,却有两个问题至今没有办法解决,一个就是看不见,一个就是找不到。先来说看见的问题:一个像机场大小的公共场所,摄像头的数量能够达到几万台,而同一时间负责监控视频的安保人员大概也只有几个人;视频监控界往往都采用了视频画面轮播的机制,每过多久自动切换屏幕上显示的监控视频画面;所以,那些真正有信息价值的画面被人看到、注意到的几率就很小很小了。

据说,全球50%的硬盘都用来存储监控视频了,可想而知,监控视频的数量有多大。以北京天安门为例,每天产生的监控视频数据,刻成光盘摞起来,就比埃菲尔铁塔还高。要在全球75%的硬盘或者比埃菲尔铁塔还高的光盘里找出来某一个画面,难度估计不亚于大海捞针吧。

写到这里,估计你就知道格灵深瞳的安防产品能解决什么问题了吧。格灵深瞳通过三维视觉感知技术,实现对人物的精确检测、跟踪,对动作姿态(包括暴力、跌倒等危险行为)和人物运动轨迹(包括越界、逆行、徘徊等可疑轨迹)的检测和分析。在自动场景和人物检测的基础上,自动给安保人员提供预警信号,主动提醒、报告异常,保障安保人员“看得到”。

同时,格灵深瞳通过三维视觉感知技术,抽象出人物的特征,从非时间的维度进行监测、跟踪、搜索,真正做到“找得到”。

今年10月份,他们就要将自己的这套安防产品进行试点布局了。首批试点的会是四大行中的三大行。而之所以会选择银行,何搏飞告诉36氪,是因为他们看中了银行对安防的需求,以及银行安防方案的可复制性。银行是除了政府以外,最大的安防设备采购商,同时也愿意不断增加安防产品的数量。加上国内银监会严格规范了银行的室内布局,这种复制性就会挺高。

让线下零售“电商化”

电子商务兴起,给了商家“精细化”运营的重要数据支撑,对线下零售产生了重大冲击。在零售领域,格灵深瞳也可以通过三维视觉感知技术,对消费者行动轨迹以及行为模式进行检测、跟踪和搜索,精确统计出在设定的热点范围内的客流量、停留时间、行动轨迹、消费者行为,提供客观的消费行为分析数据,帮助传统零售客户转向数据驱动的管理方式,提高商业运营效率,在线下“电商化”。

事实上,除了商超、零售店,每年都会有大量的品牌商,花费重金找咨询公司购买数据和分析报告。在线上,消费者可以很容易打开无数个网页,浏览每一个商品花费的成本很低,但在线下,用户每一个浏览行为、采购行为都是有成本的。因此,格灵深瞳他们统计的数据也就更加珍贵、有意义。

我们的生活会发生什么样的改变

监控摄像头已经潜移默化地融入到了我们生活的方方面面,但事实上这些安防摄像头发挥的作用还很有限。虽然有几千个摄像头,但发生暴乱、扰动时,往往还是依靠现场的人电话报警。在“敌众我寡敌强我弱”完全不占优势的“烧杀抢夺”情境下,普通大众往往会成为无辜的受害者。格灵深瞳的产品里增加了一个很贴心的功能,挥动双手自动报警。如果不考虑安保人员的疏忽、不负责、不行动等因素,也许就能起到一定的保护作用。当这样的设备普及,未来就能很好的起到对犯罪的威慑作用,这才是真正的社会意义所在。

把视野再扩大到个人安全以外的公共安全,格灵深瞳完全可以在此基础上提供更多的产品与解决方案。未来,也许地面上警务人员就可以带上类似Google Glass一样的智能眼镜,实时显示着监控中心传来的画面与位置;天空上则飞行着搭载格灵深瞳产品的无人机,实时根据监控中心视频分析的结构,追踪可疑人物,真正做到无路可逃。

想想这样的世界,很安全,但是否不寒而栗,我们的隐私何在?任何一家做图像分析的公司,估计都绕不开这个难题,格灵深瞳也一样。何搏飞说,他们做的是趋势的研究,不会去精确分析到底是谁。而安全与隐私,何去何从,未来大众肯定会用自己的方式投票。

硬件复兴到底会往哪里去

与何搏飞聊天的时候,我忽然想到了前几天和Makeblock的创始人王建军聊的一个问题,就是硬件复兴到底会往何处去。当时王建军提了一个很有意思的观点,硬件复兴其实是有两个层面的,一个是像可穿戴设备这样的应用层层面,另一个则是像芯片、技术这样的基础层层面。格灵深瞳、诺亦腾这些我们报道过的公司,其实都可以算做这种基础层的公司。

PS:

他们最近也在招聘计算机视觉工程师、软硬件工程师、BD、PR和行政人员,感兴趣的童鞋可投简历至邮箱 (hr@deepglint.com)。

时间: 2024-07-31 13:35:44

格灵深瞳让计算机看懂这个世界的相关文章

格灵深瞳:如何让机器读懂人?

   xGoogler和斯坦福商学院的背景,在成立一年多时间里拿到两轮融资,并且A轮高达数千万美金:盖茨在今年访华时特地造访了这里--跟绝大部分窝在咖啡馆和孵化器中的创业团队不同,格灵深瞳俨然是软硬结合创业的优等生. 这支盖茨看好的团队长在颐和园北面一座临河的四合院内.格灵深瞳的产品现在是一套将图像识别和人工智能结合的安防系统,但团队的CEO何搏飞在接受宅客君采访时强调他们不是一支简单做安防的团队. 给人工智能接上地气 "人工智能"在过去10年内作为一个热词不断穿插在电影和科技媒体的报

格灵深瞳 CEO 赵勇:Nvidia成功背后的远见与坚持

雷锋网按:本文作者赵勇,格灵深瞳 CEO,雷锋网(公众号:雷锋网)授权发布. 2016年人工智能最吸引眼球的事件莫过于谷歌旗下的DeepMind依靠人工智能算法的阿尔法狗在围棋比赛中大胜人类顶尖选手.但要算商业价值的落地,2016年人工智能的赢家则非Nvidia(英伟达)莫属.这家全球领先的显卡公司最新的季度财报(截至2016年10月30号)显示该公司的营收比去年同期增长54%,尤其是在数据中心业务方面有了两倍多的增长.该公司的股票在过去的一年中也增长了4倍多,稳坐了标普500的榜首. Nvid

何搏飞时期的格灵深瞳,吹过哪些别人不忍戳破的“泡泡”

"如果说格灵深瞳早期的公关策略效果显著,那只是因为你没看到后来他们为之付出的代价." 近日,格灵深瞳正式确认 CEO 兼联合创始人何搏飞离职震惊整个 AI 创业圈.先抛开何搏飞离职的原因不谈,今天来扒一扒何搏飞在任期间,格灵深瞳对外说了哪些不太体面的公关措辞. 2014 年 7 月,一则以<对不起,我们只爱牛人>的招聘启事刷爆各高校计算机系学生的朋友圈.格灵深瞳通过秀优越的方式向人们展示了他们的软.硬实力.同年,多家媒体和知乎等平台上也充满格灵深瞳的故事. 这些故事里,格灵

预告:AI将如何重塑安防科技(格灵深瞳CEO赵勇主讲)丨硬创公开课

AI 技术的成熟,使得由人工智能来自动消化海量监控视频数据成为可能.目前,人工智能已经逐步渗透到安防行业,最终将会把以视频网络为核心的安防产业,重塑为以结构化数据为核心,以精确情报生产为目标的智慧物联网产业. 作为智能安防的先行者,格灵深瞳在近 4 年间推出多款应用于安防的 AI 产品,包括基于三维计算机视觉技术的皓目行为分析仪.威目视图大数据分析平台.威目车辆特征识别系统,以及全新产品"深瞳人眼摄像机".在本期雷锋网硬创公开课上,格灵深瞳 CEO 赵勇博士将基于自己多年的研究和行业经

格灵深瞳出手,灵异视频告破

案例回放 一个宁谧的夜晚,空荡荡的十字路口 一辆白色的小轿车,配角一号出场,左转通过路口 接下来,一辆深色的小轿车,配角二号,右转通过路口 注意,蹬着一辆三轮车的男主角从左边出场了,而图像上方显示着明亮的车灯,预示着危险的到来 三轮车继续驶向马路中心,而从图像上方快速驶来的大卡车此时也向路中心疾驰而来.注意,图像的右侧这时闪出一片灵异的亮影,仿佛有什么东西快速地向马路中心冲过来 三轮车和大卡车眼看就要撞在一起了!就在这千钧一发的时刻,英雄终于现身了!上一帧里化作一团光影的神秘物体终于在汽车的灯光

让计算机可以看懂这个世界

摘要: 站在风口上,猪都能飞起来.但关键是下一个风口会在哪里?不同的人肯定有不同的看法,比尔盖茨给出的答案:IT界的下一个大事件是 计算机视觉(computer vision) 与 深度学习(deep 站在风口上,猪都能飞起来.但关键是下一个风口会在哪里?不同的人肯定有不同的看法,比尔·盖茨给出的答案:IT界的下一个大事件是 计算机视觉(computer vision) 与 深度学习(deep learning) 的结合.今年6月中旬访问北京时,他到访的第一家创业公司也是一家计算机视觉的公司.

红杉投资格灵深瞳

2014广朿6日,红杉资本中国基金投资北京格灵深瞳科技有限公司数千万美元.北京格灵深瞳科技有限公司是一家专注于计算机视觉以及人工智能的科技公司.格灵深瞳聚焦在把先进的三维图像处理和模式识别技术带入到安全监控和商业分析等应用领域.致力于让计算机像人一样主动获取视觉信息并进行精确的实时分析,释放人工智能最大的潜能为人服务.现阶段聚焦于将全球领先的人工智能及模式识别技术应用到安防.交通〿a href="http://news.pedaily.cn/industry/零售/" target=_

让冰冷的机器看懂这个多彩的世界

从茹毛饮血的蛮荒,到钢筋水泥的城市,人类逐步将自身能力投射到计算机上.无论是计算能力,还是记忆能力,计算机的如今表现都堪称卓越.但仅拥有这些还远远不够,我们期待计算机可以做得更多.一部风靡全球<星际穿越>激起了无数人对探索浩瀚宇宙奥秘的渴望,也让许多人记住了Tars这个聪明可爱.幽默风趣的智能机器人.人工智能主题的好莱坞电影一直广受影迷们的喜爱,人类用无尽的想象力和炫目的特技构筑了一个又一个无比精彩的未来世界,令人如痴如醉.不过,回到现实,计算机科学家们的行动力却看似远远赶不上电影艺术家们的想

十分钟看懂图像语义分割技术

大多数人接触 "语义" 都是在和文字相关的领域,或语音识别,期望机器能够识别你发出去的消息或简短的语音,然后给予你适当的反馈和回复.嗯,看到这里你应该已经猜到了,图像领域也是存在 "语义" 的. 今天是 AI 大热年,很多人都关注与机器人的语音交互,可是有没有想过,将来的机器人如果不能通过图像来识别主人,家里的物品.宠物,那该多没意思.说近一些,假如扫地机器人能够机智地绕开你丢在地上的臭袜子而扫走旁边的纸屑,一定能为你的生活解决不少麻烦. 没错,图像语义分割是 AI