【iPhone X重磅发布】携A11人工智能芯片登场,人脸识别9大特征

苹果13日凌晨发布了本年度最重量级的产品——iPhone X (iPhone 10)。这款用人脸识别进行解锁的新iPhone 可能是苹果AI属性最强的一个产品了。在发布会现场,苹果介绍了A11生物神经网络引擎”这一AI芯片,近期,以智能手机为主的终端设备定制芯片已经形成一种新的趋势,我们将在文章中进行重点介绍。另外,本文也会介绍苹果在人工智能上的实力储备情况:主要从四篇经典论文谈起。

北京时间9月13日凌晨,苹果在新的总部召开发布会,发布新的智能手表、电视和手机等一系列新产品。这是最受科技界关注的发布会之一。

今年的苹果新品发布会首次在苹果新总部的史蒂夫•乔布斯剧院举行,苹果CEO蒂姆•库克在发布会的介绍中,重申了乔布斯精神。本次发布会最受关注的便是苹果的新手机,传说中的iPhone8,令人惊喜的是,苹果本次发布会带来了最最重量级的智能手机——iPhone X (苹果10)。增加了人脸识别解锁Face ID的这款新手机,应该是迄今为止这家最受关注的智能手机生产商推出的最AI的一部手机了。

首先,这是一部全屏幕的、没有Home键的iPhone,支持无线充电。

iPhone X 最值得关注的一点便是通过人脸识别进行解锁,这在苹果发布会之前就已经传得沸沸扬扬的功能终于得到了确认。

苹果人脸识别解锁9大特征

根据苹果在发布会现场的介绍,苹果的人脸识别解锁Face ID包含了9大特点:

  • 人脸验证 (Face authentication)
  • TrueDepth 摄像头
  • 验证简便
  • 专门的神经网络
  • 自然和安全
  • 用户隐私
  • 注意力察觉
  • 自适应性
  • Apple Pay和其他应用的绑定

根据官网的介绍,Face ID 功能通过原深感摄像头来实现,设置起来也非常简单。它会投射超过 30,000 个肉眼不可见的光点,并对它们进行分析,为你的脸部绘制精确细致的深度图。

详细来看,在安全上,苹果自称,他们人脸识别的错误率是百万分之一。另外,数据的处理都是在设备上进行的,解锁是会通过识别用户的注意力来进行判断。

具体可以再看一下另一大特点:TrueDepth 摄像头

技术核心:苹果 A11 和 A11 Bionic 芯片

据介绍,iPhone X 将采用定制的芯片来处理人工智能工作负载。这是一个双核的“A11生物神经网络引擎”(A11 bionic neural engine)芯片,每秒运算次数最高可达6000亿次。

该芯片赋能的最重要的事情就是使 Face ID 身份认证功能能够快速识别人脸,从而解锁 iPhone X 或进行购物。




这个消息并不出乎意外。早在今年5月,彭博就曾经报道,苹果公司正在为iPhone开发AI芯片,但不清楚该芯片是否已经准备好可以用在今年最新的iPhone产品上。

而且,芯片走向定制化,以满足AI软件的需求,在行业中已经变成一股新的大趋势。 Alphabet的谷歌已经设计了两代芯片来处理数据中心的AI计算工作负载。 微软也为未来版本的HoloLens混合现实头盔开发了一款AI芯片。

在iPhone上安装新的专用芯片意味着主芯片的工作量将会减少,从而提高电池寿命。 否则,例如,通过手机摄像头进行物体识别同时进行视频录制时,可能会迅速地将电池消耗完。

此外,在不久的将来, iPhone以外的更多移动设备都可能包含针对AI的处理器。



Burke 在今年的谷歌 I/O 会议上曾说:“随着时间推移,我们预计会看到专门为神经网络的推理和训练设计的DSP(digital signal processors,数字信号处理器)的出现。”

虽然今天的消息肯定会占满新闻头条,但苹果其实以前就已将AI用途的芯片置于iPhone中。iPhone 7就包含有一个FPGA,这是英特尔和微软为加速AI任务进行探索的。据福布斯报道,在iPhone7之前苹果没有在iPhone中使用过FPGA。

苹果对于芯片开发并不陌生。苹果已经在它的 iOS 设备上对其A系列处理器给予重视,并且在智能手机上专门使用了某些计算类型的组件。

本次发布会上对此前苹果一直重视和宣传的 Siri 着墨甚少,并且在最新的iPhone上,还特别强调,没有了Home键以后,可以通过手机侧面的按钮唤醒Siri。此前,Siri的一个宣传点难道不是直接语音唤醒,不需触碰控制吗?

最后看一眼价格:999美元,起。

苹果第一篇公开的人工智能论文:关于人脸识别,CVPR 2017最佳论文

苹果在7月20日推出名为 Apple Machine Learning Journal 的新研究博客,对苹果来说,做一个专门介绍他们的人工智能研究论文的博客还是挺新鲜的,因为苹果通常不会公开谈论他们的研究项目。

该博客发表的第一篇文章是关于如何将合成的图像变得更逼真,以用于训练神经网络。这也是苹果于去年年底在arXiv发布的第一篇AI论文“Learning from Simulated and Unsupervised Images through Adversarial Training”的介绍,这篇论文在 CVPR 2017 获得 best paper。

根据这篇文章,苹果要训练神经网络来检测照片上的人脸和其他物体。但苹果的方法不是制造拥有数百万计图像样本的巨大的数据集来训练神经网络,而是创建由计算机生成的人物的合成图像,并应用一个过滤器使这些合成图像更逼真。这比一般的方法训练神经网络的成本更低,而且速度更快。

在机器学习研究中,使用计算机生成的图像(例如电子游戏中的)训练神经网络比使用现实世界的图像更高效。因为生成的图像数据都是有标签和注释的,而真实图片的数据需要耗费人力标注计算机所看的东西,告诉它这是一棵树,一只狗,一辆自行车等等。但是生成图片的方法也有问题,因为这让算法所学到的东西并不总是能无缝转移到真实场景。生成图片的数据“常常不那么真实,导致神经网络只学习生成图片的细节,却无法在真实图片上很好地迁移。”苹果的论文如是说。

论文中用于举例的“未标注的真实图像”、“合成的图像”、“精细化的图像”等都是人的眼睛图片,或许,iPhone X 的 Face ID 新功能正是有利用这一方法,以及更多苹果没有公开的研究成果?

模型使用未标注的真实数据,利用模拟器改善合成的图像的真实性,同时保留注释信息。

地址:https://arxiv.org/abs/1612.07828

更聪明的Siri

苹果机器学习博客接着在8月连着发表3篇来自 Siri 团队的技术文章,分别是:

通过跨带宽和跨语言初始化改进神经网络声学模型(Improving Neural Network Acoustic Models by Cross-bandwidth and Cross-lingual Initialization)

反文本归一化作为标签问题(Inverse Text Normalization as a Labeling Problem)

Siri声音的深度学习:为混合单元选择合成的设备上深度混合密度模型(Deep Learning for Siri’s Voice: On-device Deep Mixture Density Networks for Hybrid Unit Selection Synthesis)

三篇文章题目看起来都非常高深,介绍了 Siri 背后的技术进步。其中第一篇文章讨论利用声学模型数据的迁移学习技术,以显著提升新的语言版本Siri的精确度,让Siri支持更多语言;第二篇介绍Siri如何利用机器学习格式化地显示日期、时间、地点等。第三篇则更综合地介绍Siri声音的进化,探讨如何利用深度学习让Siri更会说话。

具体来说,Siri在2014年中推出一个新的语音识别引擎,使用深度神经网络(DNN)。先是用于美国英语,到2015年中扩展到13种语言。为了顺利扩展到其他语言,苹果研究人员需要使用有限的转录数据(transcribed data)来解决构建高质量的声学模型的问题。他们提出使用带限(band-limit)相对更多、更易于收集的宽带音频来解决较少量的窄带蓝牙音频问题。他们在迁移学习框架之上使用了神经网络初始化。


图:在窄带蓝牙测试上的词错率


图:跨语言初始化

另一值得一提的是Siri的文本转语音(TTS)系统:

从 iOS 9 到 iOS 11,Siri的声音对比

时间: 2024-09-02 13:16:35

【iPhone X重磅发布】携A11人工智能芯片登场,人脸识别9大特征的相关文章

中国人工智能产业发展指数重磅发布,中国声谷首批AI达摩名单揭晓

2017 年中国人工智能产业发展指数重磅揭晓 在今天举行的AI World 2017 世界人工智能大会上,AI Industry 分会场受到了业界的特别关注.在来自智能医疗.机器人等多个领域的知名专家进行了精彩的主题分享之后,中国声谷重磅发布了中国人工智能产业发展指数,并宣告中国声谷专家委员会正式成立,同时宣读了专家委员会的首批专家名单(30人),为到场专家代表举行了授牌仪式. "中国人工智能产业发展指数"由国家工业信息安全发展研究中心软件与信息服务研究部副主任张毅夫担任发布者,合肥国

余凯重磅发布地平线中国芯“征程”与“旭日”,中国首款嵌入式人工智能视觉芯片问世

今天,地平线终于发布了AI 芯片. 2017年12月20日,地平线在北京举行发布会.创始人兼CEO余凯与中国人工智能泰斗.清华大学计算机系教授.中科院院士张钹,国家集成电路产业投资基金股份有限公司总裁丁文武一起,发布了地平线的最新产品--"征程"与"旭日"两款芯片.用地平线的话来说,这是中国首款全球领先的嵌入式人工智能视觉芯片. 此时,距离余凯从百度离职创立地平线,已经过去了两年又五个月的时间.今年初,在新智元举办的一场内部交流活动上,余凯曾经说过,芯片研发很慢,要

【圣诞大礼】CB Insights重磅趋势报告:AI芯片之争白热化,成中美角力焦点(32P下载)

人们持有汽车的方式正在发生改变.AI竞赛正在展开.健身将不再需要健身房.人们可以智能养狗.年底,CB Insights的每位行业分析师回顾了一年的研究简报,数据处理和报告,以确定他们认为2018年将塑造科技行业的趋势. 以下是15种将塑造2018年科技的趋势. 1. 全球AI芯片之争白热化 我们正在目睹人工智能的爆炸式发展,从视频中检测人脸到检测医学影像中的疾病. 但是这些进程将在什么芯片上运行? 中国和美国正在竞相拥有芯片领域的主导权.中国政府支持的创业公司.美国科技巨头和芯片业者都瞄准成为下

为什么说 A11 Bionic 芯片才是整个苹果发布会真正的亮点?

在已经尘埃落定的这场苹果发布会中,真正的亮点是什么? iPhone X 的全面屏高大上,可惜"齐刘海"逼死强迫症:刷脸解锁的 Face ID 取代了 Home 按键和 Touch ID,却让人担心由此带来的隐私问题,交互上似乎也不容易适应:无线充电也有了,但又不支持远距离--这些本来都应该是这场发布会的亮点,却总是有所折扣,让熬夜追随的观众找不到某种酣畅淋漓的快感. 但在雷锋网(公众号:雷锋网)看来,如果我们把目光转向 iPhone 8/Plus 和 iPhone X 机身内部的全新

人工智能芯片再掀风浪 群雄逐鹿局面已成

人工智能芯片可应用范围广,如智能手机.医疗健康.金融.零售等,发展空间巨大.随着人工智能时代的到来,人工智能芯片更是迎来了大展身手的时机. 万物互联大背景下,未来几年后将有数以百亿的智能设备连接至互联网,来自思科报告显示,到2021年,在全球271亿连接设备中,物联网设备将占据连接主导地位.这一趋势无疑推动了物联网向各行各业渗透,赋能全社会,开启一个万物具有感知能力的智能社会,人们能够享受到更加智慧的生活. 而在这个大连接时代,以及万物具有感知的新时代中,具有人工智能要素的芯片需求广阔,依靠AI

一文看懂人工智能芯片的产业生态及竞争格局

近日,国内人工智能芯片公司寒武纪科技(Cambricon)获得了一亿美元A轮融资,是目前国内人工智能芯片领域初创公司所获得的最高融资记录,如果要说这桩融资对人工智能领域的最直接意义,或许是让人工智能芯片逐渐走入了更多人的视野. 深度学习不仅在传统的语音识别.图像识别.搜索/推荐引擎.计算广告等领域证明了其划时代的价值,也引爆了整个人工智能生态向更大的领域延伸.由于深度学习的训练(training)和推断(inference)均需要大量的计算,人工智能界正在面临前所未有的算力挑战,而其始作俑者,是

【重磅】中国新一代人工智能规划专家解读,外媒:中国要统治AI

一图看懂<新一代人工智能发展规划>:3 大战略目标,4 大重点任务 图片来源:中国科技网 专家点评:认识是清醒的.决心是坚定的.力度是前所未有的 规划发布后,中国的 AI 专家们在朋友圈进行了疯狂转发.在他们看来<新一代人工智能发展规划>意义是什么?影响如何? 新智元采访了北大计算机系主任黄铁军:教育部长江学者特聘教授王田苗:北大人工智能创新中心主任.著名天使投资人,百度创始七剑客之一.酷我音乐创始人雷鸣:慈星股份执行董事.慈星机器人董事长李立军:清华大学计算机系教授邓志东:前上海

人工智能芯片市场将出现竞争热潮

日前,视觉计算技术行业领先厂商Nvidia公司首席执行官黄仁勋在加利福尼亚州圣何塞举行的公司会议上宣布推出一款新芯片,旨在加速人工智能算法.并比喻说,对于Nvidia公司推出的新品,其他同行厂商现有的技术产品将会望其项背. Nvidia公司的利润和股价在过去几年中激增,因为该公司发明的图形处理器为游戏和图形制作提供了机器学习的最新突破.而随着对人工智能的投入,Nvidia公司目前面临着英特尔,谷歌,以及其他厂商在人工智能芯片方面的竞争. Nvidia公司首席执行官黄仁勋宣布推出一款用于人工智能的

谷歌称人工智能芯片让他们省了15个数据中心!

谷歌的操作系统无疑是地球上最大的计算机网络,该系统由遍布四大洲15个地点的巨大数据中心组成.大约六年前,当该公司在Android手机上发布一种新的语音识别系统时,工程师们曾担心这个网络还不够大.这些工程师意识到,如果世界上所有的安卓手机用户每天使用谷歌语音搜索3分钟,那么该公司将需要更大规模的数据中心,其可以是目前的两倍. 当时,谷歌刚刚开始应用度神经网络.复杂的数学系统来提供语音识别服务.其通过分析海量数据,可以执行特定的任务.近年来,机器学习技术不仅改变了语音识别,还有图像识别.机器翻译.网