Facebook新算法:360度摄影不再感觉头晕

雷锋网(公众号:雷锋网)按:本文作者Slyvia&Trista,由ARinChina(微信ID:arinchina)编译自 Facebook Code的《 360 video stabilization: A new algorithm for smoother 360 video viewing》 。

本文主要介绍了1)Facebook视频稳定技术的新算法结构;2)其工作原理;3)其表现性能;4)延时摄影算法。

从专业相机到消费者手持摄像机,目前市面上已有数十款可以拍摄 360 度视频的相机,规格和质量也各有千秋。随着这些相机的普及,360 度视频内容的范围和容量也在不断扩大,人们开始在各种场合和环境中拍摄 360 度视频。

然而,拍摄时却很难避免晃动、保持相机稳定,特别是用手持相机拍摄运动对象(如骑山地自行车和徒步旅行)的时候。到目前为止,大多数视频稳定技术都是为窄视场视频设计的,如用手机拍摄的传统视频,但这些技术在拍摄 360 度视频时却不怎么好用。

因此,Facebook 决定为拍摄 360 度视频,开发一项新的视频稳定技术。目前,这项技术已在测试中,预计将支持 Facebook 和 Oculus 平台。

Facebook 将这项新技术命名为「变形旋转」运动模型,混合 3D-2D 技术用于优化模型参数,让 360 度视频更流畅。在视频质量相同的情况下,它能减少 10%~20% 的比特率,有效提高效率。在通信和计算机术语中,比特率表示在单位时间内可以传输多少数据。

在标准机器上,这项新技术能以每帧小于 22 毫秒的速度稳定 360 度视频。事实上,这个稳定速度比用正常播放视频的速度更快。

除此之外,Facebook 的新技术还让 360 度视频也能快进,把一段冗长的视频(如长时间骑车)用更快、更好玩的方式播放。

为了达成这一功能,Facebook 在主体稳定算法之外,又开发了一个 360 度延时摄影算法。随着时间的推移,它改变了视频帧时间戳的定时,以平衡摄像机的速率。

|创建一个新的算法结构:混合 3D-2D + 变形旋转模型

目前的视频稳定算法大多使用相同的结构:跟踪视频中的运动,寻找适配的运动模型,使运动变得更平稳,产生稳定的输出帧。算法之间主要的区别在于——如何为视频中运动建模。

大多数算法都是为窄视场视频设计的,用的是单一参数化二维运动模型,如全画幅视角(单应)扭曲。全画幅指的是相机里的感光元件的尺寸,跟原来的一张胶片大小一样,为 36X24mm。

虽然这些方法简单有效,但过于简单的模型无法描述复杂的运动,例如前景和背景的视差和抖动。

更先进的算法则采用更灵活的运动模式,但还只存在于学术出版物中。而这些先进算法,虽然能处理更复杂的运动,但又限制了视频拍摄的灵活性,以避免产生可见的几何变形。

另一类算法在三维环境下操作。通过重建摄像轨迹和场景的几何模型,并在三维环境中推理出稳定视频。因为采用了更准确的模型,这些算法具有更高的平稳能力。但三维重建方法操作起来比较慢,而且不稳定。

因此,Facebook 这次的混合 3D-2D 稳定架构,正式结合以上两类算法的优点。该架构只在关键帧的几秒间隔之内,使用三维分析,并不是完全重建,只估算相对运动,因而更容易解决操作稳定性问题

三维算法的用处体现在,它能够分辨出被拍摄的物体,究竟是在做旋转运动,还是平移运动

对于内部帧(关键帧之间的剩余帧),Facebook 采用二维方法优化,采用了一种新的「变形旋转」模式,让视频运动尽可能的平稳。

「变形旋转」模式类似于一个全局循环,但允许轻微局部变形。Facebook 优化了模型参数,使其可以处理并撤消一定程度的平移抖动(如拿着相机走动时带来的上下摆动)、滚动快门伪影(rolling shutter artifacts)、快门变形(lens deformations)和拼接赝像(stitching artifacts)。

因此,来认识下混合 3D-2D 结构的优势

  1. 精度:比纯粹的二维方法更准确,因为使用了更强大的三维分析以稳定关键帧。
  2. 鲁棒性:比纯三维方法更稳定,因为 Facebook 采用三维分析估算相对旋转,而无需完全重建。所谓「鲁棒性」,是指控制系统在一定(结构,大小)的参数摄动下,维持某些其它性能的特性。
  3. 正则化:固定关键帧为内帧二维优化提供了一个正则参数,可以限制变形旋转运动模型,避免摆动伪影。
  4. 速度:混合架构的性能比单纯进行三维分析或二维优化速度更快。

|如何工作?

与现有的稳定算法类似,Facebook 也从视频中的运动特征点开始追踪。特征点既是一个点的位置辨识,同时也说明它的局部邻域具有一定的模式特征。

由于 Facebook 输入的视频采用的是等量矩形投影,因而画面两端高度扭曲,于是把帧数转换成不那么扭曲的立方体贴图(采用 256x256 分辨率),让运动跟踪能够顺利进行。

由于追踪产生的灰度图像质量很高,Facebook 得以在视频亮度平面上直接执行,避免因从 YUV 到 RGB 转换而浪费时间(YUV 和 RGB 为色彩编码方法)。

Facebook 采用 KLT 跟踪算法追踪关键点,并采用了一个重要概念——关键帧。关键帧非常重要,可以用来估计被拍摄物体的相对旋转,为二维优化提供正则参数。关键帧散布在视频的不同位置,有些地方更密集,有些则较少一些。

然后,Facebook 采用五点算法估计连续关键帧之间的相对转动,来估算两个摄像机之间的相对旋转和平移。五点算法是指,当摄像机在两幅图像之间的运动为纯平移运动时,给定 5 对图像对应点,则可以线性确定本质矩阵。

用 3D 感知算法来估计旋转的优势在于,它能够区分平移运动和旋转运动。完成对所有关键帧旋转的预估后,把它进行逆变换,与视频的第一帧对齐。

现在,所有的关键帧已经稳定下来,就把它们锁定,而后把注意力放到中间帧的旋转上。

正如前文所述,对中间帧采用的是二维优化的方法,而不是三维分析法。优化的目的是让非关键帧的轨迹尽可能的平稳。由于中间帧的旋转已经固定了,提供的正则参数可以用来收敛非关键帧的轨迹。

在解决相机抖动问题的时候,往往会残余一定量的抖动,如前文提及的少量平移、滚动快门、次优镜头校正和拼接赝像。Facebook 的目的是增加一些灵活的运动模型,用来适应和撤销轻微的图像变形。

在「变形旋转」模型中,Facebook 用 6 个散落在不同位置的局部旋转代替全局单旋转,让局部低频偏差从纯旋转变成数据。

这一点至关重要,因为可以防止因运动模型太灵活而造成的漂移。Facebook 希望解决问题用的是引入更多数据,而非单纯的删除伪影。

|优化速度、性能和效率

Facebook 开发这一新算法的目的,是让用户可以观看流畅稳定的 360 度视频,毕竟用户也不想把时间浪费在等待视频上传。因此,即便这一算法适用于 GPU,Facebook 也希望能在 CPU 上运行。

所以,Facebook 的做法是:选取一个 8*8 像素区域,用传统的包围盒算法计算其坐标,其他区域用双线性差值运算。

这种新算法比包围盒算法运算速度更快,与单纯用包围算法进行计算相比,显示效果差不多,但大大提高的运算效率。包围盒算法是用一个简单的图形代替复杂形状的算法。

下图总结了各算法阶段的性能,测量的是单个帧输入 / 输出 1080p 分辨率和时间。

事实上,Facebook 新算法的稳定速度,是比正常播放一段视频要快的:

播放视频的时候,显示每一帧大约需要 30 毫秒,而稳定一帧只需 20 毫秒。通过改进算法,Facebook 可以让直播的 360 度视频每一帧都不发生抖动。

除了速度之外,Facebook 还对效率进行了优化。

因为 360 度视频并不裁剪任何拍摄到的画面,所以可以被还原到最初的版本,所以稳定算法可以提高 360 度视频的比特率(比特率越高,传送数据速度越快)。但对于视频播放不会有任何影响,因为体验过 360 度视频的人大多已经习惯了旋转的视图。

稳定算法能够有效节省比特率,下图分析了通 x264 库(一个免费的软件库)把视频编码为 H.264/MPEG-4 AVC 格式时比特率的消耗,橙色代表滑雪,蓝色代表停下来休息。

如图所示,比特率的节省概率在 10%~20% 之间,取决于编码器的设置。

|延时摄影算法

由于 Facebook 的新算法让 360 度视频看起来非常平滑,所以可以用来创建加速延时视频。创建一个延时摄影 360 度视频只需删掉一些内容,但每帧序列都应该能连接起来。

然而,延时摄影拍摄的一个共同点是平稳的平衡相机速率。例如,在拍摄一个滑雪视频时,滑雪者时而加快速度,时而停下休息,相机速率也在不断变化。

为了模拟一个不断移动的延时摄影镜头,需要暂时地平衡速度,并跳过休息的部分。

要做到这一点,首先用二维近似和平均运动矢量,估计每一帧的相机速率。然后,用时间中位数和低通滤波器把视频二次处理一下。低通滤波器是容许低于截止频率的信号通过、但高于截止频率的信号就不能通过的电子滤波装置。

通过相机预估速率,就可以改变原视频的时间戳。这样一来,就可以创建加速视频,把冗长的视频缩短。
下一步Facebook 表示,这项新算法还在测试当中,希望能够得到用户的反馈。用户现在可以试着上传 360 度视频,把高质量,且观感更舒适的视频与朋友们分享。

接下来,Facebook 将致力于改进延时摄影算法,希望在不久的将来,能用到实时 360 度视频中。

雷锋网注:本文由ARC增强现实(微信ID:arinchina)授权发布雷锋网,转载请联系授权并注明作者和出处,不得删减内容。

本文作者:陈圳

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-11-08 19:16:59

Facebook新算法:360度摄影不再感觉头晕的相关文章

Facebook正式推出360度全景视频服务

Facebook正式推出360度全景视频服务 除了社交网络之外,Facebook已经成为一个综合性网络视频服务商,推出了视频直播.视频广告等服务.据外媒最新消息,Facebook日前再次推出一种新的视频服务:360度环景视频. 据PCMag等美国科技媒体报道,Facebook面向智能手机用户推出了一个新的客户端"Facebook 360",可以配合虚拟现实头盔,欣赏丰富的环景视频内容. 目前,这一客户端首先支持了三星手机和三星简易型头盔Gear VR,未来预计将会支持更多的硬件搭配.

Facebook新算法减少全景视频文件大小80%

1月22日消息,据国外媒体报道,Facebook一直在静候虚拟现实(VR)的全面爆发,尤其是在即将发售的Oculus Rift正式上市之后.Facebook事实上已开始在平台中支持360度全景视频的流播,但公司对此并不满足.其工程师更是基于锥体几何学设计出了一套全新的视频编码,号称最高能将全景视频的文件大小减少80%. 在Facebook推出360度全景视频的一开始,公司曾采用"立方体贴图"的方式来实现视频编码.此方法也能有效降低文件大小,但最高幅度只有25%左右.Facebook如今

Facebook 新算法减少全景视频文件大小 80%

Facebook一直在静候虚拟现实(VR)的全面爆发,尤其是在即将发售的Oculus Rift正式上市之后.Facebook事实上已开始在平台中支持360度全景视频的流播,但公司对此并不满足.其工程师更是基于锥体几何学设计出了一套全新的视频编码,号称最高能将全景视频的文件大小减少80%. 在Facebook推出360度全景视频的一开始,公司曾采用"立方体贴图"的方式来实现视频编码.此方法也能有效降低文件大小,但最高幅度只有25%左右.Facebook如今已将利用"立方体贴图&

Facebook 研发去抖动算法,告别看360度视频呕吐

Facebook及其虚拟现实子公司Oculus准备投身于最新的360度视频形式中,Facebook在上个月的News Feed中已经引进这种视频.不管你用的是台式机还是移动设备,只要你在Facebook上看到这些媒体发布的最新360度视频,你就能轻拍,点击或拖动视频来改变你的观看角度并看到你周围的所有动态.如果你很幸运的是一个提前获得了一台Oculus Rift VR头显的少数软件开发者,你就能获得更棒的沉浸式体验. 为了让用户更方便更多的使用360度视频功能,Facebook建造了360度摄像

Facebook计划给Oculus虚拟现实头戴设备带来360度视频内容

新浪科技讯 北京时间3月26日早间消息,Facebook在周三的开发者大会上表示,计划给Oculus的虚拟现实头戴设备带来更多的360度视频内容. Facebook并未公布这一方面的更多信息,例如用户将如何获得这样的360度视频.不过,这将是推动虚拟现实平台发展的重要一步.此外Facebook还宣布,将在用户消息流中集成这些360度视频.因此,即使用户没有虚拟现实设备,也可以去看看这些视频. 美国科技博客Engadget的记者在Facebook开发者大会的"传送站"尝试了新的360度视

Facebook利用AI算法“纠偏”360度照片

据外媒VentureBeat报道,Facebook今日向外表示,为了给用户提供更好的360度视频观看体验,其将利用AI算法来对这些内容进行调整,避免因为图片倾斜破坏呈现效果. 据悉,在今日举办的@Scale大会上,Facebook设立了一个系统,通过深度神经网络来尝试纠正上传后的照片中常见的错误.例如,拍摄360度照片的人不会将相机完美的和地平线保持水平位置,拍出来的照片可能存在倾斜等问题.而如果利用VR设备观看这些图像和视频,则会有难以阅读或打破沉浸感等问题. 据VentureBeat 的 B

Facebook发明新算法预测用户约会对象是谁:准确率高达60%

如果新算法没有检测到一对情侣在约会,那么这对情侣在接下来两个月内的分手几率高达50% 10月29日消息,据国外http://www.aliyun.com/zixun/aggregation/31646.html">媒体报道,Theverge网站称,Facebook日前宣布,公司的一位高级工程师和美国康纳尔大学一名教授日前发明了新算法,可以基于Facebook用户数据,比较准确的预测用户最近的约会对象是谁,以及情侣关系是否处在危险当中. 据Facebook介绍,这种新算法的核心是名为&quo

全新 AI 摄像头、360 度环境感知阵列,博世要做自动驾驶系统集成商

雷锋网新智驾按:第 19 届亚太汽车工程年会 & 2017 中国汽车工程学会年会暨展览会(APAC 19 & 2017 SAECCE)于10月24-26日在上海举办,本次论坛以"未来汽车与交通变革"为主题,逾 3000 位国内外业界嘉宾共同探讨汽车产业车厂与零部件协同创新和技术发展路径.雷锋网(公众号:雷锋网)新智驾全程参与此次盛会的报道,并将博世底盘控制系统中国区总裁陈黎明在年会上的演讲编辑整理如下: AI 时代 如今,业界对于 AI 的投入非常大,像 Google.

谷歌发布新算法以提高搜索结果的时效性

文|CBN记者 李蓉慧 谷歌发布新算法, 以提高搜索结果的时效性. 它想改变搜索引擎的过时印象, 应对Facebook的挑战. Google+让谷歌有了能够拿得出手的社交产品,但这还不够,现在谷歌试图让人相信,对于谷歌的传统搜索业务,人们也能够期望它做出些应对新时代的改变. 美国当地时间11月3日,谷歌发布了一款名为"Freshness Algorithm"的网页搜索算法,以增强网页搜索时效性.这是谷歌对搜索算法的一次重大改变,这次改变将会影响35%的网页搜索结果. Freshness