深度学习算法可以去掉视频的缓冲轮,观看速度将变得更加流畅

当你在看视频的时候,不断地缓冲提示是不是让你感到很烦躁?

最近的一项研究表明,近70%的网络内容是流媒体视频和音频,流媒体是否需要缓冲,这一点比以往任何时候都更重要。幸运的是,麻省理工学院的研究人员正在用基于人工智能的流媒体算法开辟新的领域,这些算法可能会导致缓冲轮消失,让我们大胆地看到了视频流的未来。

在过去的5年里,视频流呈现爆炸式增长。像Netflix、亚马逊、谷歌这样的流媒体巨头都在为原创的和有版权的流媒体内容注入资源,试图从传统的电视网络中赢得观众。因此,越来越多的消费者放弃他们的高价有线电视合同,选择流媒体服务。

由于潜在的大量娱乐产业,这些服务正在投资于解决研究人员所谓的“视频问题”。流媒体对互联网带宽的要求很高,而观众对像素化、缓冲、停滞视频和长时间加载的容忍度也越来越低。

ABR算法
视频是数据最密集的互联网功能之一,如果每一个视频都被加载,那么加载视频对每一个互联网用户来说都将大大超过可用带宽。几年前,流媒体服务采用了一种叫做自适应比特率(ABR)的智能算法。这种算法有选择地根据网络条件加载视频;这就是为什么YouTube视频上的加载条永远不会比你当前的观看进度要移动地更超前。

ABR算法有两种主要的类型。基于速率的算法可以测量连接速度,并相应地改变视频加载质量。基于缓冲的ABR算法可以保留一定比例的未观看视频。这些ABR算法基本上都与视频流的流量保持同步,但仅在YouTube上每天就有超过10亿的流媒体流量,而下一代的流媒体算法早就应该出现了。

AI-powered流媒体服务
麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员正在响应全球对更好的流媒体质量的要求,采用了一种新的算法,利用人工智能来提高负载率并减少缓冲。这项名为Pensieve的技术,可能会彻底改变流媒体娱乐市场。

每个人的网络环境都略有不同,而且在不断变化。你的网速会受到你周围所有人的影响,为像ABR这样的预测算法创造一个混乱的环境。使用机器学习对不断变化的环境作出反应,Pensieve可以更智能而不是更困难的工作。

Pensieve的工作原理是“奖赏”和“惩罚”。当视频加载顺畅时会给予奖励,而流媒体中断时就会受到惩罚,Pensieve可以模拟神经网络,并学习如何更好地加载视频。该系统将视频流的播放率提高了10%到30%,而且观众预估综合质量会比当前的算法高10%到25%。

像ABR这样的传统算法依赖于人类的专家知识来发挥作用。麻省理工学院的研究团队相信Pensieve可以自行完成这项工作。该团队通过挑战现实世界的场景,向其人工智能算法管理者发送了一个挑战,并有意将其暴露在未知的网络环境中,以测试其适应能力。

Pensieve在每一个场景中都进行了处理,保持了与传统的流媒体算法一样的视频分辨率,但却没有那么多的缓冲。“这种压力测试表明,它可以在现实世界中适用于新的场景,”麻省理工学院的一名成员Hongzi Mao说道。Pensieve也是第一次尝试; 随着深度学习算法的进步,改进只会随着时间的推移而增加。

Netflix深入挖掘深度学习
麻省理工的算法是一个游戏规则的改变者,但在对抗缓冲的战斗中,他们并不是唯一的一个。在2017年初,Netflix推出了基于人工智能的算法。这个名为动态优化器(Dynamic Optimizer)的新系统,实时分析视频帧,并选择性地压缩每一个场景,以获得较慢的连接速度。

这种新式算法非常智能,能够区分视频内容的类型。电影的动作场面会增加比特率,而更简单的动画内容的比特率则会被缓和。其结果对所有用户都是稳定流,特别是那些经常遇到缓慢连接的用户。

人工智能也为流媒体视频的受众带来了革命性的变化。并不是所有的“权力的游戏”的观众都喜欢看“生活大爆炸”,所以Netflix最新的人工智能算法想找到原因。他们正在为其官网主页和“建议的标题(suggested titles)”开发算法,利用机器学习来了解你的喜好,这是前所未有的。此外,通过使用深度学习和模拟神经网络,Netflix的算法可以获得新的模式,从而缩小每个用户的偏好范围。

流媒体的未来
AI-powered算法正在为视频流的下一代内容打开新的大门。虚拟现实耳机和4K视频正处于主流娱乐的视野,但目前的流媒体算法根本无法跟上这些技术更高的比特率要求。

通过以人工驱动的流媒体管理,整个网络的效率将会提高。流媒体正在接管娱乐业,而像麻省理工学院的Pensieve这样的人工智能算法正在大规模地协助接管。随着流媒体视频在互联网流量中占据越来越大的比重,人工智能也在及时地出现,以帮助视频流继续增长。

本文为编译作品,转载请注明出处。更多内容关注微信公众号:atyun_com

时间: 2024-12-02 17:54:09

深度学习算法可以去掉视频的缓冲轮,观看速度将变得更加流畅的相关文章

如何通过TensorFlow实现深度学习算法并运用到企业实践中

本文根据才云科技首席大数据科学家郑泽宇在QCon2016全球软件开发大会(上海站)上的演讲整理而成,希望大家可以了解如何通过TensorFlow实现深度学习算法,并将深度学习运用到企业实践中. 讲师介绍 郑泽宇,谷歌高级工程师.从 2013 年加入谷歌至今,郑泽宇作为主要技术人员参与并领导了多个大数据项目,拥有丰富机器学习.数据挖掘工业界及科研项目经验.2014 年,他提出产品聚类项目用于衔接谷歌购物和谷歌知识图谱(Knowledge Graph)数据,使得知识卡片形式的广告逐步取代传统的产品列

分布式深度学习算法产品及在蚂蚁金服中的应用

近日在北京刚刚举办的Strata + Hadoop World大会很有亮点.阿里云iDST褚崴在会上分享了<分布式深度学习算法产品及其在蚂蚁金服业务中的应用>.下为大数据文摘所做的整理文章. 近年来深度学习技术迅猛发展,在图像识别,语音交互,机器翻译等领域展现出了巨大的潜力.依托阿里云自主研发的分布式数据存储与计算服务ODPS,我们研发了机器学习平台产品PAI (platform of artificial intelligence),支持分布式的深度学习算法产品.在CPU和GPU混布计算集群

Kneron用“重组”方案精简深度学习算法,芯片产品明年开售

深度学习算法精简化.终端化.甚至芯片化是当前业内诸多公司的一个研发热潮,其主要为了满足诸多类型智能硬件产品在终端层面能够快速识别.响应与决策,实现更多智能化.自动化的功能. 来自硅谷的深度学习团队Kneron日前接受了36氪记者的采访,并向我们介绍了其产品的进度与主要的商业方向. Kneron的CEO创业前在高通任职,其技术核心团队也多出自硅谷科技巨头.这使得他们在硬件和软件层面拥有相当大的技术优势. 软件上的特点是可以把深度学习算法精简化,能够在终端型硬件设备上进行计算和处理.这样精简的具体技

《中国人工智能学会通讯》——2.18 深度学习算法的计算与访存特征

2.18 深度学习算法的计算与访存特征 图 1 是一个用于手写识别的深度卷积神经元网络 LeNet5 [6] ,以此为例讨论深度学习算法的计算特征.在 LeNet5 中,包括了卷积层 C1.C3.C5 和Subsampling 层 S2.S4,以及全连接层 F6.其中卷积层是最为费时的操作. 对 于 有 R 个 输 入 feature map 和 Q 个 输 出feature map 的卷积层,假设 feature map 的大小为 M×N,卷积核的大小为 K×L,则该卷积层的代码大致可以表示为

解析:Facebook首创全新深度学习移动平台,“视频版”的Prisma是如何实现的?|深度

雷锋网(公众号:雷锋网)按:"风格特效转换"  在Prisma出现之后就已被熟知,这是利用神经表征分离再组合图片的内容和风格,最后实现可用来描绘艺术图像.但是,就像我们所体会到的,Prisma依旧存在一些问题,比如使用人数多导致服务器过载.智能软件处理的计算力不足等,雷锋网编辑曾在发布<AI修图艺术:Prisma背后的奇妙算法 | 深度 >时就曾请教过一些深度学习工程师,为什么没有应用在视频上?得到的答案是,除了Prisma出现的问题,要保持时间上的帧率一致也是非常麻烦的,

Yann LeCun连发三弹:人人都懂的深度学习基本原理(附视频)

一名 AI 专家值多少钱? "基于我个人经验,一名计算机领域的 AI 专家对于企业的价值,至少为 500-1000 万美元.为了争夺这些少数的人才,正在开展竞标大战." 这是卡耐基梅隆大学计算机科学院院长 Andrew Moore 教授在 11 月 30 日美国参议院听证会上 ,所说的话. 这场听证会名为"AI 破晓"(The Dawn of Artificial Intelligence),由参议员泰德·科鲁兹主持,主题是探讨人工智能当前的形势,对政策的影响及其对

一篇很好的参考文章:深度学习算法在自然语言处理中的一些心得

更多深度文章,请关注: https://yq.aliyun.com/cloud 作者简介:Frank Chung,HTC Research Engineering Blog编辑,专注于各种计算机技术的研究和探索.个人主页:https://medium.com/@frank_chung 以下为译文: 深度学习逐渐在NLP(自然语言处理)上发挥重要作用. 在此我就NLP问题的一些技术演变做一些简单阐述. N元语法模型 连续文本序列"to be or not to be"可以通过以下方式来建

Pluto-基于Caffe的GPU多机多卡深度学习算法产品

作者 阿里巴巴-计算平台-机器学习团队 同Caffe的关系 完全兼容Caffe.Pluto基于开源库Caffe扩展而来,是Caffe的超集,完全兼容Caffe的配置和数据,使用过Caffe的同学几分钟就能用Pluto跑起多机多卡版程序. Pluto的单机核心代码同开源社区版本保持同步,所以开源社区提供的一些新特性我们能够迅速merge到Pluto里面 新特性 我们来源于Caffe,但同时根据我们的用户需求我们提供了一些Pluto独有的新特性,帮助用户在模型训练中提高效率. 多机多卡,通过并行计算

深度学习在推荐领域的应用:Lookalike 算法

本文主人公 英特 是一名传统的软件工程师,让我们与英特一起来研究如何实现自己的Lookalike算法,并尝试着在新浪微博上应用这一算法. 当2012 年Facebook 在广告领域开始应用定制化受众(Facebook CustomAudiences)功能后,受众发现这个概念真正得到大规模应用.什么是受众发现?如果你的企业已经积累了一定的客户,无论这些客户是否关注你或者是否和你在Facebook 上有互动,你都能通过Facebook 的广告系统触达到.受众发现实现了什么功能?在没有这个系统之前,广