在大会召开前夕,前YY(欢聚时代)CTO,现声网Agora.io创始人赵斌接受CSDN记者专访,就实时互联网行业发展、声网近一年的商业运营情况、实时互联网大会的相关事宜进行深入讨论。
作为一个在通信和互联网行业同时有近20年经验的技术人,赵斌表示,在声网过去一年的商业化运营中,实时通信在移动互联网的多元化应用呈现出多元化趋势,很多方面甚至超出想象。到目前为止,实时通信技术在移动互联网领域实际应用的行业非常多,大概有十几个行业。从社交、教育、医疗、游戏、呼叫中心,到风口上的直播,从关注度较高的AR/VR领域,到IoT行业,都有大量创新应用。而本次与美国TMC合办的RTC2016第二届实时互联网大会,是全亚洲范围唯一一场实时通信行业大会,邀请了国内外实时领域技术和行业大咖探讨实时技术的发展,也有大型互联网公司和知名开发者来分享实时技术在行业内的创新应用,从技术和行业角度讨论移动互联网下的新融合、新趋势和新商业机会。
以下为采访实录:实时通信深度颠覆互联网行业
声网创始人赵斌
CSDN:首先想请赵总,就过去一年声网的发展情况做个简单介绍。
赵斌:实时通信,最典型的场景就是实时音视频通话,比如多人视频聊天、一对一在线教英语、远程医疗、视频会议等都会用到这个技术。声网Agora.io就是专注实时通信云服务的平台。从去年的实时互联网大会开始,声网开始做商业运营到现在差不多一年时间。其中一个特别大的进展就是实时通信RTC技术在多个行业的多元化应用,超出我们开始提供这个服务时的想象。实际上过去这一年我们看到,实时通信技术与互联网的融合和交叉到达了前所未有的紧密程度,比如医疗、社交、娱乐、游戏、教育、呼叫中心、企业协作等行业和领域,比如现在行业内最热的直播行业,再比如电商、OTA、以及前沿科技领域的AR、VR和在IoT领域的应用,前景十分可观。在这十几个不同行业中,实时通信技术的使用模式、各种场景穿透的独特性,以及规模化应用都呈现出十分快速的增长。相信未来,会出现更多的基于实时通信技术的应用创新。
赵斌:很多人都是通过Twilio的上市开始注意到 “云通讯API” 这个行业,也开始了解到实时通信。实际上,实时通信技术已经发展了很多年,从最初的硬件+专线搭配MCU模块开会,到近几年最知名的WebRTC,再到有质量保障的实时云服务。
赵斌:声网Agora.io可以说是全球第一个提供有QoE质量保障的”实时通信”云服务的公司,我们在全球部署了针对这方面应用的软件定义实时网SD-RTN(Software Defined Realtime Network),为客户提供全球范围的高质量实时音视频通话和全互动直播技术。可以说,我们只做了一件事情,就是把这件技术门槛很高,质量很难保障的事情做得很深,为广大的开发者、创业者和相关从业者提供极简的SDK和API,只要几行代码就可以帮助用户解决这些实时通信问题,在复杂的网络环境中做到高清、低延迟的实时通话。
赵斌:我们也希望借本次RTC大会对我们上一年的工作收获和大家交流,我们将会在会上宣布我们过去两年来的一些成果,其中有关于我们的创新和工作成绩等的报告。会上,声网将在业务发展、技术突破、新产品发布和行业生态战略合作方面做一系列发布,也欢迎大家来参加将在10月28日到29日在北京举行的第二届实时互联网大会,共襄盛举。
CSDN:咱们声网实时通讯技术主要面向开发者推出,目前开发者比较关注哪些问题?针对开发者所关注的问题,声网下一步有哪些新举措?
赵斌:首先开发者关注的焦点首先还是能否满足需要,比如说在功能上、质量上、体验上等。以上市公司为例,如果他们想上一个通讯模块,其体验效果肯定不想弱于其他企业。虽然这些企业的体量都很大,但其实做决定的时候还都是企业内的开发者,开发者需要去评估到底如何去搭建这个实时音视频通讯技术,是自行研发还是用第三方的服务。如果用第三方的技术,哪家的更好哪家的不行,都需要做这些技术评估。
赵斌:同时开发者也关注产品好不好用,质量怎么样,以及性价比都是考量的因素。有些开发者会更关注易用性,就是你的产品听起来很好,质量也很不错,但实际应用的时候我需要投入多大的精力去开发,才能把它接进来。我们的客户反应,声网的产品的API在应用性和简单性方面得到了用户的一致认可,认为是用过非常简单的、容易接的API。语音通话2行代码,视频通话4行代码,全互动多人连麦直播也是几行代码。最快的记录是,有开发者15分钟就能初步集成出一个demo版本跑起来,这利于开发者快速原型搭建和试错,没有任何负担。
赵斌:在互联网时代,速度是第一追求。一个好的产品一定要保证开发者极其简单地接入。
赵斌:声网一直不遗余力地为开发者提供各种差异化有价值的服务,同时也希望不止是产品本身简单,还能帮助开发者从注册、学习代码、研究代码中的高级特性等都会有最简单的操作,方便开发者学习,研究。同时,也希望为RTC技术爱好者提供更好的平台社区让他们了解RTC技术的发展和未来。所以,我们整体的产品、研发、市场都是围绕着如何让开发者更快,更好,更便捷地用我们的产品和服务。另外,我们对于开发者技术支持也是全方位的,工单、社区、微信的快速响应。针对某些客户和特殊情况,我们也会有工程师现场支持,和客户不分昼夜泡在一起开发。比如,我们技术团队曾经为了一个技术问题,连夜飞到我们的客户”陪我”办公室,搞定保证上线。这两天我们也有工程师飞到印度去帮助那边一个社交客户的视频通话功能上线。
赵斌:我们即将向全球开发者推出实时通话质量监测服务,这也是全球第一个推出此类服务的平台。可以让开发者7*24在后台了解在自己平台上的通话质量情况,包括网路分布,设备分布,质量分布等。这些数据如果和开发者自己的运营策略和节奏配合,会有很强的参考意义。但开发者自己做起来,却有很大的工作量。
赵斌:此次声网Agora.io联合美国最权威的IT行业组织TMC将实时互联网大会引入国内,也代表了声网希望持续对国内开发者社区做出贡献,同时也代表了声网推动实时通讯技术发展上的不懈努力。
CSDN:放眼全球市场,声网目前有没有明显的竞争对手?如果存在,咱们声网核心竞争力是什么?
赵斌:声网Agora.io在业内是第一个做软件定义实时虚拟网(SD-RTN)的企业,同时也有很多相关专利,对我们在这方面的创造进行保护。因为公共互联网本身基础架构并不是主要为实时业务设计,所以为了保证实时通信,需要在公共互联网的基础上进行些改造,才能解决质量方面的根本问题。声网Agora.io采用了独特的实现方法,在全球部署了近100个数据中心,构建全球的软件定义实时网SD-RTN(Software Defined Real Time Network),也是一个虚拟通信网,在这个专为”实时”所设计的传输网络上,通过一系列的私有协议算法,通过智能路由算法,来极大优化全球范围内的实时传输,保证通话质量。所以实际上,开发者通过接入我们的API或者SDK,可以让最终用户通过声网的这张虚拟网,来进行全球有质量保证的通话,无论是跨国还是跨网。
赵斌:从这个角度上说,声网Agora.io所提供的有质量保证的实时保障服务,在全球是唯一做到这个程度的,同时也有相当的技术和数据运营门槛。
赵斌:然而我们把这个门槛对于开发者来说,变成了零。因为声网Agora.io是为全球开发者提供这项技术服务,把过去只有类似Skype、Facebook、或微信这样的大厂商才能具备的专业级别实时能力,变成一个简单的SDK和API,开发者就可以像取自来水一样简单、低成本地实现实时通信。 声网Agora.io希望利用公共互联网创建新的通讯服务,让人们可以像面对面一样,随时随地开展高质量实时交流,希望Agora.io提供的实时技术能够为更多的垂直行业和细分领域所利用,改变、造福于这些行业。目前,声网的技术广泛应用于互联网产业的各个行业,小米,陌陌,阿里,途牛等都是采用声网的音视频技术解决方案
赵斌:从市场上来看,提供相关服务的企业有不少。但在提供的实时质量上存在本质差别,比如我们看过8月20日至9月5日,某大型社交App的全球通话数据发现,我们提供的服务端到端延迟是平均76ms,其中低于150ms延迟的通话接近90%。这里有个误区,很多开发者觉得做好软件,喂喂喂测量下就能知道质量好不好了。其实实时通信质量是每分每秒都在发生变化的。就算你觉得你的软件、设备或网络接入没变,骨干网或机房也可能影响到通话质量。所以行业里很多人都还是比较主观的盲目评估,在我们看来很多时候是错误的。这就是为什么很多开发者开发的时候感觉不错,上线就各种问题都来了。我们的质量评价绝不是基于某单个通话,而是在不同网络条件有统计意义量级的通话数据上评估出来的。再以直播为例,很多情况下,为了做低延迟,很多厂商都采用RTMP,最低可以做到3秒左右。但是我们自己的实时网的延迟平均都在几百毫秒,还是数量级上的差异。当然不是所有场景都需要延迟低,但是如果你要做实时,做实时互动,希望利用更强的互动性强化用户粘性和付费能力,就肯定需要超低延迟。
第一届实时互联网大会现场实况
CSDN:实时通信技术在国内外接受程度有差异么?是什么原因导致这样的情况?
赵斌:差异肯定是存在的。从用户习惯,用户受教育程度,市场规模,市场成熟度等角度看,都是存在本质上的差异。
赵斌:从用户习惯角度来看,美国在60年代电话就彻底普及了,并且用户的某些使用习惯是根深蒂固的,像语音留言在美国仍是家家户户的标配,然而同时期在国内语音留言的应用几乎没有。反观现在,较为有趣的是短信服务在国内是优先启动的,而美国现在才刚刚使用。而导致这种使用习惯的不同,主要是社会发展过程的阶段差,如当留言机已经普及的时候,消费者已经被教育了,习惯了这种模式。但中国没有这个阶段,直接到了短信或语音留言,主要是途径上的差异,但趋势和潮流上最终是趋同的。
赵斌:从市场成熟度来看,在实时互联网这个领域,美国是一个更为成熟的商业市场,美国的实时通信,或者说实时互联网行业较为发达,从业人员,行业会议,行业规模、行业厂商都已经有多年的累积和沉淀,但是国内还处在清晰化市场定位的阶段。这也是我们第二年再次联合美国最大的IT行业机构TMC举办实时互联网大会的原因。
赵斌:在智能手机的使用模式上,国内用户更先进,普及率很高,消费者更能接受智能手机在生活中掌管一切。比如直播,现在国内的直播平台都开始在对外做”“输出”,很多模式、玩法、运营经验都被copy到了海外。而美国也有比国内更领先的一些行业,如远程医疗。美国的远程医疗协会非常强大,并且对未来远程医疗发展评估非常乐观。我们今年参加的美国最大的远程医疗展ATA,会上ATA的主席曾提到过说,保守估计未来在美国将有50%的医疗活动将会在线上进行。在这个会上,声网也有幸获得了实时技术创新大奖。在我看来,或许这个进程在中国会稍微慢速一些,但在线医疗在中国的普及和发展只是时间和速度的问题。毕竟, 在线医疗改变的是资源的流动问题,能够把优质医疗资源带到广大的农村和落后国家和地区。在这些地方互联网基础设施不够好,这也正是声网Agora.io能够帮助解决的问题。目前,在我们的医疗客户当中,有美国最大的心理咨询应用TalkSpace,也有国内的阿里健康、春雨国际、省级互联网医院等大平台。
实时通信和互联网产业融合新趋势
CSDN:作为实时云的开创者,您在音视频领域已经深耕多年,是什么信念让您认为音视频服务会成为当下乃至未来的趋势?
赵斌:正如你所说的,在音视频领域我已经做了20年,这20年间通信和互联网逐渐融合到今天已经十分紧密。在早期刚入行的时候我并不认为这是一个程序员的理想工作,主要音视频通讯比较依赖复杂的网络和设备环境,没有理想清晰的完美解决方案。直到现在我都认为这个行业有很多问题需要解决,远没有做到完美的程度,比如在某些极端网络场景中,网络环境非常差或网络覆盖很弱,很多时候是任何人无法解决的挑战。
赵斌:但是,商业现实是公共互联网越建越好,像刚才提到的这种极端场景(如网络卡顿甚至没有网络覆盖)并不是普遍发生的,它是偶尔发生的,也在持续逐步减少。并且可以看到,很多时候出现问题时远没有这么极端。假如我们认为有70%-80%发生这种问题时,我们可以通过各种手段,如网络、编解码算法、处理方式、动态的调整方式解决,那么可以给用户创造很大价值。
赵斌:正是基于这种想法,我们为很多不同场景的应用做过很多探索,比如很早在网络会议上进行了商用的音视频通话,后来在YY游戏和娱乐中提供的通话和秀场直播能力等,在特定场景下常常就已经够好用了,而且越做越有商业价值。今天为什么觉得它仍有前景,主要是智能手机这几年的快速发展,它是24小时随身携带的,音视频通话非常方便。因此我们认为,在移动互联网时代,有更大的新机会,我们应该朝着这个方向继续走下去。
CSDN:您觉得下一代音视频技术会在哪些方面有所突破,声网是否已经做好了准备?
赵斌:在这届大会中很重要的一个议题,就是对一些新的技术突破和行业进展做分享交流,这个领域我们看到很多激动人心的进展。比如实时行业的最大趋势之一是QoE质量保证。越来越多的应用已经不仅仅是实现这个功能,而是希望大规模应用中可以保证高可用,保证高联通率,保证高质量。近期有一个关于WebRTC的通话质量报告的白皮书,有12%的WebRTC通话是因为各种原因失败的。这个数字让很多行业内不深入了解实际情况的人都很惊讶,88%的通话保证和过去运营商所声称的5个9的高连通高稳定来说,相差很远。在这次大会上,主办方也邀请到了这家来自欧洲的专业实时通话质量分析公司,来和大家分享他的研究和业务成果,以及其它业内专家跟大家分享观点,让更多人了解实时通信技术的发展阶段和未来方向。当然,声网也会发布在QoE质量保证上的重量级产品和服务。
赵斌:可以透露一个消息,这次会议上,声网会就新一代适应公共互联网通讯音频编码技术做分享。过去的编码主要是为电信运营商设计的,它是有质量保证的。但公共互联网是没有质量保证的,一种方法是改善信道;另外一个方式就是在编码上做改善,在编码的时候就考虑到信道是不稳定的,在接收端解码的时候就有很大的概率把信道不稳定问题对抗过去。
CSDN:对于目前大热的VR产业,声网是否也有计划进军该行业?
赵斌:我们对于目前大热的VR 产业,更多的考量是希望能够通过实时通信在VR行业的应用解决目前VR行业的一些障碍。目前看来,主要有几个技术障碍需要解决,其中一个问题就是实时性,也就是如何控制延迟。VR如果直播的话,尤其是互动直播,如果延迟厉害,用户的体验会非常差,并且这样的体验也无法满足用户的需要。在德国有一个VR的爱好者,尝试通过VR设备来操控坦克,最后实验失败的原因在于延迟太大。大家可以想象一下,如果在需要拐弯的道路上,延迟一旦过大,根本无法把控精准的方向,对于产品本身和人身安全都会面临极大的考验。
其次,VR视频直播的带宽和视频压缩是一个短期之内还无法解决的矛盾,但是立体声语音的嵌入在VR的沉浸式体验中是非常重要的一个部分。当然此次大会,声网也会分享我们在VR语音上的独创性新技术。
采访后记:实时互联网大会大咖云集,精彩纷呈
在采访接近尾声的时候,赵斌也再次重申了本次实时互联网大会对于行业的意义。10月28-29日,由全球实时云服务商声网Agora.io和美国最大的实时通信行业大会的主办方TMC联合主办的第二届实时互联网大会(亚洲站)将在北京长城饭店召开,这是亚洲唯一实时通信行业和技术大会,也是目前亚洲规模最大、技术行业大咖最集中、最具有代表性的一次实时通信行业盛会。
这不仅是国内乃至亚洲首个为实时通信行业而召开的大会,更是一场开发者和互联网创业者的盛会。
大会将云集行业内众多技术大咖加盟,包括声网Agora.io创始人赵斌、来自IETF和W3C的专家,有”WebRTC之父之称”的WebRTC技术标准作者Daniel Burnett、SIP标准作者Alan Johnston、美国实时行业大会发起者Phil Edholm、来自欧洲的WebRTC科学家和实时行业数据分析家Varun Singh,以及来自9大行业的国内外互联网公司如阿里、Intel、Hike、陌陌、乐视、联想、海尔、沪江、去哪儿、途牛、壹药网等在内100多位行业领袖共同探讨实时通信行业的前沿科技发展,展望以声网Agora.io为代表的创新型实时通信市场的未来,见证实时通信对于行业应用和商业模式所带来的变革和发展。
本文转自d1net(转载)