专访美图 CTO 张伟:5年以前,我们也不会想到会花 70% 的时间在人工智能上

视觉文化时代,「颜值」作为生活之美的展示,被览阅和品味,不仅成为一种文化符号,更成为一种可以被消费和增值的商品。

美图做的就是「颜值」这门生意。

在国内,或许没有哪家公司能比美图更能精准把握人们对于「颜值」的需求。单是围绕这一点,美图就分步有序地打造了
20 多个美颜类 app,以及为自拍功能定制的手机。在初期一片唱衰和嘲讽中,手机已然成为美图营收主要的贡献者,2016 年近 75
万台的销量,为美图提供了 14.7 亿的收入。

如果你走在商业街里,推开一家家私营服装店,会发现这些店主们十有八九,用的都是美图标志性的盾牌形状手机。

新花样:视频实时分割

「美」总是需要新花样的。肤白长腿大眼远远不够,还更需要有趣的内容和形式。而这种「花样」需要繁复的基础技术作为支撑。

对于目前最火热的人工智能技术,美图自然也看到了它背后蕴含的颠覆性力量。

在美拍平台上,明星柳岩所拍摄的美少女变身视频,已经拥有接近 200 万的播放量,里面所展现的「百变背景」功能,可以在视频中进行实时图像分割,将人物从真实场景中抠出,放置在特定的卡通背景中,并加入 AR 特效和音乐效果。

这项技术的实现,用了深度学习。

在 CV 圈,图像分割技术并不新鲜。对于一张静态的图片进行分割,可以花费很长时间来处理,但是「实时」则要求达到每秒 30 帧的处理速度。在这极短的时间内需要进行的工作包括:人像识别和分割、边缘处理、背景替换、实时美颜美型、AR 效果添加等多个环节。

保证视频实时分割的响应性、速度和可靠性,综合考验了一家公司技术团队的研发和工程能力。

在 AI 领域的发声

作为一家 2C 的产品公司,美图一直以来营造的是一个接地气的亲和品牌形象,随着科技感更强的手机品牌的推出,美图也逐渐在人工智能领域寻找更强的存在感。在「百变背景」正式推出之前,美图就把相关 Demo 搬到了学术大会 VALSE(视觉与学习青年学者研讨会)上

这场四月中旬召开的学术会议,参会者达 2500 多人,聚拢了国内顶尖 AI 公司代表和计算机视觉青年研究人才。


VALSE 用于展示论文 Poster 墙的附近,就是 Demo 区,排列着国内大大小小的计算机视觉公司展台,包括
BAT、旷视科技、格灵深瞳、云从科技、滴滴出行等。与其它 AI 公司展台动辄「识别率」和人脸比对系统坐镇的高冷范儿相比,美图展台的 Demo
产品更易令人产生参与的欲望,试玩的人自然络绎不绝,内行走过,也会不禁念叨一句「哟,他们家产品挺有意思」。

(VALSE 现场图)

不可否认,美图的产品招人喜欢。

美图在人工智能领域并不算喊得很大声的那一个,但是动作下得很早。

2010 年,美图成立了一个专注于前沿影像技术研发的实验室:MTLAB(美图影像实验室)。这次推出的「百变背景」功能,就出于 MTLAB 之手。

MTLAB 地理上分布在北京、厦门和深圳,北京注重于长期、基础性技术研究,厦门 MTLAB 侧重 AI 应用落地,深圳则偏重于硬件产品的算法支持。这个实验室早在 2012 年的时候就关注了深度学习技术。美图 CTO 张伟在接受雷锋网采访时,介绍道:

「大概在 2011、12 年就开始加入人工智能部分的研发了。原因是,这东西一开始看起来是万能的,当然后面发现有很多问题。」

(美图 CTO 张伟)

虽然不同地区实验室侧重点不同,但是为了确保研发和产品的无缝衔接,往往会把同一个项目的研发人员,分在北京、厦门和深圳三地。其他部门的员工,大约每两周都要与实验室的同事碰头,产品经理分享新的 app 资讯,实验室同事分享新的 paper 和技术趋势。

实际上,一个新的产品功能,都是在研发和产品团队反复「磋商」的氛围中诞生的。

「我们基本上是一个研发小组先做
demo,demo
不错的话,交给一个中间架构团队把它封装成一个组件,交给前端。然后在公司里面去问,哪个产品团队对这个新技术感兴趣?有团队感兴趣的话,产品团队里的设计师们,就会拿过去做二次开发,然后再对这个组件提一些性能、速度、效果方面的建议。」

谈及美图来这次
VALSE 大会的缘由,张伟经常提到一个词汇就是「看到」。美图虽然是年资较长的上市公司,在人工智能领域投入也不菲,但 AI
这个标签并不是其与生俱来的。就算是在人工智能领域重度参与的英伟达,其 CEO
黄仁勋还在最近的采访中表示「将来某一天,我们可能会成为一家人工智能计算公司」。这是向 AI 转型的公司都要共同面临的课题,要反复向外界强调自己在 AI 领域的存在。所以美图需要参加 AI 圈的活动,不论学术的还是业界活动:

「因为我们毕竟在做 AI 这个领域,我们希望大家看到我们,我们也看到他们。」

如果不做人工智能,美图就会空掉

人工智能对于美图公司来说,到底处在一个什么样的位置?作为 CTO 的张伟一句话说明了一切:

我花 70% 的时间在上面...... 我们觉得如果再过三年,这家公司不做 AI,可能就会空掉了。

美图从一家工具型公司,往人工智能公司转型,不仅仅是出于产品需求,更是攸关性命的一项抉择。在他看来,人工智能这项技术,可以把美图已有的东西重新刷一遍,将技术水平提升到一个前所未有的高度。

「很多人工智能创业公司有个问题,就是『为人工智能而人工智能』,这不是一个合理的东西。但我们就是有一个很明确的目标,比如女性变美这件事情,这件事情很垂直,深度学习能做吗?一定能做!大数据能不能起到作用,一定能起作用!」

李开复曾经盛赞美图是一家「顶级人工智能公司」。对此,张伟本身的用词会更加谨慎:

「开复老师这么说,是对我们一个非常高的肯定。如果你去看开复老师对于人工智能的定义,是包含两个方面,就是机器学习+大数据。那至少另外一半我们是有的。剩下的机器学习,我个人认为,深度学习相关的东西,美图已经涉及的足够深了。」

众所周知,美图坐拥人脸和图像数据巨矿,剩下的,就是对挖矿工具的深度打磨。张伟认可人工智能技术的巨大价值:

「整个世界都在等炼油的技术,数据就像石油一样,如果没有炼油的工具,石油就是一团黑水。但只要你有了炼油的工具,只要能挖到石油,那就跟印钞机一样。」

但同时,他是一个坚定的「非技术决定论者」,他认为一项 AI 技术的成功应用,还涉及到产品、设计、商业等各种因素。

虽然美图拿手的是人脸技术,但是出于对电商和广告抱持的野心,美图研发团队的人员同样投入大量精力在其他物体的识别技术上。

「我们内部做人脸的人数,跟做其它物体识别人数,比例为 1:7。」

没有对手,有什么意思?

美图的产品,并非没有对手。例如打头阵的美图秀秀 app,市面上就有很多类似的竞争对手,而且有的是来自于 BAT 级别的公司,美图当然有危机感,但对此张伟用了一个很性情的词儿--「酷」。

「我们有很强的危机感,但这实际上是一件很酷的事情。没有对手,有什么意思?我们也知道一些竞争对手的相关团队有挺多人,我们投入很大的精力和资金去追赶,但是当证明完自己之后,我们在想一个问题,就算你比其它公司多出 0.1%、0.2% 个点,还是远远不够的。」

归根结底,还是一个老观点,技术并不是唯一决胜的关键,美图的「颜值」生态链,包括庞大垂直的用户群、对用户需求的精准把控、品牌效应和商业模式构成了一个完整的链条,这是其核心竞争力。

「我们每一个产品都有一个竞争对手,但是合在一起,我们觉得没有像我们一样的综合体。我们的看法是,如果我们再把技术往深的地方做,一定会把别人拉开一大段距离。但即便拉不开大距离,以我们目前产品、运营、品牌的综合实力,我们不会觉得有多大问题。因为不只是比技术。」

所以,在 AI 技术方面,美图并不忌讳借用外力。甚至为了更快取得先机,会主动寻求与更多第三方合作机会。而美图这次参加 VALSE 大会,其实也是为了跟 AI 业界同仁进行一次深度的交流,谈一谈可能的合作。

「美图不然自己做,不然就靠第三方的资源建立起来,构建自己独一无二的生态系统...... 我们正在跟世界上很多不同的团队,一起来做深度学习的工作,互相学习和交流,而我们也在做学术方面的工作。」

谈及如今 AI 公司几乎标配的「首席科学家」,张伟也是保持着开放的态度。

「每个公司邀请首席科学家的目的不同,可能是为了更好的融资,也可能是为了让公司的技术水平进一步提升。对于美图而言,如果一位科学家的加入能给我们的研发水准带到一个新的高度,我们也很愿意敞开怀抱去迎接他的到来。」

本文作者:亚萌

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-28 19:08:07

专访美图 CTO 张伟:5年以前,我们也不会想到会花 70% 的时间在人工智能上的相关文章

美图秀秀设计分析:在Android,iPhone上的交互设计

文章描述:只是自己对于美图秀秀这款产品在设计上的一些想法,权当抛砖引玉,还请指点. 出于职业习惯,使用一款产品时总会不自觉地对其设计进行分析.当打开美图秀秀时,我知道,我又开始了. 美图秀秀是厦门美图科技有限公司旗下的一款产品,分别有 PC 客户端, Android, iPhone 应用.公司旗下还有其它几款产品:美图看看--免费看图软件,美图拍拍--摄像头自拍软件,美图淘淘--网店图片批理处理软件,美图化妆秀--强大的上妆软件.个人非常看好美图淘淘,依托淘宝这个大平台,它为广大淘宝店家们解决了

美图看看如何利用幻灯片打造五月最美新娘

  结婚,对于每个女人来说,都是十分神圣的.做作为其中最为隆重的,大概就是婚礼了.而作为夫妻爱情的重要见证,去影楼拍摄的漂亮婚纱照,肯定希望能和亲朋好友一起分享,比如在电脑上幻灯播放或是在婚礼现场播放等,美图看看这款小巧的看图工具就可帮到大家. 一.婚礼现场用美图看看来幻灯播放 不少新人都喜欢在婚礼现场播放拍摄的婚纱照,实现方法也很简单:将笔记本电脑和婚礼现场电视相连,在笔记本上启用美图看看的幻灯片播放模式即可.婚纱照片都是一些高清数码大图,用传统幻灯片播放软件来播放,容易出现停顿现象;而美图看

美图看看便捷整理旅行照片的方法

   夏天就要到了,相信很多摄影爱好者们又蠢蠢欲动了,想必大家都想到大自然中去咔嚓咔嚓一路猛拍吧!旅行回到家,面对如此多的美景图片,千万别忘了用美图看看来帮你整理这些旅行照片啊!因为这款软件有批量处理功能,而且还可以一键批量上传QQ相册实现网络分享哦! 一.批量修改图片尺寸方便上传 单反相机拍摄的照片,一般都是4MB以上的高清大图,如此大体积的照片是不适合网络上传分享的,需要先修改一下图片尺寸.美图看看的图片编辑功能里,就能批量进行图片尺寸的调整.如图01所示,只要自行输入修改后的图片尺寸,以及

美图秀秀批处理工具抢先揭秘 多快好省!

多快好省!美图秀秀批处理工具抢先揭秘,对于摄影爱好者来说,每次摄影创作拍摄动辄上百张的照片,面临后期处理时总是一件头疼的事情,如何多快好省地完成照片后期处理是摆在心头的头等大事,一张张的对照片处理实在是一个又土又笨的办法,而且花费的时间成本很高.毫无疑问,对照片批处理是明智之举!美图秀秀为解决摄影爱好者这一难题,在即将发布的美图秀秀PC版V3.7中增加了批处理功能,效果如何,让我们一起来试用检验一番. 图01 美图秀秀批处理功能入口 众所周知,美图秀秀是一款美图的逆天神器,尤其在人像处理上,强大

美图秀秀创始人吴欣鸿:从千万小子到亿万先生

中介交易 SEO诊断 淘宝客 云主机 技术大厅 [编者按]每一年的"30岁以下创业新贵"都会有些新面孔,同时,也都会有"漏网之鱼",比如1981年出生的美图秀秀创始人吴欣鸿.这当然和我的视野有关,但不可否认,在北上广深之外的很多地方,都"隐藏"着一些不为外界所知的年轻创业者,他们低调.他们久经沙场.他们成绩斐然,还比如,同为1982年出生的熊俊和姚剑军.这些人刚刚达到自己人生的而立之年,对于他们来说,创业无止境,新贵永不晚. 这不是一个关于如何发

美图秀秀花底字怎么制作 花底字制作教程一览

给各位美图秀秀软件的使用者们来详细的解析分享一下花底字的制作教程. 教程分享: 打开美图秀秀,新建透明画布.   美图秀秀花底字教程第二步. 在透明画布内插入文字,注意字体要加粗.   美图秀秀花底字教程第三步. 右击文字,选择全部合并. 美图秀秀花底字教程第四步. 之后继续右击,点击插入一张图片. 美图秀秀花底字教程第五步. 选择一张图片.   美图秀秀花底字教程第六步. 然后将图片放大,直到完全盖住文字.   美图秀秀花底字教程第七步. 右击图片,点击正片叠底(融合). 美图秀秀花底字教程第

美图秀秀制作卡通效果教程一览

给各位美图秀秀软件的使用者们来详细的解析分享一下制作卡通效果的教程. 教程分享: 首先来看看对比图:   美图秀秀卡通效果制作第一步. 在"美图秀秀"软件下打开待处理的一张人物照片,在"美化"菜单下,选择透明度为100%的"基础-锐化"特效,轻松提高清晰度,为后期铅笔画的线条感做准备.   美图秀秀卡通效果制作第二步. 接着选择透明度为65%的"艺术-素描"特效和35%的"蜡笔"特效,素描画像的质感已经初现

蔡文胜因美颜手机重出江湖:任美图秀秀董事长

蔡文胜开始从公众的视野消失是在2010年的中国首届微博开发者大会上新浪科技 爱文或许是雷军的小米太过耀眼,行事低调的蔡文胜正因为美图秀秀的美颜手机走向一线.据接近蔡文胜的人士透露,知名天使投资人蔡文胜在离开媒体视线的三年里投资多家移动互联网企业,其中最重要的是位于厦门的美图秀秀.在美颜手机MeituKiss项目提出后,蔡文胜本人即亲自出任美图秀秀董事长,公司创始人吴欣鸿担任CEO."蔡文胜本人非常看好移动互联网的延伸领域,他对MeituKiss项目很重视,时常出现在美图秀秀的总部大楼,与项目组成

从美图秀秀到魔漫相机,图片狂欢下一站在哪

当我看到女友也在朋友圈分享 魔漫相机效果后照片时,我明白,自前几天来往大礼包后,朋友圈又小规模沦陷了.我对图片有天然的好感,我喜欢读图.我喜欢那些插图精美的杂志,我喜欢那些封面优美的唱片,我喜欢那些配图精致的网站.我想这或许是人类本性,图片色彩丰富.立体直观,更显温暖和友好,相较于单调的文字,更让人容易喜欢.所以,当58同城上市时,看到旁边的蔡文胜,我是发自肺腑的敬佩,美图秀秀的贡献不比BAT差多少吧.移动互联网时代,图片应用的出现更是让图片无处不在,随时产生.随时美化.随时分享.表情这种类似图