用深度学习快速人脸建模

本篇论文发表于 SIGGRAPH 2017,并入选 Technical Papers Preview Trailer。为便于非专业人士阅读,以下介绍尽量不夹带英文和公式,也尽量精简扼要。

关键词:Face Modeling, Face Database, Deep Learning, Face Caricatures, Gestures, Sketch-Based Modeling

论文链接:DeepSketch2Face: A Deep Learning Based Sketching System for 3D Face and Caricature Modeling

简介

脸部建模一直是计算机图像和视觉领域的热门话题,包括卡通人物建模、人脸艺术设计、人脸实时重构等等,尤其是交互式人脸建模。我们构建了一个快速的、交互的、基于深度学习的人脸建模框架。通过简单勾勒人脸图画(caricature),我们的模型可以迅速生成对应的三维人脸模型,并且可以同时拟合面部轮廓和细节表情。同时我们也提供了多种方式进行快速的模型修改。实验证明我们的结果具有高精度和快速度。

框架

非常推荐大家通过视频了解我们的框架:

Youtube: DeepSketch2Face(SIGGRAPH2017) Youtube

腾讯视频: DeepSketch2Face(SIGGRAPH2017) 腾讯视频

框架的流程如图所示:

初始绘制模式(Initial Sketching Mode)

我们采用了卷积神经网络(CNN)来学习二维绘画的人脸特征。如图所示,输入是 256 乘 256 大小的绘画图片,通过卷积层提取特征,结合每个像素点的双线性插值编码,利用不同的全连接层,最终输出一个 50 维的人脸向量和一个 16 维的表情向量。我们预设了 50 个人脸基底和 16 个表情基底,最终输出的模型则是向量和基底的点乘。我们可以做到近乎实时的渲染,即用户每勾勒一笔线条,迅速输出对应的拟合三维模型。(对于卷积层,我们采用了较老的 AlexNet。我们也试验了 Resnet 等更新的网络结构,在精度上没有特别显著的提升;同时考虑到实时绘制的速度要求,我们选择了这样一个折衷方案。)

以下是一些真实渲染结果:

连续绘制模式(Follow-up Sketching Mode)

利用同样的卷积神经网络以及区域变形技术(Laplacian deformation),我们给用户提供了简易修改的绘制方案。对于不精于从空白纸张绘制肖像的用户,或者不想生成复杂人脸形状的用户,可跳跃第一步直接进行连续绘制。在连续绘制模式下,由单向工程(二维 -> 三维)转变为双向工程 (二维 <-> 三维):用户可直接从当前生成或预设的三维模型得到一个二维的人脸轮廓,并基于这个人脸轮廓进行修改、删除、变形等操作;类似于第一步,这个二维轮廓可以生成相应的三维模型。

下图是一个典型的通过连续绘制模式生成的模型:

精细修改模式(Gesture-based Refinement)

我们提供了基于手势的精细修改模式。如图所示,用户可以通过相应的手势,选取图像的区域进行变形,如面颊凸起,眉毛修改、面部轮廓修改等等。用户的手势也是通过一个简单的卷积神经网络学习,输入是用户绘画的手势,输出是对应的操作。

其他

平均来讲,基于我们的框架,新手绘制一个人脸模型只需要 5~7 分钟,熟练后甚至在一两分钟内就画出一个逼真的人脸模型。我们支持多种模型格式输出,以便对接其他平台。用户在实时操作过程中可以无障碍地进行撤销和恢复操作。用户操作窗口本身也支持各种常见的渲染操作,如放大缩小旋转移动贴图等等。同时,我们也提供了一个用于人脸建模的数据库,包含极大量的人脸模型,及其不同的表情和夸张程度(levels of exaggeration)

结尾

有了这个软件,再也不用担心不会建模了!更多关于模型的细节和数学公式,请参考原论文。

----------------------------------

更新:鉴于大家的需求,我们会陆续上传 demo 文件和数据库资料(预计八月),需要的童鞋们可以先 star 我们的 repo: irsisyphus/deepsketch2face

====================================分割线================================

本文作者:AI研习社

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-08-02 08:37:51

用深度学习快速人脸建模的相关文章

深度学习在人脸识别中的应用——优图祖母模型的“进化”

雷锋网按:本文转自腾讯优图,着重介绍了深度学习在人脸识别中的应用,首先回顾了人脸识别的历史,接着介绍优图在人脸识别中的优势,及其"进化过程". 说到人工智能(Artificial Intelligence, AI)人们总是很容易和全知.全能这样的词联系起来.大量关于AI的科幻电影更给人工智能蒙上一层神秘的色彩.强如<黑客帝国>.<机械公敌>中的AI要翻身做主人统治全人类.稍弱点的<机械姬>里EVA懂得利用美貌欺骗中二程序员,杀死主人逃出升天.最不济也

基于深度学习的人脸自动美妆与深度哈希算法

雷锋网按:本文作者朱鹏飞,天津大学机器学习与数据挖掘实验室副教授,硕士生导师.分别于2009和2011年在哈尔滨工业大学能源科学与工程学院获得学士和硕士学位,2015年于香港理工大学电子计算学系获得博士学位.目前,在机器学习与计算机视觉国际顶级会议和期刊上发表论文20余篇,包括AAAI.IJCAI.ICCV.ECCV以及IEEE Transactions on Information Forensics and Security等. IJCAI16会议介绍: 国际人工智能联合会议( Intern

集智科学家张江解析:为什么复杂性需要深度学习?

雷锋网(公众号:雷锋网)按:本文来自北京集智俱乐部.作者张江,北京师范大学系统科学学院副教授,集智俱乐部创始人.现任主席.集智科学家,腾讯公司腾云智库成员. 尽管复杂性科学一直在追求一大类终极问题的答案,如生命的起源.复杂性的起源等.但其实它的发展完全是研究方法驱动的.例如在计算机出现之前,人们是用哲学思辨和数学方程来研究复杂系统:到了90年代,圣塔菲学派兴起,多主体仿真.复杂自适应系统方法席卷了各个研究领域:2000年以后,复杂网络崛起,小世界和无标度以及各式各样的网络分析渗透到了复杂性研究的

CNCC 2016 | 山世光:深度化的人脸检测与识别技术—进展与展望

雷锋网(公众号:雷锋网)按:本文根据山世光在 CNCC 2016 可视媒体计算论坛上所做的报告<深度化的人脸检测与识别技术:进展与问题>编辑整理而来,在未改变原意的基础上略有删减. 山世光,中科院计算所研究员,中科院智能信息处理重点实验室常务副主任.主要从事计算机视觉.模式识别.机器学习等相关研究工作.迄今已发表CCF A类论文50余篇,全部论文被Google Scholar引用9000余次.曾应邀担任过ICCV,ACCV,ICPR,FG等多个国际会议的领域主席(Area Chair).现任I

揭开知识库问答KB-QA的面纱5·深度学习上篇

自 2015 年开始,深度学习用于 KB-QA 的方法取得了很好的效果,并逐渐成为了 KB-QA 的主流方法.也涌现出了一批使用深度学习提升传统的语义解析.信息抽取和向量建模方法的优秀论文.本期,我们先以深度学习提升向量建模方法为例,作为深度学习篇的上篇,为大家进一步揭开知识库问答的面纱. 我们在揭开知识库问答KB-QA的面纱4·向量建模篇介绍了 KB-QA 中介绍了传统方法之一的向量建模(Vector Modeling)方法,该方法具有操作性强,不需要任何手工的特征等优点. 今天,我们将介绍一

深度学习网络大杀器之Dropout(II)——将丢弃学习视为集成学习之我见

首发地址:https://yq.aliyun.com/articles/110002 更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 关于dropout的分析,可以见博主的另外一篇文章: <深度学习网络大杀器之Dropout--深入解析Dropout> 1.引言 随着2012年Hiton的文章<ImageNet classification with deep convolutional neural networks>[1]的问世,掀开了学

浪潮胡雷钧: KNL+FPGA是加速深度学习的黄金搭档

8月17日,在美国旧金山举行的英特尔信息技术峰会(Intel Developer Forum,简称IDF)上,浪潮首席科学家胡雷钧进行了先进技术报告演讲,他结合当前深度学习应用特点和先进计算技术架构进行分析,认为KNL+FPGA是加速深度学习的黄金搭档.   深度学习在人脸识别.语音识别.精准医疗以及无人驾驶等领域被广泛的应用,近年来在高性能计算技术的支持下,其发展十分迅速.然而,深度学习的发展也面临着众多困境,如深度学习软件扩展性不够高.计算性能不够高.深度学习线上识别能耗大等问题. 在多年的

谷歌4亿美金收购深度学习创业公司DeepMind Technologies

香港中文大学教授汤晓鸥.王晓刚及其研究团队上周宣布,他们研发的DeepID人脸识别技术的准确率超过99%,比肉眼识别更加精准.汤晓鸥领导的计算机视觉研究组 (mmlab.ie.cuhk.edu.hk) 开发了一个名为DeepID (深分证)的深度学习模型, 在LFW (Labeled Faces in the Wild)数据库上获得了99.15%的识别率.LFW是人脸识别领域使用最广泛的测试基准.实验表明,如果仅仅给出人脸中心区域,人用肉眼在LFW上的识别率为97.52%.在此之前,汤晓鸥的研究

人脸检测发展:从VJ到深度学习(上)

雷锋网(公众号:雷锋网)按:本文作者邬书哲, 中科院计算所智能信息处理重点实验室VIPL课题组博士生,研究方向:目标检测,尤其关注基于深度学习的目标检测方法. 本文分上下两篇,上篇主要介绍人脸检测的基本流程,以及传统的VJ人脸检测器及其改进,下篇介绍基于深度网络的检测器,以及对目前人脸检测技术发展的思考与讨论.为了让本文更适合非计算机视觉和机器学习背景的读者,文中对所涉及到的专业术语尽量以通俗的语言和用举例的方式来进行解释,同时力求严谨,以体现实事求是和一丝不苟的科学研究精神.    这是一个看