直播时,阿里的老司机们都做了什么?

直播作为近来新兴的互动形态,已经成为近几年最风生水起的行业之一。在2016年仿佛进入了“千团大战”的繁华。欢聚时代10亿砸向虎牙和ME直播,斥资1亿签下主播MISS;腾讯4亿投资斗鱼,后者估值10亿美元;新成立的映客获得昆仑万维、复赛等机构的8000万人民币投资;易直播获得6000万人民币A轮融资;360推出花椒、秒拍推出一直播....网络直播正享受其最好的时光,直播"风口"成投资方必争之地。

然而网络直播也因为走的太快,而失去了出发的初心,主播行为、直播内容变得不可控,低俗、大尺度、无下限成为“劲爆”栏目。针对网络直播的种种怪相,12月1日,由国家网信办发布的,媒体认为“史上最严”的《互联网直播服务管理规定》正式开始施行。《规定》要求直播平台按照“后台实名、前台自愿”的原则,对用户进行移动电话号码等真实身份信息认证。而对于网络主播们,《规定》更要求通过审核身份证件等更为严格的方式进行认证登记。

而这些网络直播在进行实人认证时,需要对包括姓名、证件号、生物属性、手机和位置等要素进行识别,如何在提高用户体验的同时准确的判断账号背后真实的人,也是目前困扰着各大公司的一大难题。目前阿里聚安全实人认证中使用的技术能够大大提供自动化认证率和审核效率。

主播实人认证

主播的实人认证,基于自主研发的证件OCR、人脸识别等实现了88%以上的自动化认证率,并且采用云(3D、翻拍检测等)+端(交互动作等)相结合的活体检测技术来防御虚假认证的风险攻击,以确认主播的真实身份,降低违法风险。

对主播进行了严格的实人认证:做到人证合一,即根据认证过的账号身份信息,能准确找到对应的真实的自然人。

实人认证系统示意图

其中涉及的智能技术很多,介绍其中两项。

一、身份证OCR

身份证OCR是把身份证图像中的文字识别为计算机能认识的文本,自动与公安网等权威数据库比对,验证姓名、号码等信息的真伪。

基于自由拍摄证件图像,流程见下图。为保证识别率和速度,同时融合了传统算法和深度学习算法。

身份证信息检测流程图

OCR算法对“姓名”字段的识别准确率达98%以上,对“身份证号码”和“有效期”达99.5%。 系统具有很强鲁棒性,以下case都可以轻松识别。

OCR可以识别的身份证举例

二、生物特征识别

只介绍人脸识别和人脸活体检测。

人脸识别在学术界已超肉眼的识别水平,但能在实际中的大规模应用还比较少,原因是实际场景复杂和数据缺乏。挑战来自光照、姿态、翻拍、化妆、衰老以及低照片质量。

我们对用户真人人像、身份证照、权威数据库的头像进行两两比对,以验证身份的真实性。算法能在0.1%的认假率下,使得合法用户自动通过率达93%以上。

人脸识别包括图像获取、人脸检测、活体检测、关键点定位、特征提取、识别引擎等模块。

人脸识别系统

1、人脸检测

采用Boosting+RCNN框架。

人脸检测结果图

2、活体检测

活体检测是为了确保待认证的用户是“活人”,而不是事先拍好或翻拍的人脸照片、视频,防止虚假认证,降低主播的违法风险。

活体检测实例图

活体检测模块包括:

  • 人脸检测

检测是否出现人脸,且不能是多张脸, 防止不同的人切换或人与照片的切换。

  • 3D检测

验证是否为立体人像,防止平面的照片或视频攻击。

3D检测示意图

  • 活体算法检测

验证用户的操作是否正常,指定用户做随机动作(凝视、摇头、点头、眨眼、上下移动手机等)。

  • 连续性检测

防止中途切换人。

  • 翻拍检测

利用深度学习技术, 区分获取的人像是否为对屏幕、照片的翻拍。

3、人脸关键点定位

定位出眉毛、眼睛、鼻子、嘴巴等位置。主流方法有:基于参数模型的方法;基于回归的方法;基于深度学习的方法。

我们采用基于特征的回归方式+深度学习的方法,来训练关键点定位模型。

人脸关键点检测示意图(图片素材来源网络)

4、特征提取

Maxout结构示意图

我们同时采用了传统人脸特征(WLD, HOG,LBP,Gabor等)和基于深度学习(基于VGG、GoogleNet、Maxout三者的融合网络)的特征进行人脸识别。

5、识别引擎

传统人脸特征,我们采用SVM进行pairwise距离度量;DL人脸特征,对已经学习的分类模型进行微调。

实人认证自动化是基于人脸、OCR的识别结果,基于大数据,综合利用用户的行为特征,进行多维度信息融合,最后得到综合决策模型,实现自动决策的过程。而在目前互联网发展的多种业务中,实人认证技术的应用场景纷繁复杂,对技术指标的要求也不尽相同,阿里聚安全提供的实人认证技术以生物识别、无线安全技术为支撑,保障实人认证有效性。

目前,阿里巴巴人脸识别技术已在实际场景中大规模应用,实战中相关性能指标在FPR(False Positive Rate)0.1%情况下,TPR(True Positive Rate)达96%,识别准确率远远超过人体肉眼识别。

前文回顾:为了不在直播中看到少儿不宜的景象,阿里做了这些

本文作者:左芬

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-31 05:22:23

直播时,阿里的老司机们都做了什么?的相关文章

程序员老司机们都要错的Python陷阱与缺陷列表

我个人对陷阱的定义是这样的:代码看起来可以工作,但不是以你"想当然""的方式.如果一段代码直接出错,抛出了异常,我不认为这是陷阱.比如,Python程序员应该都遇到过的"UnboundLocalError", 示例: >>> a=1  >>> def func():  ...     a+=1  ...     print a  ...  >>> func()  Traceback (most rece

十年建站老司机带你十分钟搭建网站

本文概要: 1. 域名 + 域名注册 + 域名备案 + 域名解析绑定 2. 服务器 + 虚拟主机 + windows服务器 + linux服务器 3. CMS建站系统 4. 总结 在如今互联网发展迅速猛进的大环境下,网站已经成为一个企业不可缺少的网络媒介.但网站开发行业鱼龙混杂,质量参差不齐,价格更是跨越区间大.尤其对于那些在建站方面不懂的小白来说,很容易被人坑,所以作为在网站开发行业摸爬滚打多年的草根老司机,通过本文向大家分享建站的经验与心得,避免不必要的弯路和成本损耗. Come on! 小

老司机的双11手记:这么牛的阿里云数据库,你造怎么用吗?

老司机的双11手记 2016年天猫双11购物狂欢节已经完美落下帷幕,高峰期间订单创建每秒达到了XX万笔,总订单量达到了XX亿,技术指标再次刷新世界纪录.其中XX%的订单通过聚石塔订单推送,并在阿里云云数据库服务(AliCloudDB,曾称RDS)中完成存储和处理.在持续高压力冲击下,整个双11期间AliCloudDB表现坚如磐石: 高峰期间集群的总QPS达到了近XX每秒: 单个商家最高处理订单的能力超过XXX万单: XX万商家在AliCloudDB上稳定运行,全网实现了0故障,0丢单. 华丽数字

竞选老司机避让的黑洞,营销员还往中跳

本文讲的是竞选老司机避让的黑洞,营销员还往中跳2016年美国大选从数位候选人的竞争到最终PK阶段,话题热度始终不减,其中社交媒体上"爆料"最多,内容最抓眼球,堪称2016最佳"宫廷"大戏.根据尼尔森对9月第一场辩论的统计,仅在Facebook和Twitter上就获得8300万次响应,成为史上观看人数最多的辩论.从2008年被称为"首位社交媒体总统"的奥巴马,到如今在花费和预测上都"以少胜多"的特朗普,如何将社交媒体作用发挥得风

老司机谈鉴黄,新一代“鉴黄师”是如何养成的?

在互联网高速发展的今天,直播平台,内容社区,视频网站等UGC/PGC平台蓬勃发展,如雨后春笋般出现.但巨大的安全隐患也接踵而至,内容审核成为企业最关键的一道防火墙.企业招聘大量的内容审核专员来应对包括色情.暴力.犯罪等多个方面的不良内容.其中鉴黄师可能是最神秘也最令人遐想的岗位了. 说起鉴黄师,大家会心一笑,看看黄图还有高收入,简直没天理.但是在从业人员看来,它真的那么令人向往吗?阿里聚安全小编专访了负责阿里内容安全(阿里绿网)的资深赛车手--来自阿里安全多媒体算法团队的唐秋.常年战斗在一线的他

全民直播牵手阿里云,技术升级触发直播新体验

免费开通大数据服务:https://www.aliyun.com/product/odps [猎云网(微信:ilieyun)北京]1 月 21 日报道(文 / 王艺多) " 建设一家大型的直播平台充满了技术挑战.毫不夸张的说,直播平台囊括了几乎所有的主流互联网技术:Web 站点.App 客户端.音视频编解码.即时聊天.充值付费.送礼消费.社交互动.直播点播.卫星接收.实时互动--相比传统网站应用,直播平台还具有极高的实时性和突发性的特点,对技术故障的敏感度极高.种种问题无疑对平台建设的研发团队提

数据科学入门难?老司机为你盘点 24 门精品课程

本文盘点了 24 个高品质的在线数据科学入门教程,原作者 David Venturi,他获有化学工程和经济学的双学位,热衷于数学.数据科学和统计学,同时也是一位编程爱好者.更具传奇色彩的是,他本来就读于一所名校的计算机科学专业,但觉得对数据科学更感兴趣--于是果断退学,从 Coursera.edx.Udemy 等慕课平台开始自学,终迈入专家行列. 他的经历说来也并不特别,世界上又多了一个慕课代言人而已.但雷锋网认为,他的经历具有两点价值:首先,最好的教学资源已经在那儿了--很多还是免费的,取不取

独家分析 | 借贷宝被拖库导致裸条泄露?黑客老司机解析10G“资源”背后故事

   事情还要从微博说起,某微博用户爆料女大学生遭遇裸贷威胁,裸条信息被兜售.当时"裸贷"等字眼并不熟悉,然而却涉及一个大家所熟知的借贷平台--借贷宝. 裸条是怎么产生的? 接触过信用贷款或者高利贷的人也许了解,由于普通大学生的还款能力不高,很多情况下无力偿还贷款,一般情况下贷款放贷是不会给大学生放贷.然而大学生群体又确确实实是缺钱的一批人,于是就有人借机想出了一个怪招 --"裸贷". [网上流传的裸条图片] 他们信奉的是"你还不起没关系,我想办法逼着你家

杨曦:老司机谈混合云的接入正确姿势

混合云的接入正确姿势 在今年的双11场景下,混合云产品很好的支撑集团大促业务,而在混合云的实践过程中,如何将传统的IDC机房接入公共云,并使两者非常好的配合起来工作,这是一个非常重要的话题,可以说,关系到混合云的成败. 不仅仅是双11,混合云未来会应用在各种各样的场景中,今天的老司机是阿里云的网络大牛杨曦,今年已经是杨曦参加的第五个双11,老司机将和大家谈谈混合云接入的正确姿势和那些年遇到过的坑. 谈谈混合云的两个关键: 第一个坑是安全,业务搬到公共云上第一个遇到挑战的就是安全问题,如果没有正确