第四范式陈雨强:如何利用高维度的AI解决商业难题?

雷锋网(公众号:雷锋网)按:4月21日,中国证券投资基金业协会主办的2017金融科技高峰论坛在杭州召开。“人工智能赢在维度。”第四范式联合创始人、首席研究科学家陈雨强在会议上讲道,“将来的企业运营中需要有更高的维度,维度的上升使得AI能力提升,从而使得企业能解决更复杂的问题,提升企业效率,进而提升企业竞争力,抢到更多的客户,提供更好服务。”

据雷锋网了解,陈雨强曾在百度凤巢主持架构了世界上第一个商用的深度学习系统,在今日头条主持设计了中国用户量最多的新媒体人工智能推荐系统。

那么,什么是更高的维度?企业如何提升运营效率?如何用人工智能解决更复杂的问题呢?雷锋网对于演讲全文进行编辑整理如下:

人工智能赢在维度

亚马逊是北美最大的在线零售商,沃尔玛是世界上最大的连锁超市。最近几年,亚马逊增长良好,增长率高达50%-60%,最低也在10%左右,而沃尔玛增长一直处于停滞的状态,有时甚至是负增长。那么两者为何有这么大的差别呢?

客户端复杂度

沃尔玛是一个超市,属于人力密集型,全球大概有十多万的员工,亚马逊则偏技术密集型。亚马逊员工人均年收益是62.1万美元,而沃尔玛员工的人均年收益只有22万美元,相差了3倍,这代表两者效率的差别。在这种情况下,亚马逊增长速率会越来越快,越来越多地蚕食沃尔玛市场份额。那是否说明沃尔玛是一个菜鸟的公司或在互联网时代不堪一击呢?

其实并不是。从某种角落讲,沃尔玛是数据挖掘的先驱,早在20年前,沃尔玛就有数据挖掘方面的探索和研究,啤酒和尿布的例子就是典型代表。

沃尔玛为什么在互联网时落后了呢?我们发现沃尔玛是基于地点推荐(Location
Based)的,亚马逊则是基于用户推荐的(User
Based)的,后者需要做到千人千面,每个人在亚马逊上看到的首页、搜索页、推荐页都是不同的,这种不同导致两者员工的人均年收益相差了3倍。亚马逊解决了一个更复杂的问题,所以增长率和市值都有较大提升。沃尔玛是曾经零售行业的老大,但在2014年-2015年间,亚马逊以指数性上升的速度超过了沃尔玛,成为了世界第一。

库存管理复杂度

不仅如此,亚马逊和沃尔玛的商场或者库存管理也存在着很大的问题复杂度差别。

亚马逊做了一个KIVA机器人,它可以自动运送货架到捡货员面前,捡货员把需要打包的货物挑出来打包即可。而沃尔玛则是N个配货员配一种货架。两者的问题复杂度相差也很大。

运营效率

如今,运营效率变得越来越重要。在传统行业,跑马圈地是重中之重,这对于互联网时代也是一样的。对于一些传统行业来说,移动互联网和互联网只是增加了一种新渠道,但还是以跑马圈地方式做事。以这种方式行事时,只需把产品做到60分,满足客户的基本需求即可,之后便尽最大可能获取最大的市场,获取市场和市场增长带来的红利。但随着市场愈加饱和,跑马圈地的模式逐渐失效。比如零售业的整体增长空间已经非常小了,剩下的无非就是你争我夺的过程。这时,如果谁从60分做到了80分,那就能将其它公司的客户转变成自己的客户。所以未来,运营效率代表着企业的核心竞争力。

总而言之,未来企业运营效率将会变得至关重要。我们可以通过解决更复杂的问题提升运营效率,而在解决复杂问题时,人工智能就需要粉墨登场。

人工智能如何影响企业效率

人工智能没有那么复杂,其实就是用数据解决问题。在数据方面,传统方法首先做的事情是分析数据。数据按照“二八原则”分布,大部分集中在头部。传统的分析方法会首先把尾部数据全部去掉,因为尾部的数据太多、而且杂乱,用传统的规则没有办法分析,而对于头部数据,会用十几~几十个特征或规则进行刻划。

这样的人工智能问题有什么问题呢?数据的价值并没有被完全发挥出来。

以证券公司为例,10万客户和1个亿客户的证券公司,如果只用头部的客户数据特征的话,两家公司对客户数据分析得出的结论没有区别,无非是什么年龄、什么性别、什么学历的人会喜欢什么样的产品等特征。但如果能用到更多特征、分析更细分群体的话,两者的结论将会有很大区别。1个亿客户的基金公司可能会发现一个100人的群体,他们的特征、喜好一致,那么公司就能基于此进行精准营销。而这100客户在只有10万用户的基金公司对应的可能之后1~2人,不能得到可信的结论。

只有用上所有的数据,并且分析得尽可能精细,数据量才能成为壁垒,量大的数据产生的价值才能比量少数据更大。

我曾经在今日头条、百度蜂巢工作过。当时,今日头条日活是几千万,特征总量大概有几十亿到几百亿,这意味着每个用户都有上百个标签,公司就能能精确区分一个用户在周二早上上班路上喜欢看什么新闻,或周五晚上下班后在家里夜深人静时喜欢看什么等,所以推荐效果可以做得非常精细。百度的搜索广告也是类似的,我们对一个什么样的人在什么搜索关键词下会看什么广告的组合有非常精细的刻画,每天上新的广告有上千万,日活上千万,在这样复杂的场景下用机器刻画,会有大量的特征量、规则量。

高维度对商业的影响

2012年,Facebook上市,但上市后四个月,它的股价就连续暴跌。我们当时和Facebook从市广告技术同事聊天,发现那时Facebook只用了大概2000维的特征刻画用户,但这完全不能够非常精细的、非常准确地预测一个人点击广告的概率,或在什么场景上会想要买什么东西。

2013、2014年时,一大批Google的广告、算法工程师加盟Facebook从事广告业务,他们把当时2千维系统做到2千亿维,相当于提升了1亿倍的维度。从2013年末到2014年始,Facebook的股价一路攀升,走上了传奇之路,维度对于整个Facebook收入提升至关重要。

在全国性商业银行的信用卡中心,每天有大概上百万笔的交易,这些交易过了风控之后,由银行来决定能不能让某个人交易分期。对于能交易分期的人,比如每天有一百万个,可以通过短信方式营销。但如何锁定这群人呢?

首先把分期进行目标拆解,把用户收入拆解成短信发送量×短信响应率×分期费率。通过短信发送历史,就能知道每个用户到底最终是否办理了交易分期,并基于此建立预测模型。这样在发送短信之前,就知道某个用户接收之前的概率高低,并进一步优化响应率。这种数据量并不大,但在当时银行里也算是最大的人工智能数据。当时用到2T数据,大概有4千万左右的历史发送的短信量,我们在其中抽取了很多特征,包括短信的信息、帐户的信息、持卡人、卡片、交易的信息等,共有5千万维信息,并且,最终响应率提升68%的和收入提升61%。

传统模型和AI模型的区别

传统模型和AI模型之前存在一些本质的区别。

维度是最大的区别。拿汽车分期问题为例,我们发现某个POS机进行汽车分期的概率会特别大,这个POS来源于一个小型母婴店,

这对于专家来说并不是特别复杂的问题。但问题在于这个母婴店很小,日流量是100、200规模,全国这样的母婴店有几千上万家,专家不可能逐家分析这样的母婴店,但机器可以,这正是机器的优势。只要我们能把问题变得足够复杂,机器就能分析每个维度。

另一方面是迭代自学习。传统专家规则是事先确定的,可能每隔一段时间,比如半年、一年进行一次规则调整。但改变很难,一方面成本高;另一方面,调整要求兼容原来的规则,同时加入新的规则,这是一件很艺术的事情。但对于机器学习、人工智能模型来说,在高维下加入新的特征、新的规则是非常容易的。正如AlphaGo每下一次棋,都会把棋谱拿回来复盘,使自己下棋的能力变得更高。

另外,电商推荐、智能理财、差异化定价、信贷、阅读、智能客服、个性化定制产品等都能用到人工智能。所以人工智能的价值是非常大的,想象的空间也是非常大的。将来问题的解决需要很高的维度,同时用复杂的模型,用高维的模型解决高维的问题。这个理论是有科学依据的。

Vapnik和Chervonenkis两位科学家提出了“VC”理论,来描述模型里函数复杂度的问题。函数复杂度可以类比为人脑神经元的个数,如果有更高的“VC”维,有更高函数能力,类比为有更多神经元,即为更强的智能能力。比如说人脑脑细胞数量比小白鼠脑内数量要多很多,所以说人比小白鼠聪明很多。所以说在将来复杂情况下,我们要不断的提升“VC”维,让企业运营的效率得到不断的提升。
 

最近深度学习在图像上的发展日新月异,从2010年到2016年,图象识别错误率在不断降低。2016年错误率已经达到了3.1%,而人做同样图片识别错误率是5%。也就是说,2016年之后,对于标准的数据库图片,计算机识别的能力比人要高。在这样的成绩背后,从2010年到2015年,图像识别维度从最开始几十万维,一直升到上亿维,更高的维度让整个效果有很大的提升。

总而言之,在将来的企业运营中需要有更高的维度,VC维的上升使得AI能力提升,从而使得企业能解决更复杂的问题,提升企业效率,进而提升企业竞争力,抢到更多的客户,提供更好服务。

人工智能赢在维度。

基于此,让人工智能落地有五大要素。第一要有明确的业务定义;第二需要不断的外部反馈,比如AlphaGo需要不断与人下棋,需要外部反馈不断输入;第三需要很强的外部资源;第四需要顶尖的数据科学家;第五需要大数据,大数据加上机器学习等于人工智能。

相关文章:

继美国之后,加拿大如何成为下一个人工智能金矿?

IBM人工智能技术商业化落地现状:目前已渗透到60多个职业领域

人工智能能够全面取代顶尖的销售人员吗?

易道博识:我们是如何用人工智能做商业自动化并实现盈利的

本文作者:张利

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-07-30 14:59:25

第四范式陈雨强:如何利用高维度的AI解决商业难题?的相关文章

专访uPlane陈宏强:手机遥控固定翼飞机还是蓝海

        小编第一次见到陈宏强,是在硬蛋i未来硬件大赛上.在决赛现场,当主持人说道请下一位选手上台演讲时,观众只见一台小飞机灵活地飞向舞台,轻快地在舞台上空盘旋,然后陈宏强用手机轻松地遥控着飞机信步走上舞台,顿时观众大为兴奋,场下掌声雷动. 这个叫做"uPlane"的用手机遥控.仅重10g.可以在客厅里飞行的小飞机就是陈宏强的得意之作,宅客小编一下子就喜欢上了这架小飞机. 陈宏强2005年毕业于北京航空航天大学宇航学院,学习火箭发动机.宅客小编和他谈了谈他个人和团队的情况. &q

陈国强白手起家做TVB新主人曾与叶璇等染绯闻

王雪红 陈国强 陈国强张玉珊 陈国强叶璇 新快报综合报道 香港电视广播有限公司(TVB)"变天"落实,取代"六叔"邵逸夫成为TVB新主人的,并非早前有意染指电视业的恒基地产主席"四叔"李兆基的长子李家杰,而是一直钟爱投资传媒事业.有"壳王"之称的陈国强.他联同已故台湾台塑企业董事长王永庆之女王雪红,与善于投资传媒业的基金组成的财团,将成为持有TVB26%股权的最大单一股东,并避过向TVB其他公众股东提出全面收购的责任.邵逸夫则

陈国强62.65亿港元购TVB

陈国强62.65亿港元购TVB 香港无线电视广播公司(TVB)主权易手,其收购价一直众说纷纭,这个疑团前日终于得到解答. 据港交所权益披露显示,德祥集团主席陈国强,于1月26日通过收购邵氏兄弟,买入TVB约26%的股权,每股作价为55港元(以下同),共计约62.65亿元(未计算邵氏兄弟持有的清水湾地皮价值),大致符合券商的预期. 陈国强以私人名义买入 交易于上周三公布后,TVB股价连日走弱,前日收报42.8元,反弹2.15%.以前日的收市价计算,TVB现在的市值达187亿元. 港交所的资料披露,

陈国强收购TVB内幕曝光:私人买入总价达90亿

陈国强有选择性地接受媒体采访 香港无线电视广播公司(TVB)主权易手,其收购价一直众说纷纭,这个疑团前日终于得到解答. 据港交所权益披露显示,德祥集团主席陈国强,于1月26日通过收购邵氏兄弟,买入TVB约26%的股权,每股作价为55港元(以下同),共计约62.65亿元(未计算邵氏兄弟持有的清水湾地皮价值),大致符合券商的预期. 陈国强以私人名义买入 交易于上周三公布后,TVB股价连日走弱,前日收报42.8元,反弹2.15%.以前日的收市价计算,TVB现在的市值达187亿元. 港交所的资料披露,陈

陈国强:非地产主业央企进入楼市背离战略定位

中新网5月17日电 国务院国资委"退房令"公布已近两个月,央企"退房"进程被指缓慢.对此,北京大学房地产研究所所长.中国房地产学会副会长陈国强做客中新网时表示,央企退出房地产市场不是朝夕之间能够完成的事情,并指出非房地产主业的央企进入房地产市场,背离了公司的战略定位. 中国指数研究院13日发布的一份最新报告显示,截至目前,78家央企中在产权交易所挂牌转让资产的仅有7家,房地产业务转让还没有形成态势,体量较小,退出进程缓慢. 陈国强认为,房地产是一个竞争性比较高,市场

利用高权重博客做网站外链的9个方式

内容为王,外链为皇这句经典SEO语句告诉我们一个好的站点不光内容要做的好,给客户很好的体验度和信息量之外,外部优化中的外链部分也是极其重要的,互联网中你说你是谁并不重要,关键是大家说你是谁这才重要. 网站优化外链大部分都是友情链接,论坛签名,博客外链,等几个主流的方式,然而今天推荐的便是高权重博客来做外链,博客本身就非常迎合搜索引擎的机制,其次高权重的博客本身就有很好的排名极致和价值,如果很好的利用可以有效的导入权重到自己的网站. 下面就来分享一下网站优化利用高权重博客做外链的九个要点 1.内容

董骏:如何利用高权重平台内页抢占百度首页

这几天回家呆着很爽,每天吃完睡.睡完吃,在家里比较安逸.比较肃静.公司7号上班.在家里好好的歇息一下.前段时间够忙活的了.前几天我跟波哥一起去的哈尔滨站,他去北京.我回牡丹江.昨天给我打电话.说他到上海了.我问他去上海干什么去?他说相亲,他老丈人给他灌多了.波哥已经是奔三的人了,面临着结婚,我记得前几天跟他开玩笑说,我说如果你要是结婚,我给你随50块钱.他跟我说我低于一万的话都不行. 我跟波哥比较有缘分,在北京的时候就认识了.他家是黑龙江鹤岗的,我家是牡丹江的.所以也算是老乡.那个时候交流的也很

利用高权重博客或论坛的tag来增加网站外链

作为网站站长都知道,外链对网站的排名有至关重要的作用.外链又有高质量外链和低质量外链的区别.比如在admin5发布文章就属于高质量外链,而利用软件群发的外链就属于低质量外链.但是我们不能否认,低质量外链对网站的优化还是有一定作用的,特别是对一些竞争度小的关键词.本文就分享一个经本人实践验证过的增加外链的方法,利用高权重博客或论坛的tag来增加外链. 站长们肯定都在公共博客或论坛发布过博文或帖子,文章中带上自己网站的网址,利用这种方法来增加网站的外链.但是,站长们在发布文章或帖子时,是否对tag功

上海交大CS系博士生李泽凡:利用高阶残差量化(HORQ)方法进行网络加速

本文讲的是上海交大CS系博士生李泽凡:利用高阶残差量化(HORQ)方法进行网络加速, 神经网络的压缩和加速现在已经成为一个热门课题,这个领域有多种研究方法,网络量化就是其中之一.网络量化分为输入量化和权值量化两种.而同时将输入和权值量化会造成网络精度的大幅下降.在Performance Guaranteed Network Acceleration via High-Order Residual Quantization (性能保障的高阶残差量化网络加速方法)一文中,作者针对这个问题,提出了高阶