第四范式:用最小可用产品(MVP)快速验证AI价值

本文讲的是 :  第四范式:用最小可用产品(MVP)快速验证AI价值  ,近日,AWS2017峰会在京盛大开幕。第四范式互联网业务负责人周开拓受邀出席,并发表了“打造人工智能MVP”的主题演讲,分享了企业高效、快速地向人工智能转型的宝贵经验。周开拓曾任职于淘宝网,负责在线推荐系统的设计和算法工作,加入第四范式之后,基于第四范式核心产品“先知”,孵化了面向中小企业的公有云版机器学习服务,致力于完成内容推荐、电商推荐、精准营销、计算广告等关键业务的AI转型。

快速定位机器学习的MVP

在移动互联网领域,最容易被接受的一个概念便是最小可用产品(MVP),即开发团队、设计团队用最小的成本、冒最小的风险,最大程度去验证产品的可行性——这个产品的可行性,是指这个需求是否真实存在,当前产品解决这个需求的方向是否是正确的。机器学习亦是如此,企业对于机器学习的投入是长期、持续的,带来的收入和回报也是巨大的,但在此之前,企业更希望用较低的成本去验证:引入机器学习是否可以带来业务指标的提升,产生价值的潜力有多大

以较为经典的推荐系统为例,数据科学家往往会从点击、购买、收藏、转发分享等来表达用户是否喜欢推荐的商品。为了简化目标,可以选择点击作为最小可用产品的优化方向,因为点击是所有事情发生的前提,且点击率容易得到较好的优化效果。而在游戏运营方面,其目标主要是尽可能延长玩家停留的时间,并且吸引玩家付费,故提高用户留存率便是重中之重。但由于留存率更多地由游戏本身的可玩性和玩家的兴趣喜好决定,可干预性不高,所以留存率较难影响。尽管整体的留存率难干预,但游戏收入都是由极少数忠实玩家提供,这部分玩家可以用很强的运营策略进行干预。所以对于游戏而言,可将最小可用产品的优化目标定位在尽快锁定游戏的高价值用户,且锁定时间要迅速。

机器学习MVP的关键步骤

在机器学习的项目中,数据决定效果的上限;建模、调参则是达到上限的过程。因此数据处理、建模、调参,是成功实现一个机器学习MVP至关重要的步骤。

以往,公司规模越大的企业获取数据越麻烦,且在数据的使用时,若使用了错误的方式进行拼接,项目后期出现问题时,很难debug。所以在项目前期,需要控制项目风险和成本的前提下,尽量使用熟悉、好理解的数据。宁可牺牲一些效果,也要避免使用看似有吸引力,但风险更大的数据。

对于数据本身来说,数据的挑选、数据是否有预测性等,无需耗费过多的人力去考虑,针对此类工作目前已经有了很成熟的方法和工具,在不违背因果关系的前提下,我们尽可能地让机器去自主完成,此外,真实的数据缺失是正常的,不缺失的数据可能才是有问题的,我们已经有很多方式来填充缺失值,或者把缺失本身也作为一个特征。其次,数据有离散的、连续的,比如预测一个游戏玩家是不是高价值用户,那么数据可能有这个玩家已经消费的钻石、金币数量,可能有这个玩家的职业,甚至是玩家手机型号,这就要求数据处理中能同时处理这两类特征。第四范式在这方面已经做了一些工作,先知平台已经根据连续和离散的数据的计算特性做针对性的设计。

数据选定之后,便开始建模。其中,特征组合与调参是关键。在解决实际问题中,业界倾向于先使用简单的逻辑回归LR模型,为了模型具备更强的学习能力及表达能力,就需要使特征具备非线性的特性。特征组合便是一种常用且效果明显的方法。换句话说,特征组合是一种加强特征描述能力,提升模型预测效果的方法。然而,想要获得特征组合并非易事,需要数据科学家具备极强的机器学习知识储备及业务理解能力。调参亦是如此。

事实上,特征组合与调参这类重复性较强且占用时间较多的工作可以用机器自动完成。在将数据科学家的经验固化为产品之后,技术人员只需设定好用于组合的基础特征,以及参数的类别、次数即可。目前,第四范式先知平台(试用链接:https://prophet.4paradigm.com)依靠自主研发的FeatureGo算法,实现了机器自动特征组合、自动调参的功能,解决了以往人为添加组合特征门槛高、耗时长等问题,大大节省了建模的时间。举个例子,此前第四范式基于先知平台打造了某新闻内容平台的新闻推荐系统,从数据基础开始构建,收集、分析、挖掘了新闻及用户等各个维度的数据,再通过自动特征工程、自动调参等功能,只耗费2周时间就训练出了特征维度数十亿级别的模型。最终,该平台推荐新闻的点击率提高35%,显著提升了用户的使用体验。

综上所述,当定义好了问题的目标、边界,利用现有的数据、人员,再配上一个专业的工具,一个机器学习业务改造系统的上线可以非常快速、有效。当机器学习技术真正产生了效果,客户就知道下一步应该如何投入资源,以及应该投在什么地方。

原文发布时间为:2015-7-14

本文作者:厂商投稿

原文标题 :第四范式:用最小可用产品(MVP)快速验证AI价值

时间: 2025-01-07 10:24:13

第四范式:用最小可用产品(MVP)快速验证AI价值的相关文章

验证最小化可行产品(MVP)的15种方法

摘要: 硅谷创业家Eric Rise在其著作 <精益创业> 一书中提出了精益创业(Lean Startup)的理念,其核心思想是,开发产品时先做出一个简单的原型最小化可行产品(Minimum Viable Product, MVP),然 硅谷创业家Eric Rise在其著作 <精益创业> 一书中提出了"精益创业"(Lean Startup)的理念,其核心思想是,开发产品时先做出一个简单的原型--最小化可行产品(Minimum Viable Product, MV

小米崔宝秋:产品的快速迭代让互联网企业根本没有试错的机会

摘要: 在小米首席架构师崔宝秋看来,产品的快速迭代让互联网企业根本没有试错的机会.要快速创新.快速推出产品并快速占领市场,最好的方法就是拥抱开源,使用开源软件为自己的硬件 在小米首席架构师崔宝秋看来,产品的快速迭代让互联网企业根本没有试错的机会.要快速创新.快速推出产品并快速占领市场,最好的方法就是拥抱开源,使用开源软件为自己的硬件产品快速构建软件平台. 小米的MIUI系统,可以认为是利用开源Android 操作系统 的成功典范.通过对系统的功能及UI进行优化.硬件适配.软件预装,MIUI系统在

Yii获取最小可用ID

编者注:本文已获原创加分,请作者继续努力! 最近使用Yii做东西.Mysql数据表使用了自增ID,这样用起来很方便,但也有一个我不希望出现的现象:假设有10条记录,1,2,3,4,5,6,7,8,9,10, 从1到9这9条记录删除了.以后再插入记录时,因为是自增ID,新的ID号就是11了,前面产生了很多空余的可用ID. 所以只能自己写代码来解决这个问题,应该算是比较笨的方法,但是我的目的达到了,处理思路如下: (1)首先对表的记录数进行判断,如果记录为0,说明是空表,则最小可用ID为1: (2)

Python3通过Luhn算法快速验证信用卡卡号的方法

  本文实例讲述了Python3通过Luhn算法快速验证信用卡卡号的方法.分享给大家供大家参考.具体分析如下: Python3通过Luhn算法快速验证信用卡卡号,python用起来就是爽,很简单的三行代码就可以验证信用卡卡号是否有效 ? 1 2 3 4 5 6 7 def luhn_check(num): ''' Number - List of reversed digits ''' digits = [int(x) for x in reversed(str(num))] check_sum

产品细节的问题:产品提供给用户的价值

文章描述:互联网产品的点与面. 做产品,经常提到产品细节的问题. 有关于产品细节的问题,产品人都会一律纠结到产品的优化上.在微博上,我们经常会因为某个产品的某个细节而去大作文章,前阵子我曾在微博上发布了一个"京东商城到货微博提醒"的小细节,给我这平静的微博带来几百转发,其中对于这个细节许多人进行了"深入"点评. 但很多普通用户转发评论的反而是京东的另一个问题:服务有点差,售后服务不行. 服务这一块在电子商务中非常重要,是作为一个网站核心体现之一,也是一个电商的健康经

从USP理论到UVP理论:产品功能营销到品牌价值营销

标签:usp理论 uvp理论 产品竞争 品牌竞争 http://www.aliyun.com/zixun/aggregation/12972.html">品牌价值 独特价值主张 曹芳华 财经 20世纪50年代初罗瑟·瑞夫斯(Rosser Reeves) 提出USP理论,要求广告活动向 消费者提供一个"独特的销售主张"( Unique Selling Proposition ),简称USP理论. USP理论包括三个方面: 一.每个广告不仅靠文字或图象,还要对消费者提出一个

正确的策略可帮助组织克服集成挑战并快速实现云价值

云交付一个通过技术实现的业务承诺.通过减少一次性费用和共享资源来降低启动成本.云计算可利用即付即用模型,该模型对目录项采用基于使用的收费.云还通过快速部署和弹性提供对 IT 资源的快速访问,这样您就可以合理利用资源,包括扩展和收缩.最后,云提出了通过标准化简化解决方案的概念,通过减少惟一解决方案的复杂性来实现. 鉴于这些原因,许多组织将云引入他们的 IT http://www.aliyun.com/zixun/aggregation/13748.html">基础架构中.然而,对于需要在不同

c#使用HttpWebRequest,HttpWebResponse快速验证代理IP是否有用

大家好,相信大家都使用过代理IP上过网,但是有的IP一两天就失效了.要一个一个的手工去试打开IE,关闭IE,多烦啊. 有了这篇文章就好了.我们可以使用HttpWebRequest,HttpWebResponse 来代理验证,谢谢大家评论指导! 呵呵,是不是很简单啊,其实这段代码改一下还可以做采集器,小偷等程序!我不说了大家自己看 public void yanzhen(string str, int port) { WebProxy proxyObject = new WebProxy(str,

Sql语句求最小可用id_数据库其它

select id from test a where not exists  (          select 1 from test where id=a.id+1  )  order by id  缺点,不从1开始计算.