菜鸟—需求预测与分仓规划冠军——“商品小A”团队赛后总结

在菜鸟—需求预测与分仓规划比赛上,“商品小A”团队获得了冠军。队长袁光浩分享了“商品小A”团队的数据探索以及算法实现过程。

零售数据分析的职责是根据客户的数据做客户的数据分析报告,客户可以基于报告得到的结论对商业决定做修正。

赛题背后的商业需求

按照官方的说法,对未来商品需求进行准确的预测,可以帮助商家自动化很多供应链过程中的决策。这些以数据驱动的供应链能够帮助商家大幅降低运营成本,提升用户的体验,对整个行业的效益提升起到一定作用。此时,大家可能有一个疑问,销售的带链呢?货品如果是很少的,意味着商家失去了销售的机会,这其实是一种隐性的损失。

数据探索

比赛提供的数据中,最引人注目的是,在20万商品里面最后出现的日期中最早的那一个,即2015年12月21日,这意味着这个商品在整个数据集里面是有效的,我们需要预测其在2016年年初的销量。根据销售时间和总量的分析,删除促销热的数据之后,发现其是递增的。这些数据为方案的决策起到了一定的作用。

其中,有一个商品A,经过2015年春节之后它就不再销售了,经过在同一个供应商找与A商品类似的商品,但是并没有找到,这在实际的应用中比较罕见。但是为什么出现这样的情况呢?这说明了数据脱敏做的非常好,商家将数据隐藏起来保障其权益,其他人难以通过数据追踪商家运营模式。最初的思路是按照我们的工作习惯,去寻找其主流商品,找到其搭配的商品,但是这种方法是基本做不到的。

另外一种情况,有一些商品的生命周期比较长,在2014年的年末和2015年的年末走势是比较相近的,我们可以利用这个特征来预测其下一年的销售情况。

数据分析预测

通过上述的数据探索,我们大致可以了解数据的构成。大部分商品是从2015年开始销售的,在2014年并没有留下太多对我们有用的信息。对于大量的数据,我们怎么挖掘信息?首先,可以通过时间序列来探测,但是可能损失一些重要的特征,比如相同种类的商品(同一商品,或者不同商家的)竞争关系就会丢失掉。

更优的做法是采用机器学习的方法。具体的做法是通过近期的销量情况,去研究此后两周销量总量的影响情况。我们需要建立预测模型,利用回归分析方法进行预测。我们需要专门针对数据集做一个分类,因为对于主力商品,商品的规划会特别关注商品的销售曲线,这些都人为可以控制的(通过价格等因素)。所以对于找出规律的这些商品,需要单独拿出来,因为剩下的大部分数据中还会有很多的噪声,如果一起训练的话会影响这部分商品的预测。对两部分商品分别做回归预测过程中,对双十一这种特殊的销售情形需要做一定的过滤。

特征曲线确定好之后,开始做数据深层的准备。在这个阶段同时进行的还有数据的处理,比如把缺失的数据用非聚划算销量算法补齐,过滤算法也是在这个阶段完成的。为什么要过滤掉具有波峰的数据?因为经过双十一之后,商家在一月初二月初做促销的可能性就会降低,虽然这不一定正确,但是在缺乏商家有效信息的情况下,选择一个保险的策略是正确的。

可以利用滑动窗口的方法创建训练集和验证集。创建验证集可以让我们有快速的方法验证我们的思路。我们把最后14天的非计划的数量值作为目标值,把之前14天的各种数据计算出来作为特征值,向前滑动14天。以此类推,做10个窗口。并且,还需要对任务空间产生的数据集做一次处理。首先对训练集进行训练,得到模型之后对验证集做一次预测。然后把预测不准的窗口从训练集删除,重新将其和验证集合并,对线上的测试指标做真正的预测。

最终采用的模型是线性回归和xgboost模型。分别建模、运算,然后对运行的结果做一个合并,根据验证集改变模型的权重。把分仓和母仓分别建模,因为有些商户做活动的时候是全国所有的仓库一起升一起降,有些商户是依次出现的,有些则是没有规律的,因此分别建模会比较好。

总结

如果有更丰富的数据,比如商家的计划、库存,那么我们可以做更好的预测。如果对业务越了解,建立的模型就越接近真实情况。并且,组合不同的算法往往是更有效的。

时间: 2024-09-24 05:08:44

菜鸟—需求预测与分仓规划冠军——“商品小A”团队赛后总结的相关文章

菜鸟—需求预测与分仓规划亚军——“天亮”团队赛后总结

在菜鸟-需求预测与分仓规划比赛上,"天亮"团队获得了亚军."天亮"团队主要分享了团队的特征分析以及方案实现过程. 背景介绍 此次比赛希望选手利用大数据技术预测商品的未来需求来优化整个菜鸟物流的供应链.比赛给出的数据包括商品的销量.价格品牌等信息,预测后两个星期的销量. 特征分析 通过观察一件商品的时序图,我们可以发现一件商品有上架时间,在双十一.双十二会有销量的突增,这些突增在时序的最后端,会对接下来两周的预测产生干扰.此次,训练样本采用滑窗法,主要有13个窗口,每

菜鸟—需求预测与分仓规划季军——“我们为R代言”团队赛后总结

在菜鸟-需求预测与分仓规划比赛上,"我们为R代言"团队获得了季军.在分享中,"我们为R代言"团队主要对赛题进行了分析,提出了选择机器学习的理由,介绍了团队线下解决方案实现过程. 赛题分析 赛题主要是根据过去一年的销量来预测未来14天的销售情况.这个赛题相对于其他问题有比较明显的特点:赛题提供的数据量非常多,除了销量之外还有其他很多数据,怎么使用这么多的数据来提高精度?成本是一个非线性的数据,补多补少是不一样的两种情况,怎么根据成本来进行优化?全国仓和区域仓的问题,理

菜鸟超级进口大仓618首度亮相!跨境商品也能当日次日达

6月12日下午3点40分,来自南京的一名用户收到了由宁波保税仓发出.圆通速递配送的雀巢咖啡,这距离他在天猫国际上下单仅过去4小时. 天猫618在昨日迎来进口日,进口销量火爆上升.作为国内最为先进的跨境进口仓,菜鸟超级大仓在本次大促中首度登场亮相,并联合EMS等合作伙伴首次在中国提供跨境生鲜食品等高端物流服务.部分消费者在当日或次日便能收到大促购买的商品,南京的这位用户就是其中之一. 菜鸟超级大仓位于宁波慈溪,是全国第一个专业服务于跨境进口商品的超级仓库园区.本次进口日的大量商品都将从此发货. 消

恒安电商明年三步走战略:减品分仓拓渠道

[http://www.aliyun.com/zixun/aggregation/32866.html">亿邦动力网讯] 12月26日,恒安电子商务总经理杨斌对亿邦动力网透露,2013年,电子商务被恒安集团定为战略发展目标之一,销售目标为1亿元,并通过严格控制SKU数量.建立分仓和开拓新渠道三方面入手. 亿邦动力网了解到,恒安于今年6月份正式开展线上业务,由独立的电子商务部门运营.目前恒安在天猫上拥有两家店铺,其中恒安天猫旗舰店"恒安生活馆"经营母婴.个人护理.家居生活

星晨急便:分仓发货的践行者

作者: 姜蓉 3月29日,陈平神采奕奕地出现在阿里集团战略投资北京星晨速递有限公司(简称星晨急便)北京新闻发布会上. 星晨急便在快递行业只是个小字辈企业,但是公司董事长陈平却算得上这个行业的元老级风云人物.离开一手创办的宅急送后,陈平二次创业,仅一年时间就收到马云伸过来的橄榄枝,获得阿里集团的战略投资.虽然发布会上合作双方对投资金额及所占的股份讳莫如深,但在民营快递企业普遍寻找买家的大背景下,陈平无疑是幸运的. 业内认为,在快递业摸爬滚打多年的陈平,此次创业,利用星晨急便这个品牌专门针对电子商务

冲规模输业绩华泰柏瑞基金大量分仓还旧债

烟花散尽.去年,华泰柏瑞成为基金业内最瞩目的公司,凭借2012年5月成立的华泰柏瑞沪深300ETF,公司管理总规模从一季度末的125.72亿元,一跃升至二季度末的367.19亿元,华泰柏瑞的整体行业排名也随之从第40名升至第23名.但在荣耀的背后,是对等的代价."在发行沪深300ETF的时候,为了拉冲量资金,公司会承诺券商一些交易量."业内人士告诉记者,尤其是在资金紧张的时候,往往会承诺大量的交易分仓."一般而言,基金公司的交易分仓由市场部和投研分别掌控一定的比例,前者主要用

[★ 急 100 分 ] asp.net 购物车 商品列表页面 和 付账页面的 关系 ?

问题描述 如图:点击商品列表后面的购买,进入到付账页面,付账页面显示1条商品信息,此时你可以结账,也可以继续购物,点击返回继续购物,再次选择商品购买时,进入付账页面,就会有2条商品信息.依次列推.?2个页面之间,我该如何保存数据.????思路?或代码?我看过petshop4.0但是里面的profile不是很懂,代码也是用工具生成的. 解决方案 解决方案二:刷新那表格的数据不可以????/解决方案三:你的意思是,我点击订阅之后,保存到数据库,在另外一个页面重新加载...好像不是这样做的.解决方案四

【菜鸟】网页分栏的问题,请大家帮帮忙告诉我

问题描述 我想把网页分成几个部分:上面是一个总的横栏,横栏下面分左.中.右三栏,且(这个很重要)左.右栏的宽度固定,中栏随窗口的大小变化,我是个新手,想问问各位大侠该怎么做?我设置网页width百分比也不行,因为左.右栏是固定的,中栏需要变化,然后用<frame>也不会上面一个总栏,下面左中右再分栏,请大家帮帮忙,感谢了!! 解决方案 解决方案二:试一下,让上面的栏宽度为100%左右2栏设置好固定高度然后让中间的栏设置一个min-width:解决方案三:好心人能不能给我代码啊?我的代码不熟,帮

菜鸟做淘宝客1月半小有收获经验谈

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 在淘宝客这个行业里,我还是一个很菜很菜的菜鸟.看一下淘宝客龙虎榜就知道自己到底有多菜.接触淘宝客是在去年的5月份,但是真正做起淘宝客还是在一个半月前.去年在网络上寻找网专知识和网赚的时候,发现淘宝客很赚钱,而且很多人都赚到了钱,于是自己也想尝试着去做.当时自己什么都不会,更不用说是建设一个独立域名的网站,甚至不知道去哪里购买域名和空间,怎么搞