电商行业主要的模型和算法盘点

=08年毕业,不知不觉的混进了电子商务行业,又不知不觉的做了三年数据分析,恰好又赶上了互联网电子商务行业发展最快的几年,也算是不错吧,毕竟感觉前途还是很光明的。三年来,可以说跟很多同事学到了不少东西,需要感谢的人很多,他们无私的教给了我很多东西。

就数据分析职业来说,个人感觉这对互联网公司来说是非常重要的,也是确实能够带来实际效果的东西。比如说利用数据分析做会员的细分以进行精准化营销;利用数据分析来发现现有的不足,以作改进,让顾客有更好的购物体验;利用CRM系统来管理会员的生命周期,提高会员的忠诚度,避免会员流失;利用会员的购买数据,挖掘会员的潜在需求,提供销售,扩大影响力等等。

最开始进公司的时候是在运营部,主要是负责运营报表的数据,当时的系统还很差,提取数据很困难,做报表也很难,都是东拼西凑一些数据,然后做成PPT,记得当时主要的数据就是销售额、订单量、毛利额、客单价、每单价、库存等一些特别基础的数据,然后用这些数据作出一些图表来。在这个阶段基本上就是做一些数据的提取工作,Excel的技巧倒是学到了不少,算是数据分析入门了吧。

后来公司上了数据仓库,里面就有了大量的原始数据,提取数据非常方便了,而且维度也多,可以按照自己的想法随意的组合分析,那个阶段主要就是针对会员购物行为的分析,开始接触数据建模,算法等一些比较难的东西,也是学到东西最多的时候。记得当时做了很多分析报告,每周还要给总裁办汇报这些报告,下面详细说一下当时使用的一些主要的模型及算法:

1、 RFM模型

模型定义:在众多的客户关系管理的分析模式中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。在RFM模式中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。利用RFM分析,我们可以做以下几件事情:

⑴ 建立会员金字塔,区分各个级别的会员,如高级会员、中级会员、低级会员,然后针对不同级别的会员施行不同的营销策略,制定不同的营销活动

⑵ 发现流失及休眠会员,通过对流失及休眠会员的及时发现,采取营销活动,激活这些会员。

⑶ 在短信、EDM促销中,可以利用模型,选取最优会员。

⑷ 维系老客户,提高会员的忠诚度。

使用方法:可以给三个变量不同的权重或按一定的规则进行分组,然后组合使用,即可分出很多不同级别的会员。

2、 关联分析

关联分析最原始的案例来自于沃尔玛的“啤酒与尿布”。通俗意义上讲,就是只买了A商品的人,又有很多人买了B商品,那么我们就可以认为A、B两个商品的关联性比较高。很多数据挖掘工具都有关联挖掘,主要使用的算法是Apriori算法,在计算的过程中会主要考察项集、置信度、相关性这三个结果数据,以最终确定商品之间的相关性。除了Apriori算法外,还有许多其他的关联分析的算法,基本上也都是从Apriori发展而来,比如FPgrowth。本人从几年的数据分析经验感觉,关联分析在零售业中并不太实用,挖掘出来的关联度比较高的商品一般都是同类商品或者同品牌的商品,像“啤酒与尿布”这种,很少能够有。

使用方法:组套销售或者相关陈列等。

3、 聚类分析

零售行业的聚类分析主要是指将具有相似购物行为的顾客进行群体的细分,以支持精细化的营销活动,带来更大的营销效果,节省成本。Spss里面的聚类分析主要有两种K-means聚类和系统聚类。也可以在数据仓库中根据顾客购买的商品属性进行会员的聚类分析,这里就不需要算法的支持,只需要根据系统的已经有的商品分类,把购买过相同商品类别的顾客划分到一起。这种方法可能与公司的业务更加贴近。聚类分析是进行会员精细化管理,精细化营销的基础,做好聚类分析,对企业将有很大的益处。

4、“之”字分析法

该种方法主要是有一种很明确的会员群体,然后通过分析这些会员群体的购买行为,提取这些购物行为的相似点,然后再通过这些相似点返回到整个数据里面,从中抽取更大的会员群体,以制定精准的营销。

再后来,公司又上了SAP,又去BW组去做报表开发,做报表开发这一块能够接触到更多的业务方面的知识,虽然做数据挖掘比较少了,但是数据最终是要指导业务的,所以这对我的成长也算是非常有利的。业务方面主要了解到了几大块:

1、库存管理-库存管理这块主要有正品库存的管理,滞销库存,高库存商品等各种不同类型的库存该怎么定义以及该如何去管理。比如去管理供应商的库存的时候会根据正品库存及滞销库存和库存正常的周转天数来计算该供应商的库存是否在合理的水平,是否该进货还是要减少库存。

2、促销管理-促销管理是以提高销售额为目的,吸引、刺激消费者消费的一系列计划、组织、领导、控制和协调管理的工作。数据方面来说主要是针对不同的促销方式来计算不同的方式收益情况,不同的促销方式可以带来不同的效果,因此在使用促销的时候要审慎的选择,以达到理想的效果。

另外,还有财务报表、采购流程等很多方面的东西,这些接触的比较少就不写啦。

在BW项目组的时候,也经常会帮网站做一些分析工作,自己也自学了两本关于网站数据分析方面的书,感觉学到了一些皮毛,下面说一下吧:

1、 网站流量分析

网站流量的比较重要的KPI指标有浏览量、访问量、独立访客数、跳失率、转化率、页面停留时间、访问页面数、流量来源、流量来源ROI等等。通过这些数据可以全面的反映网站的整体情况。其中跳失率可以用来衡量页面的质量,流量来源及转化率可以衡量市场及营销的工作情况。进行网站数据分析的时候,需要牢牢的把握转化率这一指标,然后由这一指标的变化来寻找其他相关数据的变化,最终找出原因,做相对应的策略,改进我们的工作。

2、 网站分析细分

数据分析行业有句话-无细分,毋宁死,足矣看出细分对数据分析意义。对于网站的数据分析尤其是如此。网站的流量数据量非常大,从整体上看根本都看不出那里会出现问题,所以必须要细分。比如说营销人员需要看的转化率,必须就要细分到每个渠道里面,然后再看到这些渠道来的会员的点击情况,他们都看过那些网页,对什么感兴趣,跳失率是多少,浏览时间多长,最终转化的是多少等等,这样才能看出问题。

3、 网站的短信促销及EDM

在这个电子商务普遍烧钱的时代,花出去的钱到底能有多少能够带来实际的收益呢?在抢占市场的同时,怎么才能做到ROI最大化这个问题急需要解决。公司每天几乎都要发几万条甚至几十万条的促销的短信,短信的反馈率基本上都在2%一下,怎么才能提高转化率,这就需要更精准的用户定位,把钱花到最有可能带来收益的地方。因此网站的短息促销及EDM促销,必须要依据会员的精细化细分,不但要满足客户的需求,更要挖掘出他们的需求。

写到这里基本上写的差不多,通过总结才发觉自己原来很是知道的很少,还有很多需要学习的地方,比如说数学建模方面的知识不够,统计学软件使用不够好,业务了解的不够深入,对整个电子商务行业的发展把握不清晰,这些都是需要以后加强的地方。最近在一个数据分析师的前辈的博客上看到他对数据分析师的要求只有一点,就是要热爱数据。感觉自己还不够,平时工作的时候还不够投入,总觉得是在为公司工作,不是在为自己的兴趣工作,其实一个人每天做的事,一定要都当做是为自己做才行,就算真的不是为自己做,也要从中学到一些东西来变成自己的东西,为自己服务。

时间: 2024-09-01 15:32:57

电商行业主要的模型和算法盘点的相关文章

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

半监督组稀疏表示:模型、算法与应用(ECAI 2016论文精选)| AI科技评论

ECAI 2016是欧洲展示AI科学成果的最佳场所,大会为研究人员提供了很好的机会,去介绍和听取当代最优秀的人工智能研究成果. 半监督组稀疏表示:模型.算法与应用(Semi-Supervised Group Sparse Representation:Model, Algorithm and Applications)   摘要:组稀疏表示(GSR)利用了数据中的组结构,并在许多问题上效果很好. 然而,该组结构必须事先手动给出.在许多实际情况下,如分类,样本都是根据他们的标签进行分组的.在这种情

线上渠道成竞争关键 音频产品电商行为分析

第1页线上渠道成竞争关键 音频产品电商行为分析 [天极网音频频道] 究竟是用户习惯改变了市场行为,还是市场变革导致了新的用户思维,这是个说不清的问题,总之,时至今日,在数码产品市场,我们经历了太多变革.随着智能终端设备的兴起,用户对周边附件产品的需求上升到新的高度,而随着电商网站的兴起,我们在购买这些产品时也有了全新的方式. 多元化的购买方式为用户打开方便之门,原本在实体卖场跑断腿的货比三家变成了在互联网上频繁的鼠标点击.不过对厂商来说,多种销售渠道如何合理的结合,如何避免不同渠道的产品冲突和利

《深度学习导论及案例分析》一1.3深度学习的模型和算法

1.3深度学习的模型和算法 深度学习亦称深度机器学习.深度结构学习.分层学习,是一类有效训练深层神经网络(Deep Neural Network,DNN)的机器学习算法,可以用于对数据进行高层抽象建模.广义上说,深层神经网络是一种具有多个处理层的复杂结构,其中包含多重非线性变换.如果深度足够,那么多层感知器无疑是深层网络,前馈神经网络也是深层网络.基本的深层网络模型可以分为两大类:生成模型和判别模型.生成是指从隐含层到输入数据的重构过程,而判别是指从输入数据到隐含层的归约过程.复杂的深层结构可能

华南地区在电商行业内的重要性

在短短的半个月内,当当网总裁李国庆.易讯网CEO卜广齐分别造访广东,一方面是体现了华南地区在电商行业内的重要性,另一方面也是对广东省府提出的"广货网上行"的实际支持.南方日报记者从几大电商中了解到,针对"广货网上行"的号召,电商们在大力推动广货在网上销售方面的同时,也将更大的力度投入到本地化服务当中去. 争夺华南地区的主动权,电商们不约而同地选择了在本地化服务方面展开PK,据易迅网CEO卜广齐介绍,易迅网一个订单的完成分拨后配送至各地的分站点大概是1个半小时,随后快

电商陷入“资本高烧”的恶性循环,已是电商行业内不得不说的尴尬

一度以来,电商陷入"资本高烧"的恶性循环.从线下到线上,从邀请明星做形象代言到应用社交媒体,电子商务企业在以各种方式赚取消费者的眼球.营销投入的不断攀升,不但未能同步带来效果的提升,却成为压垮电商的沉重负担.这种ROI(投入产出比)的难题,已是电商行业内不得不说的尴尬. 管中窥豹,电商在电子邮件营销领域的运行逻辑,有助于进一步认清其ROI的困局之谜.这种被电商亲睐的低投入.高产出的标配营销方式,在电商行业"被疯投"的野蛮生长时代,其主流模式沦为了促销.群发.一味向用

【干货】机器学习常用 35 大算法盘点(附思维导图)

在本文中,我将提供两种分类机器学习算法的方法.一是根据学习方式分类,二是根据类似的形式或功能分类.这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式或功能分类.在阅读完本文以后,你将会对监督学习中最受欢迎的机器学习算法,以及它们彼此之间的关系有一个比较深刻的了解. 事先说明一点,我没有涵盖机器学习特殊子领域的算法,比如计算智能(进化算法等).计算机视觉(CV).自然语言处理(NLP).推荐系统.强化学习和图模型. 下面是一张算法思维导图,点击放大查看.   从学习方式分类 算法对一个

从电商圈比赛排名看百度算法两个漏洞

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 电商圈SEO大赛现在已经是最后一个月了,参赛网站从前两个月的资源积累,最后一个月就是拼资源的时刻.虎子谈一下最近大家对大赛关注的焦点无非就是黑马kkk103电商圈的排名和对购买高质量的门户外链争议,虎子先撇开此优化手法的偏见,谈百度算法的中两个明显漏洞. 第一个漏洞:通过刷相关搜索和下拉框快速提升排名 先谈kkk103.com这个网站排名从5

再说电商网站转化率:变现的算法

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 很有趣,过年时候写的文章<说说转化率>,三个月后被几个地方转载了,当时我还觉得自己的科普很没意义似的. 就着最近经常被各种记者和同行问到的"蘑菇街的变现转化"的问题,整理一下,就用上一篇的方式,再跟大家分享一下好了. 我们上次说了,像我们蘑菇街这种解决用户"买什么"的问题,并为电商引导成交的