著名广告大师约翰·沃纳梅克提出:我知道我的广告费有一半浪费了,但遗憾的是,我不知道是哪一半被浪费了。这个长期困扰广告人的世界难题有望得到突破,而解决这个问题的关键就是“大数据”。过去之所以难以解决这个问题,是因为没有足够的技术手段来分析、挖掘我们">投放广告的对象的交互轨迹,而最近几年出现的云计算、NoSQL、并行计算、BI等等的大数据技术手段让我们看到了解决这一问题的些许曙光。
首先,互联网、手机、数字电视等技术都突破了原有的传统媒体先天存在的缺陷,即无法准确跟踪用户的上网行为和兴趣,广告的投放是相对盲目的,而新兴媒体最大的特点是实时、个性化和互动,这些新媒体特点让广告主在接受用户轨迹的同时,可以分析出用户的各方面属性,现在的用户数据采集已经可以做到线上和线下用户信息的匹配,只是在美国由于对用户隐私的保护,而用法律来禁止此类数据的收集和直接采用。这个数据的维度是很复杂和庞大的,譬如一般现在的广告网络都能接触到3-5亿个独立用户,记录每个用户浏览网页的记录,包括时间,所用的浏览器,操作系统,IP地址,是从哪个网页跳转过来的,每个页面的内容是那一类的,有哪些广告播放,用户是否点击了广告,甚至屏幕的分辨率等等,一般一个广告网络或者交易平台只能接触到一个用户的一部分时间片段,要把这些时间片连在一起,或者获得用户更全面的属性,就需要存储通过数据交换(Data Exchange)而获得的数据,再加上一个用户使用手机相关的数据,以及与其相关的粉丝,朋友的数据关联,就形成了一个相当庞大的数据集合,而基于云计算的数据存储可以部分解决了这个问题,所以,大数据的云计算存储是大数据在技术营销中迈出的第一步。
其次,现有的并行计算技术也获得了相当高的成就,原先的架构都是把数据集中在传统数据库中,使用大量的计算机资源来实现并行计算处理,由于数据都是在同一个数据库中,数据的存取形成了瓶颈,而新兴的MapReduce技术则把数据分布在不同的服务器上,把所要执行的代码推送到各个服务器上进行本地计算,然后汇总,这个创新的想法打破了数据存取的瓶颈,让原来垂直扩展的架构变成了水平可扩充的架构,使大量数据的准实时挖掘成为可能,所以,大规模并行计算技术的突破让技术营销中的实时报表、实时优化和个性化投放等成为可能。
再次,未来在广告投放中最赚钱的、也是最复杂的部分就是数据管理平台DMP(Data Management Platform)。有了大规模并行计算作为基础,我们可以对每个用户建立一个在线的档案,这就是DMP的核心。每个用户的维度是很多的,譬如人口信息,兴趣类别,购物需求,地域信息,甚至公众影响力都可以记录下来,当广告主说我需要投放在一线大城市的24-35岁男性,对运动感兴趣的用户时,我们需要在极短的时间内做出判断,这就是DMP的功用。这样的特殊需求使用常规的SQL数据库已无法完成,基于新兴的NoSQL数据库是唯一选择,据我的了解,知名的DMP平台提供商BlueKai对每个用户保存多达一万五千多个属性,这在传统数据库中是不可想象的。
最后,我们需要强调的是现代营销中的很多新的概念都是由大数据作为支撑的。这个可以举很多例子,譬如人群购买,精准多渠道分析,库存预测分析,Attribution model, Look-alike定向等等,这些模型和概念的背后都是大数据相关技术作为基石的。