最近国庆抢票大战中,网友抱怨">网上订火车票太“坑爹”。有家报纸甚至引用网友吐槽做为报道标题,“没爬不上的山,只有登不上的12306”,并且附载了“刷票”攻略。12306网站登录缓慢及崩溃,主要是短时间访问量过大造成的;自2011年该网站上线以来,去年春运期间就发生过。
并非12306网站建设没舍得花钱投资。有传言,日本人“钓鱼岛购岛”闹剧,折合人民币花费1亿多元,而12306网站建设投资了3亿多元;另一种说法比较靠谱,推测网站建设花费1.2亿元人民币。后一种推测,是获得了参与12306网站部分建设的两家上市公司披露的公开信息,仅这两家公司从该项目中获得的收入是约5000万元。
不论这些数字孰真孰假,总之让人活生生看到了一件事:海量数据处理的价值(或相应的投资)是远超过去人们的一般想象力的。
讲到海量数据处理,讲到大数据,就顺延说到互联网广告目前颠覆式创新的商业模式——人群实时竞价(RTB)广告模式。美国市场经过5年左右的发展,目前展示类广告中,有60%的数量是由RTB实现的,在相当大额度上补充了传统“广告位买卖”的投放方式。
12306是大家登陆上去买票,RTB广告的实现比这复杂得多。品友互动,作为中国最早也是最大的DSP,每天都在为广告主在广告交易平台(Adexchage)上购买目标人群,从而实现广告曝光。作为成功的DSP,有两个最重大的竞争力,一是大而准的人群数据库,二是稳定强大的基础设施架构和智能算法。今天重点谈谈后者。
截止今天,国内有三家广告交易平台(谷歌的Adx,淘宝的TANX,和腾讯自建平台)。他们对接了超过15万的网站,每天大约集合了30亿人次(30亿PV)的广告曝光机会。也就是说,广告主1分钱不花,就可以免费获得如此海量人群的选择机会。而类似品友互动这样的DSP公司,为广告主一个一个地从这些曝光机会中挑选合适的目标人群,然后进行实时竞价;一旦竞价成功,某个广告主的广告就会展示给目标人群。因此,广告主仅仅只需要为竞价成功的目标人群的曝光付费。这多少有点类似实时竞价购买关键搜索词。
我给大家分享品友互动DSP两个数据,来举例说明DSP的大数据处理能力:一个是竞价完成时间。当任何一名用户浏览某个网站时,那些按传统方法销售的广告位要展示什么物料都是固定不变的,因此,无论是谁浏览都“一成不变”地展示在那里。但是对于RTB方式出售的广告位,这时候要展示什么广告,就得“当机立断”了。这个网站把该用户的cookie、广告位信息通过广告交易平台(Adexchage)传输给品友DSP;品友DSP再做出判断是否是某个广告主的目标人群,然后再决定是否竞价以及如何出价。一旦竞价成功,某个广告物料再被广告交易平台(Adexchage)抓取,最终展示在那个RTB广告位上。你看,整个过程下来,数据在几个服务器之间跑了几千公里,全程耗时多长呢?50毫秒!
另一个是品友DSP的数据处理能力。前面,我们仅仅是以一名用户举例。可实际中,每天同时得有多少消费者在浏览网站啊,而那些成万上亿个按RTB方式售出的广告位都得在50毫秒内“当机立断”最终展示怎样的广告位。有个参数叫qps(每秒并发请求),就是描述DSP在一秒时间内可同时接收Adexchage上多少个“当机立断”的请求。截止目前,品友DSP的qps数据是12500.怎么看待这个数据呢?我再给大家两个数据做参照:一个是谷歌全球搜索的qps数据,大约是2万至4万。另一个是1000个qps大约相当于1天1亿的曝光量,那么品友DSP每天大约支持的曝光量就是12.5亿,这个数量已经超过了任何一家单独的网站。
最后再说回到12306火车售票网站。看来,除了巨额的投资,还要很多大数据的处理经验呢!