中国最具影响、规模最大">的大数据领域盛会——2013中国大数据技术大会(Big Data Technology Conference,BDTC)于2013年12月5-6日在北京举行。本次大会云集数十家领军企业,近七十场主题演讲,不仅覆盖Hadoop生态系统与流式计算,实时计算与NoSQL、NewSQL等技术方向,还对互联网、金融、电信、交通、医疗等创新案例,大数据资源的法律法规、大数据商业利用的政策管制等进行了深入讨论。
12月6日,在2013中国大数据技术大会第二日举办了“第一届中国大数据技术创新与创业大赛”获奖团队交流分享活动。来自全国多个高校及科研机构的参赛队伍参加了活动,其中获奖的17支团队队长在现场进行了分享,并与其它团队进行了交流。
一等奖获奖团队、南京大学的HadoopEagleEye团队队长陈庆国在做分享
“第一届中国大数据技术创新与创业大赛”由中国计算机学会、中国科学院与重庆市政府联合组织,分为创新分赛和创业分赛,选手可同时参加两个分赛。创新分赛采取“命题作文”的方式,面向全体参赛者征集问题解决方案;创业分赛不预设题目。
据悉,创新分赛有五道赛题,共有660支队伍参与比赛。这五道赛题为:
关键词行业分类:本赛题意在让成千上万的行业通过机器学习相关算法,快速准确地进行分类,一扫人工标注高成本低效率的阴霾,使广告投放更加精准。百度提供了本赛题的题目和数据,此题需在百度开放研究云平台上完成。
电信网络寻呼黑洞分析:移动运营商需要通过对移动网络信令日志的分析,定位电信网络寻呼黑洞(无法正常提供服务的区域)并进行后续的网络优化,提高服务质量。移动研究院提供了本赛题的题目、数据,以及大云大数据相关工具支持。
电信用户交往圈构建和特定类型用户识别:移动运营商希望根据目标用户群某个周期内的通话、短信、接入服务位置等信息,建立目标用户群的交往圈,并在交往圈内识别出符合特定业务设计特征的营销对象。本次赛题拟针对校园基站覆盖区域内的用户通话和短信交往行为,进行校园区域内学生客户群体的识别。本赛题由移动研究院提供题目和数据。
用户购买行为的归因分析:归因分析是市场营销等行业中广泛使用的一类分析方法,参赛选手需要根据已知转化行为的用户数据,建立归因模型,计算出不同广告渠道、不同广告类型对于用户转化的贡献度。秒针提供了本赛题的题目和数据。此题需在秒针的平台上完成。
基于出租车GPS轨迹的位置服务:针对打车难的问题,本赛题以打车推荐为题,参赛选手根据北京市出租车GPS历史数据生成推荐模型,该模型可以根据用户的位置和当前时间,计算能打到车的概率及平均等待时间。数据堂提供了赛题的题目与数据。
创新分赛最初有600多个队报名,10%的队伍提交了作品,最终17个队伍获得了一二三等奖。其中,一等奖是来自南京大学的陈庆国和邹晓川的HadoopEagleEye团队。
在“第一届中国大数据技术创新与创业大赛”交流分享活动上,各个获奖团队在现场就自己的创意、技术及算法等方面的内容进行了分享。