从数据小白到大赛黑马,他们如是说 | 专访2017中国高校SAS数据分析大赛亚军团队

近日,2017年中国高校SAS数据分析大赛在北京举办了颁奖仪式,来自清华大学大数据能力提升项目的三位学生(王存光、姚超、李继凡)组队参赛,并一举斩获了亚军殊荣。这项以“高校数据分析人才”为核心的赛事至今已举办至第五届,今年是清华大学第一次派出代表队参加比赛。通常的参赛队伍多来自于金融与统计专业,然而此次获得亚军殊荣的三位学生王存光、姚超、李继凡分别来自于清华大学水利系、精密仪器系和生物医学工程系。

首次参赛“零经验”、交叉学科“罕见背景”、超过1000支的竞争队伍,这对他们来说,无疑是不小的挑战。如何在高手频出的大赛中崭露头角?清华大学大数据能力提升项目又给予了他们怎样的帮助?让我们一起听听,他们怎么讲。

赶Deadline的那些日子

时间比较紧张,从我们决定要参加比赛直到初赛,也就大概10天,所以准备比赛的过程,基本上就是在赶Deadline的过程。备赛时间集中在国庆放假,我们都牺牲了宝贵的假期,疯狂备战。”说到比赛前的准备过程,来自精密仪器系的姚超娓娓而谈,好像一切才过去不久。 

“另一种压力来自于准备过程中的不确定性,就是我们也不知道这样做是对还是错,是否能够继续下去,所以心里有点没谱。不过幸运的是,数据研究院的老师在鼓励和支持我们,还给了我们很多实际的帮助。这次是我们第一次,也是清华第一次参加中国高校SAS数据分析大赛,所以对于比赛信息我们了解得很少,也没有接触过SAS系统进行数据分析,最初不知道该从何下手。后来我们找到了数据研究院的罗老师,她给我们分享了很多《数据分析与优化建模》的往期课件。这些课件系统地介绍了如何使用SAS软件做数据分析,帮助我们在几天之内上了手。”生物医学工程系的李继凡补充说。 

对于姚超、王存光和李继凡三位学生来说,这次比赛所遇到的困难不小——备赛时间短、首次参赛零经验、陌生的数据分析系统。虽初战告捷,他们所遇到的挑战却不止如此。 

“黑马”跨界

在高手如云的中国高校SAS数据分析大赛中,参赛选手们大多来自于金融或统计专业,而王存光、姚超和李继凡三位同学却都是工科背景,甚至来自不同的专业。 

 “我们水利系所用到的数据分析并不复杂,像比赛中这种大型的数据分析在我们专业很少会用到。”清华大学水利系博士二年级在读生王存光说道,“这是我们第一次用SAS这个数据分析工具,所以技术上肯定没有信息学院或者其他相关专业的学生那么熟练,但是因为我们有不同的学科背景,所以每个队员可以根据自己的优势承担相应的工作,充分利用各自学科所带来上‘长板’。” 

“初赛题目是与银行信贷相关,因此生物医学工程系的继凡主要负责了变量分类和背景分析的工作,而精密仪器系的姚超主要是将数据中627个特征逐一分析,找出核心变量,而我主要负责了模型搭建的工作。这个过程其实很考验我们的沟通协作能力,每一个环节都很关键。”王存光说。这种跨学科的学习方式,正是清华大学数据科学研究院有别传统的新型教学理念。“和不同专业的人在一起做项目会发现很多创新点,”来自生物医学工程系的李继凡说。在《大数据实践课》上,信息类和非信息类的学生跨学科组队,以团队的形式做项目,使不同背景的学生能够在组内充分交流,相互学习,各自发挥特长。 “平时的这种锻炼对于比赛中所需要的沟通协作能力以及团队凝聚力也有很大的帮助。”李继凡接着说道。 

“未来”已来 

在今天的IT领域,越来越多的问题可以用数据驱动方法来解决。它是大数据的基础,更重要的是,它带来了一种新的思维方式。 

“不能跟信息学院的学生拼技术,还是得拼思维方式和实现能力。冠军队在决赛的时候其实就坐在我们后面,相比之下,他们确实更从容,我们因为对技术不够熟练所以略显匆忙,”姚超说,“技术方面我们工科背景的学生肯定是没有优势的,但是好在我们会及时发现问题并解决问题,动手能力比较强。而且我们可以与专业知识结合在一起做项目,数据只是一种手段,思维方式是关键。” 

“就是数据院常说的π型人才嘛。” 李继凡接过了话头。李继凡所说的π型人才正是清华大学数据研究院重点着力的人才培养方向,通过大数据思维与技能、跨界学习能力、实操应用相结合的课程体系,帮助清华学子们将大数据思维与应用创新有机结合,为大家日后的发展提前打好基础。 

“总之,比赛一定程度上还是可以检验并提升自己的,希望在下次的比赛中,我们能够有更好的发挥。” 李继凡继续说道。

创新需要勇气,提升离不开实践。大数据思维、跨界学习、应用实操相结合的培养与锻炼,成为了王存光、姚超、李继凡三位同学在此次比赛中的“力量之源”。清华大学首次派队角逐中国高校SAS数据分析大赛便满载而归,同学们在此次比赛中所展现的能力,是他们自我努力的体现,也是数据科学研究院先进教学理念的展示。希望今后数据院能够帮助更多的清华学子,在数据科学领域绽放异彩,找到属于自己的人生舞台。

原文发布时间为:2017-12-4

时间: 2024-09-20 15:39:39

从数据小白到大赛黑马,他们如是说 | 专访2017中国高校SAS数据分析大赛亚军团队的相关文章

2013中国高校SAS数据分析大赛完美落幕

文章讲的是2013中国高校SAS数据分析大赛完美落幕,2013年11月11日消息,由商业分析软件与服务供应商SAS公司发起的"2013年中国高校SAS数据分析大赛"完美落幕,颁奖典礼在北京隆重举行.经过激烈角逐,上海财经大学统计与管理学院.北京大学数学科学学院.复旦大学管理学院代表队脱颖而出,分别囊括团体冠亚季军.SAS中国客户关怀总监谢鹏程与中国科学软件网总经理靳新共同为获奖队伍颁奖,鼓励他们未来投身数据分析行业,成为大数据时代的高精尖人才. SAS公司大中华区总裁吴辅世先生表示:&

2014中国高校SAS数据分析大赛拉开帷幕

ZDNet至顶网软件频道消息:由商业分析软件与服务供应商SAS公司主办的"2014年中国高校SAS数据分析大赛"于近日启动.大赛面向全国高校在校本科生与研究生,旨在通过考查学生SAS软件应用水平,发掘数据分析人才,为企业输送新生力量.  本次大赛由SAS公司主办,中国科学软件网承办,并得到中国人民大学统计学院.上海财经大学统计与管理学院.华南理工大学数学学院.厦门大学经济学院--王亚南经济研究院.东北财经大学统计学院.华南师范大学数学科学学院等协办单位的大力支持.初赛将于2014年10

“十月围城”中国高校SAS数据分析大赛将再燃战火

ZDNet至顶网软件频道消息: SAS公司正式宣布启动"汇丰杯"--2015年中国高校SAS数据分析大赛.大赛面向全国高校数据分析相关专业的在校本科生与研究生,是非盈利性的公益大赛,旨在促进中国高校对SAS软件的认识.应用和普及,提高学生SAS软件的应用水平,促使中国高校的数据分析水准与国际接轨. 本次大赛由SAS中国主办,SAS中国教育行业优先合作伙伴中国科学软件网(www.sciencesoftware.com.cn)承办,并获得汇丰银行(HSBC)的冠名赞助.数学中国论坛(www

第二届百度高校搜索营销大赛报名开启 拟挖掘数百位互联网营销人才

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 为提升学生对搜索营销的综合运用能力,打造校园营销明星,8月22日,第二届百度高校搜索营销大赛个人赛报名系统启动,选手可通过搜索"百度营销大学"进入官网报名参加. 据悉,通过首届大赛的成功举办,本届百度高校搜索营销大赛将继续深入对接院校实践教学需求,帮助参赛学生进行搜索营销实践,进而让大学生们的自身技能与企业实际需求匹配,帮

2016中国高校计算机大赛——大数据挑战赛季军:Heal the World团队

2016中国高校计算机大赛大数据挑战赛上,Heal the World团队对阿里音乐流行趋势预测展示了自己的比赛成果.主要从问题分析开始谈起,确定解题思路,重点分享了分类与预测,进行了五步分离,最后做了简要总结.擦亮眼睛快看看吧.   问题分析 此次比赛给出了1000位艺人在2015年3月1日至2015年8月30日之间的所有歌曲数据以及相关用户的行为.要求预测9.10月份的艺人所有歌曲的播放量. 但是我们发现,预测的数值在一个比较短的时间以后都是一个常数.这启发我们直接利用一个常数作为预测.我们

2016中国高校计算机大赛——大数据挑战赛亚军:陕西师范大学团队

2016中国高校计算机大赛大数据挑战赛上,陕西师范大学网路信息中心团队对阿里音乐流行趋势预测进行了自己的成果展示.首先从解题思路开始谈起,重点对算法进行了阐述,包括类别最优值选择法和子序列模式匹配法,最后对比赛中遇到的问题进行了总结.一起来了解下.   总体思路 陕西师范大学的同学们采用了标准时间序列的分解思想,将日播放量分解为长期趋势.中期与随机干扰三项,但在最终的算法当中,只对长期趋势进行了预测,我们的算法分为数据预处理.编码.分类.预测方法选择和附加处理五个环节,整体来讲是以歌手为单位,对

数据小白的打怪升级之路

今天讲讲数据小白的打怪升级之路. 做数据分析的职业发展前景是怎么样的? 在不同行业会有不同的答案,甚至同一行业不同公司也会区别很大. 如果是在(半)传统行业,比如说信用卡.银行,那么对大多数公司来说,职业发展最重要的一点就是升职快,其次是做的东西重要. 以我的前雇主,北美客户满意度最高(JD Power 的调查结果)的 Discover Financial Services 为例,级别从低到高有 Associate, Sr. Associate, Project Manager, Manager

2016中国高校计算机大赛——大数据挑战赛极客奖:COM团队

摘要:2016中国高校计算机大赛--大数据挑战赛是由教育部和全国高等学校计算机教育研究会联合主办,清华大学和阿里云联合承办,在"天池大数据众智平台"上开展的高端算法竞赛.本次赛题是对于阿里音乐流行趋势进行预测,本文整理自大赛极客奖COM团队的答辩演讲. 本文整理自获得本次2016中国高校计算机大赛阿里音乐流行趋势预测比赛中COM团队答辩视频.在游戏世界中其实流行这样的一句话就是:不怕神一样的对手,就怕猪一样的队友.团队对于最后获得的成绩是十分关键的,COM团队由三名成员组成的,下图为C

2016中国高校计算机大赛——大数据挑战赛极客奖:data_coders团队

2016中国高校计算机大赛大数据挑战赛上,data_coders团队对阿里音乐流行趋势预测进行了自己的阐述理解.首先对赛题进行了分析,确定解题思路,重点对算法进行了说明,包括类别分析.特征提取和算法模型,最后做了简要的总结.一起来欣赏下.   问题分析 已知20150301-20150830的用户行为和歌手歌曲历史记录,预测9月1日至10月30日1000位歌手每天的歌曲点播量? 对用户来说,用户涉及到的歌手进行点播量预测累加,但是单个用户点播行为随机性大,误差积累,模型复杂,直接Pass掉:对歌