主讲嘉宾:高步云
承办:中关村大数据产业联盟
高步云,北京师范大学教育技术博士,研究方向:学习分析学(大数据在教育领域的具体应用)。高博士是原华为公司海外高级项目经理,现任和君资本总裁助理、高级投资经理。长期关注教育+科技+资本的发展模式,投资领域专注教育科技和互联网教育,也是本周分享的主持人。
以下为分享实景全文:
今天和大家分享的主题是教育领域的大数据应用。在正式开始之前,想先和大家分享几个观点或者说事实。按照年龄的划分规则,我们一般把0-6作为一个阶段,小学到高中作为一个时段,成为K12,高中毕业之后作为一个时段。
按照时间是一种划分,按照商业模式可以划分的更细。但是最重要的划分,按照中国特色,其实是体制内和体制外的划分,也就是我们常说的教育行业vs培训行业。
其实这是两个不同的领域。在不同的领域里,数据运用的基础、现状和未来发展方向,都不尽相同,后面会展开说。
除了补充一下领域划分的背景,还需要探讨一下“场景”和“流程”这两个最基础的问题。
流程其实很简单,就像把大象装进冰箱一样,分三步:
1.数据的获取(含数据整理和存储)
2.数据的分析
3.数据的呈现
每个步骤,在不同的场景下,都是不一样的。所以,这个事情挺复杂的,我试图尽量梳理清楚,但是有可能还是会显得零碎,等我讨论完一个章节之后,会给大家留交流的时间,到时候咱们再统一回答问题。
如果我们把场景设定在 1、公办 , 2、k12这个领域,那么可以说没啥大数据可言,甚至连基础数据都成问题。
因为,在这个场景中,很少产生数据。
我一开始准备分享的时候,做了一份提纲。
1.教育领域的原有数据模式简析
国家教育统计年鉴
各地市州的教育局
各个高校数据
国家教育研究机构的数据
2.对“官办教育体系”原有数据体系的一些点评
活性差:时间,
粒度粗
没人用
体系不通,数据孤岛严重
这个提纲贴出来大家基本上就已经知道意思了。
原有的官办数据并不是“学习”数据,而是“教学”管理数据。
在这个领域的数据,即无法保持 “在线”,又缺少“活性”,最后,除了给领导做报告,教育部里做“规划”之外,很少有其他直接提升教学本身应用的有效数据。
如果从这个角度来说,整个中国教育领域,其实是远没有IT化的,也就更谈不到互联网化。信息孤岛严重,各部门数据割裂严重。当然,现在也有一些有益的尝试,我举几个例子:
首先是大家看到中小学生学籍卡管理系统,这就是很大的一个工程。
最早是上海在推,然后是北京推的,后来全国其他各大城市陆续上马。这个学籍卡基本上解决了中小学生转校时,成绩、学籍管理的问题。大家小时候每学期都要拿个小红本,让老师写评语吧。现在很多地方,这个已经电子化了,就算你转学走了,你的考试成绩和评语会被带着走。这对教育领域来说是个很大的进步。尽管在其它行业看起来这没啥难度。
这个小例子,就当做课前秀吧。基本上说明了现在教育领域的数据应用现状。我们最大一个数量的学习者,都被困在数字禁区,有些初高中为了保证成绩,是禁止孩子们用手机等电子设备的。
在这个领域想做出成果,首先还是要体制发生改变。当然,在体制不变的情况下,也有了不少有益的尝试。首先是刚才说的教育管理数据,这部分数据是由上层主管机构在推动的。
再说说和学生学习相关的数据。
从刚才说的三点:获取、分析、呈现,这三个角度来说。
获取的手段现在有所突破,主要的技术是各种传感器整合,有点像物联网,做成系统集成方案就叫 “智慧教室”现在非常热的一个方向。
理论上说,未来的智慧教室,不但能从物理的角度方便大家自动分组——对应协作式学习,自动展示——翻转课堂。其实也就是桌椅板凳组合灵活,电子显示灵活等等,有点工程学的意味。除了这个,最重要的就是各种自从传感器记录学生的行为,并实时分析。
现在台湾有个教授研究的智能椅垫就比较有意思,学生坐在这个垫子上,就会自动记录他的压力分布,从而分析出他是否注意力集中等等。这是一个具体的应用,剩下还在研究的比如和模式识别相关的,通过摄像头和传感器的实施分析,捕捉每个孩子的学习状态。这些数据的分析,就涉及到我研究的课题:学习分析学了。
这个等下再说,咱们继续说数据获取这块,尤其是学习数据获取。
其实智慧教室获得的数据更多是生理数据,而真正的学习交互数据,更多的靠电子教材,电子题库等等。在这方面,苹果的研究已经很成功了。基于ipad的教学小组授课越来越多。我们北师大和人大附中的西山分校就曾经搞过一个苹果实验班。课件直接灌到ipad里,用小车放门口,孩子们进门的时候人手拿一个,现在还只存在教材上。未来如果把 考试、练习,这两个环节打通,把 考 学练,三点一线串起来,那么这个设备对数据的获取和呈现就很棒了。
第三,刚才说了智慧教室,电子教材,最后一点未来应用是可穿戴设备。
说完了数据的获取,咱们再说说数据的分析。
现在学习分析学非常热,其实原理和Netflix生产纸牌屋差不多。对停留时间,反复程度做个简单分析,基本上就能定位一个学习难点。在这里我补充一点学习分析的“场景”依然很重要还是从 “考学练”三字经上说,考试,这个场景是最准确的。学习分析学很热,但是没啥新东西,基本的就是BI以前用过的技术,还有语义分析,机器学习等等。大家都比较了解。
但是他不同的是背后的学习心理学支撑,以及我刚才说的,“场景”,不同的场景,分析时参数设定也不同。
最后,说说数据的呈现。
呈现这里面最重要的课题是“自适应学习”。其实这是和上面的学习分析学一脉相承的,也是就说,后台分析出来你那块需要加强,那么考学练配套的部分也就自动加强。
考,这一部分还是最容易的,其实之前很多地方已经有这种技术,托福考试的机考某种程度上说也是自适应调整。
练,其次,一般效果是根据之前的数据积累,以及对上一道题的分析,出下一道题。
学,最难,涉及到学生综合素质评测的问题,是个综合结果。
智慧教室的成本目前来说还可以承受,硬件成本其实不高,但是系统集成成本高。设备都是原有哪些,比如电子白板,pad等。
接着说评测系统,这部分软件比较难,而且目前的难点是数据收集,就像我说的,其实我们并不知道在课堂上发生了什么。
目前来看,做考试类大数据应用和设备是最靠谱的。练习其次,学习最难,基本不靠谱。
接下来和大家说说体制外,也就是培训市场的。这里做的最好的是互联网教育机构。他们天生有数据基因,但是从投资人的角度来说,我看“培训”,注意,从这里开始,我都用“培训”二字。培训产业有几个比较确定的判断。
首先是k12碰不得。因为孩子们根本没时间用各种互联网学习平台和学习app。这个领域,搞教育是会比较惨的,但是搞学习服务会比较成功。尤其是本质是“中介”这种商业模式的应用,都会很成功。
从数据这个角度看培训行业,我们认为只有 2C 才有前途,做2B的只能呵呵了,做平台的更是打死也做不过BAT,可以洗洗睡了。所以又衍生了一个结论2B不投。
另外我们认为从数据这个角度看,哪些点有机会呢?
首先是020。线下有实体,线上有2C的应用或者网站,尤其是这两条线还能产生某种形式的互动的话,“那是极好滴”。按照时间轴来分,幼教领域的培训业务,尤其是和数据相关的,并不多,这块其实最重要的是hold住家长。
从培训角度说,幼教是有半径的,小孩子只能就近学习,再优质的资源也没办法,那他们的数据,只能通过线上这一块,由家长和学校互动。
目前,A股上市的全通教育,主营业务“家校通”做的其实就是类似的生意,只不过他没做幼教,但是这个模式是成立的,他们平台上的数据,就非常有价值。
目前我们还没有在幼教这块看到数据资产特别有价值的投资对象。但是,我坚信这块肯定会出来某个公司,而且他们一定是个纯线上的公司,同时是个“重数据”公司。k12我说了不看了,但是对于课外辅导和培训来说,优质内容还是非常重要的。
在这里,大数据其实有两个切入点,一个是优质课程,一个是模拟考试。
考试部分说过了,课程部分我想在这里说。优质的k12辅导课程,必须是和原有课堂学习不一样的。
我们现在犯得很多错误,是因为我们在照搬以前的经验,而互联网的出现,恰恰是要做出点颠覆性的东西出来,课程,这个领域是我们能遇见到的,最慢变化的领域。
过了k12就是广阔的高等教育,职业教育。在这些领域,我认为职业教育最有可能成长起来,一是他有先天的付费基础,二是用户天生有在线能力。最近复兴资本投了慧科教育(开课吧)2000万美金的A轮,我觉得这个deal是明智的。他们主打泛IT,而且线下根基稳020基础好,同时线上做的很棒,可以说基本符合了我刚才说的选公司标准。而且这样的公司,他们的数据是非常有价值的。
对一个客户的深度开发,会带来后端不断的续费。续单率高,持续收获,多种经营,这样的生意前端就可以玩互联网最擅长的免费,而后考后端赚钱。不管慧科未来会不会成功,这种商业模式的逻辑是成立的。
最后总结一下,在培训这个领域,数据资产,或者说大数据方法,比在教育领域要更有生命力。培训更市场化,也更容易被互联网化,因此也就更容易被数据化。但是反过来,在公办教育领域,机会也是巨大的,这个机会是教育管理的IT化机会,很多不懂教育的厂家会在这波浪潮里面起来,因为他们懂管理。
我就说这么多吧,下面时间给大家提问。另外说明一点,我前半部分是研究者的身份,后半部分是投资者的身份,有时候会人格分裂,呵呵。没有办法,纯做学术和纯做投资都不容易。
大数据技术在教育领域中的应用
1.教育领域的原有数据模式简析
国家教育统计年鉴
各地市州的教育局
个高校数据
国家教育研究机构的数据
2.对“官办教育体系”原有数据体系的一些点评
活性差:时间,
粒度粗
没人用
体系不通,数据孤岛严重
3.中国原有培训体系的数据模式简析
公办网络教育
民营在线培训学校
其他非培训类平台积淀的教育资产
新兴的学习终端及其教育资产。
4.国外教育培训行业中数据技术应用的现状
基本面临同样的问题
韩国 megastudy
美国 地平线报告
中国台湾地区 游戏学习
5.从学术角度来说,未来大数据在教育领域的几个方向及其判断
数据的收集——终端设备的应用
智慧教室
电子书包/电子教材
电子题库/自适应诊断 (学考练-打通——连通主义学习理论)
数据的分析——学习分析学
机器学习技术
文本语义技术
大数据聚类
数据的呈现——
学生评价体系
练习
考试
6.从教学管理的角度
幼教及低领儿童——主要表现为家校互动
K12——学校教学管理及教师管理:目标:将优秀教师的教学能力数字化后,得以复制和推广。
远程教育解决偏远地区师资问题。
高等教育——远程化,mooc化,优秀的人才向最优秀的教学资源剧集(低龄阶段教育的主要目标是公平,高教阶段教育的主要目标是质量)
职业教育——贯通,定制化,一定是用人单位定制化管理教学。
其他中介性质教育,如留学中介业务——携程化,管理模式是鼠标加水泥。
7.从产业角度
小结一下:数据化程度低,各阶段发展不平衡,利益主体多元,复杂 未来趋势:
对中国来讲,先IT化,后互联网化,整体慢慢改,局部可突破。 难点:体制破局、教师改造
最终动力:
学习者本身的需求和习惯养成,新技术带来的真正便利。
互动内容:
Q1 yangying:北师大好和移动有个教育资源共享的实验室?
高步云:回答一下问题,是的. 有兴趣可以会后联系我,我们团队负责这个实验室的部分业务移动投了不少钱
Q2 Bright Star:请问:您认为EDX模式,或苹果公司“iTunesU”、iBookstore系统会颠覆学校吗?
高步云:@bright star 的问题。我不认为单一的技术会颠覆学校,其实ibookstore本身正是适应学校教学的产物,他不过是教材的电子化和2.0版本,还不是颠覆。颠覆教育的一定是从教学方法开始,从根基动摇。
Q3冯达:能不能说一下K12考试测试这部分,我觉得这个市场还是很大的。做好学校工作的话,O2O很现实
高步云:我先回答冯达兄弟的问题。这是很好的问题,这块市场也超级大。但是有一个很严重的问题是标准。一旦涉及到考试,标准化是最重要的问题,k12领域的教材有多少,大家猜一下广东和广西的教材都不一样。因此,其实k12不存在标准化考试,这是个很头疼的问题,这个问题最早遇到的是好未来,也就是学而思。
冯达:我目前觉得猿题库的思路很对,但是它渠道不对。
高步云:在没有互联网的时候,他们就想考教辅和教材来统一市场,结果,没做到。他们在线下都没做到的事情,我们在线上,一样做不到。回答完毕。补充最后一点,单一学科有可能突破。尤其是数学。因为他产品可以做的最标准化
Q4张涵诚:请问如何看待第9课堂,或者多贝,这样的项目。
高步云:@张涵诚 我很看好这种形式。
Q5张存勇:@高步云教育科技投资教育大数据系统能否解决孩子课业负担重的问题,感觉学校这种填鸭式教育很悲催,学习源于情趣引导,或如何解决因人施教?
高步云:@张存勇 哈哈,其实挺好的,情趣培养是人生重要的课题。我说说我的看法哈,中国教育,一定是先释放制度红利,再释放技术红利——这段话是我原创哦。现在的中国教育,类比一下,还在改革开放前,这个时候需要的是邓小平这样的人物,通过体制改革,释放生产力。在这个方向,我坚定不移的相信,现在的美国,就是未来的中国。未来最好的教育,一定是私立教育机构提供的。石家庄有家企业,精英教育集团,就基本上具有了这种雏形,从幼儿园到大学,一手做了起来,而且都非常成功。我觉得私立办学的体制问题解决之后,真正的素质教育才能迎来春天。
张存勇:@高步云 教育科技投资非常赞同。
Q6伍星:纯在线的职业教育怎么看,职业教育面向大学生,面向在职的,又分别怎么看。
高步云:@伍星 哈哈,你终于来了,职业教育我看好在职的培训,很简单,有钱,尤其是,按系统来分的话,我看好金融系统的在职培训。推荐易欢欢师兄开一个互联网金融班,肯定赚钱。在校生培训,最好解决消费者付费能力问题,具体可以参考 ATA 和 宜信 的互动,付费能力不解决,客单价上不去,真的做的太辛苦。
Q7高步云:大规模开放在线课堂平台,只会加剧教育向优质资源的集中。举个例子,哈佛大学最牛的模式识别课程在moocs上完成学业的都不是哈佛的学生,这些学生是来自全世界的牛人,之前只有哈佛的学生能听的课,他们现在可以听。今天我还和真格基金的郑博士讨论过这个问题。
高步云:问一下,如果花同样的时间,你可以学习哈佛和清华的课程,你选听谁的?所以我觉得moocs就像高铁,他没有从本质上改变铁路这种业态,但是他的确的改变了这个行业的面貌。
老孔:教育就是投资于人才。就像mba,如果把4年的学费做投资,以后分红?
高步云:@孔老师 您说的很对,现在有金融机构是这么做的,只是这种模式一般要衔接后端的职业介绍,发展空间有限。最近上市的达内,就是这种模式的典范。
老孔:教育,一顶是金融产品,投资品。白老师设计一下,我们从it开始玩。
高步云:他的成功就一句广告:来学而思,上人大附。补差的逻辑则不然。大数据肯定会对补差这种模式更有效,而且从本质来讲,大数据,就是要把人拉到平均线附近。符合了统计规律但是问题在于补差这门生意不赚钱,大部分机构都不干。试想一下,一个机构是专做补差的,那您送孩子去哪儿,就等于默认他是差生。呵呵,这就又成了一个商业和技术的悖论,但是从技术角度,我坚决认为补差是未来方向。
老孔:@高步云 从技术角度看,游戏化,可视化,分享,是可以有作为的,其作为点是“消除或者降低学习的痛苦”。
高步云:是的,游戏化学习是一个很重要的研究方向,但是最近一直难有突破,因为从哲学上来讲,这是矛盾的。最近的游戏学习基本变成了 游戏式考试。也就是说基本上是在考试的形式上做文章。还没有特别触及“学习” 从学术角度来讲,根据布鲁姆的学习理论。1956年,本杰明·布鲁姆发表文章《教育目标分类:认知领域》,认为思维有六种级别。识记:对具体事实的记忆;领会:把握知识材料的意义,对事实进行组织,从而搞清事物的意思;应用:应用信息和规则去解决问题或理解事物的本质;分析:把复杂的知识整体分解,并理解各部分之间联系,解释因果关系,理解事物的本质;综合:发现事物之间的相互关系和联系,从而创建新的思想和预测可能的结果;评价:根据标准评判或选择其他办法。自此之后,这六种思维级别被广泛接受和使用。他给出的认知技能列表,是按照从最简单到最复杂的顺序排列的。最简单的认知技能是对知识的回忆,最复杂的认知技能是对观点的价值作出判断。越核心越本质,也就越难用工具触及。所以,从投资来讲,我们只看做游戏化考试的,比如最近很热的百词斩,我就很看好识记:对具体事实的记忆;——这是最浅的能力所以比较好工具化。
Q8白硕:让好学生更好,和让差学生明显提高,使用大数据的模式有差别吗?
高步云:@白硕 在“培优”和“补差”这种商业模式方面,中国的培训机构,基本是做培优的的,比如好未来的崛起,就是因为他对人大附中的人才输送。
【中关村大数据产业联盟主旨与目标】
落实国家战略,聚合产业势能,促进商学互动,
助力企业成长,倡导数据伦理,探寻数字文明
原文发布时间为:2014-04-13