预告:从世界冠军到数据科学家 他在挖什么? | 硬创公开课

数据挖掘的英文叫Data Mining,Mine有“矿”的意思。因此做数据挖掘的学者们常常戏称自己为“矿工”。不过,其实数据挖掘的研究过程与采矿确实有异曲同工之妙。数据的收集、筛选、分析和应用,正如矿石的勘探、开采、提纯和使用一样,每个步骤都看起来都是大海捞针,但在合适的方法下,这些“针”又每次都能被恰如其分的挖掘出来。

大数据这个词我们听得太多了,可是很少有人意识到,随着互联网的发展,今时今日的这些“大”字究竟已经意味着一种什么样的量级。除去少数哗众取宠的使用这个词的公司外,那些真正拥有大数据的企业,经手和处理的都是一些普通人可能穷极一生也接触不到的数字:微信朋友圈每天会上传10亿张图片,支付宝日交易额峰值超过200亿元人民币,京东每天上传几百万张新的商品信息图……

这些数字对于急需数据训练的人工智能算法来说是莫大的好消息。也意味着数据对于人工智能的重要性正在随着计算能力、算法的发展而呈直线上升。但是怎么在浩如烟海的数据中筛选出对我们真正有用的那些?又如何通过分析这些数据做出对自身有利的决策?这就是数据科学家们做的事了。

本期硬创公开课,我们邀请到了iPin的首席科学家潘嵘,他曾获得2005年全球最高级别数据挖掘大赛KDDCUP的世界冠军,也在科研和产业领域都积累了相当丰富的经验,本周四下午3点,就让潘嵘老师来为我们讲讲,一个合格的数据科学家是怎样炼成的。

本文作者:魏秀参

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-17 04:25:19

预告:从世界冠军到数据科学家 他在挖什么? | 硬创公开课的相关文章

如何利用大数据做遗传病智能化诊断?| 硬创公开课

据OMIM数据库(人类孟德尔病数据库)数据,单基因遗传病的病种数量约有7000种,其中约4000多种致病基因和发病机制比较明确.单基因遗传病单个发病率低,但单基因病种类极多,所以总体发病率高,且具有先天性.致死致残性的特点. 就诊断而言,单基因遗传病涉及多个学科,临床症状复杂,且由于基因的突变具有多样性,每种突变都可能导致不一样的临床症状,而突变的临床意义也相当复杂,故诊断较为困难.而且,许多遗传病都及其罕见,属于罕见病,对于一名医生来说,诊断经验不足,根据症状极易误诊. 所以对于临床医生而言,

预告:带你走进 AI界 “中国互联网的黄埔军校” | 硬创公开课

微软亚洲研究院成立于1998年,位于中国北京,是微软在美国本土以外最大的基础研究机构.目前,微软亚洲研究院拥有20个研究及工程团队,主要从事自然用户界面.新一代多媒体.以数字为中心的计算.互联网搜索与在线广告以及计算机科学基础五大领域的研究. <人物>2016年7月18日发表了题为<中国互联网的黄埔军校>封面文章,引起热议,开头这样写道: 微软亚洲研究院是百度总裁.阿里云之父.金山软件CEO.小米总裁的摇篮,这里走出的500多人活跃在中国IT产业的各大企业,100多人执教于中国一流

预告:盘古团队:越狱 iOS 的那些事儿 | 硬创公开课

       再过两天,iPhone 就会迎来 iOS 10 更新. 对于盘古团队这个 iOS越狱大神来说,这次全新的升级让他们兴奋无比,因为看起来他们对于越狱 iOS 10 正式版胸有成竹.在正式版推送之前,盘古是目前世界上唯一曾对外演示越狱 iOS 10 Beta 版的黑客团队.然而,iOS 10 正式版对他们来说仍然存在着未知和挑战.因为几乎每一次 iOS 的重大版本更新,苹果都会在系统框架中加入新的安全机制. 本期硬创公开课,我们邀请到了盘古团队的创始人,犇众信息 CEO 韩争光.他将为

从世界冠军到数据科学家 他是如何炼成的? | 硬创公开课

大数据这个词我们听得太多了,可是很少有人意识到,随着互联网的发展,今时今日的这些"大"字究竟已经意味着一种什么样的量级.除去少数哗众取宠的使用这个词的公司外,那些真正拥有大数据的企业,经手和处理的都是一些普通人可能穷极一生也接触不到的数字:微信朋友圈每天会上传10亿张图片,支付宝日交易额峰值超过200亿元人民币,京东每天上传几百万张新的商品信息图-- 这些数字对于急需数据训练的人工智能算法来说是莫大的好消息.也意味着数据对于人工智能的重要性正在随着计算能力.算法的发展而呈直线上升.但是

牛人解读: 如何从一个青年科学家变成首席科学家? | 硬创公开课

相信不少学者在面对艰深的科研课题的时候,心中都有过那么一丝疑惑:这东西何时能实现产业化,真正造福社会?尽管心中的信念不会因此动摇,但疑惑仍然长时间的存在着.一项新技术从在实验室中诞生,到最终投入大规模使用,这其中经历的艰难和磨难会远远多于常人的想象.学术研究和商业化应用可以说是几乎同样困难的两个课题.有人醉心于探索科技最前沿的方向和理论,但也有人更希望自己能帮助将这些技术落地到具体的产品中去,真正的为大家服务.这些人中的很多最后都去到了相关公司的实验室中贡献出自己的一份力量,也有些自己创业,开始

预告:深度学习新星:GANs的诞生与走向(主讲人冯佳时 )丨硬创公开课

在大数据和人工智能界,常有这么个说法"谁掌握了数据,谁就占据AI高地." 但是"掌握数据"往往意味着巨大成本.首先海量数据经常被大型企业垄断,给原始数据标记也需要耗费巨大资金. 所以,基于数据而习得"特征"的深度学习技术受到狂热追捧,而其中GANs模型训练方法更加具有激进意味:它生成数据本身. GANs是"生成对抗网络"(Generative Adversarial Networks)的简称,由2014年还在蒙特利尔读博士的I

滴滴美国研究院专家:从DDCTF大赛看当前网络安全新趋势 | 硬创公开课预告

  如果说,滴滴出行(以下简称滴滴)是近几年来让大家出行发生翻天覆地变化的一家公司,想必你不会反对. 据滴滴给出的官方数据,滴滴全平台上每天超过2000万订单.与此而来的是,这么多乘客的消费数据和个人信息,滴滴怎么守护? 快速增长的滴滴意识到了这一点.2016年9月底,硅谷安全教父弓峰敏与网络安全资深专家卜峥加盟滴滴,弓峰敏出任滴滴信息安全战略副总裁和滴滴研究院副院长,负责制定信息安全战略和研发下一代信息安全技术,卜峥则担任滴滴信息安全副总裁,全面领导信息安全团队.今年3月9日,滴滴又宣布在加利

如何用大数据做威胁情报 | 硬创公开课

       大数据.威胁情报,这两个词汇听起来非常性感.在我们的想象中,掌握大数据的人就像先知和上帝,俯视我们所不能完全理解的事态,精准地预言我们将要面临的危机.然而,对于大数据的利用是非常考验功力和技巧的.很多学艺不精的团队稍不留神就可能把威胁情报搞成"摆摊算卦".  本期硬创公开课我们请来了白帽汇的创始人刘宇,白帽汇拥有一样独门武器,那就是NOSEC大数据平台,可以汇总诸多白帽子网罗的独特情报.像黑客一样去思考,就是他们的自我要求,今天就请刘宇来聊聊白帽汇在真枪实弹的对抗中,究竟

枪在手,跟我走,黑客特种兵如何狙击诈骗分子? | 硬创公开课强势预告

  数千米之外,一颗子弹飞越漫漫沙尘,正中歹徒眉心,而仅仅在旁边十厘米,是被歹徒挡在胸前的姑娘. 紧锁的门被猛然踢开,阳光如溃坝的河水一般涌入黑暗的房间.恐怖分子还来不及反应,便被冲进来的特警用冰冷的枪管顶住了额头. 高空落下的飞索,破窗而入的救星.当正义的大厦即将倾颓,总有一颗子弹越过泪水,击碎肮脏和丑恶. 知道创宇,被称作网络世界的特种兵,是很多人心中最酷的安全公司. 潘少华,正是这支特种兵的"参谋长".作为知道创宇威胁情报中心的负责人,他手中握着一张蔓延全国的"黑色地图