中科院院士张钹:用人工智能读懂大数据

大数据,“大”容量是多数人关注的焦点,但是却忽略了“内容”。

今天,第七届中国云计算大会第二天日程持续进行中,中国大数据专家委员会顾问、中国科学院院士张钹认为,现在大家比较关注形式和模式,却很少看到内容这个维度。

“大数据的处理问题仍然是个老问题,网络数据与以前的数据不同之处在于,虽然数据很多,但是有用的数据只有34%,好用的数据仅有7%,被分析的数据更是少到只有1%。”

下面张院士的这张幻灯片显示,在单机时代,计算机不需要了解具体内容是什么,然而发展到计算机网络时代,这发生了很大变化,计算机必须通过文本和图像了解用户的意图,输出用户需要的信息。

但是,计算机能了解人类吗?答案是否定的,因为计算机不了解人类的语意。这也是在网络大数据处理过程中,遇到的第一道坎儿。

因此,网络时代信息处理提出了新需求:了解用户意图、用户兴趣、用户体验,将粗数据变成知识,理解信息的内容。这里所说的“理解”,有三个层次:自然语义,也就是了解人类说的是什么,说话人的用意和受众的感受。

这就是传统信息处理面临的根本性挑战,能不能解决呢?院士给出的答案是,很难!“过去我们在处理传统信息的时候,我们做的一切事情都是和形式有关,和语意没有关系。”

所以传统的信息处理,基本上很难去做网络数据的处理,那么问题来了,机器能不能处理语意?如何处理?这时候就不得不说说机器学习和深度学习了,它在特定的条件下具有抗干扰能力。

我们固然可以用知识推动的方法解决人类深思熟虑的行为,但是很难运用到感知的信息处理中,这个事情基本上是有人工多层神经网络做的。

院士提醒说,概率统计方法存在局限性,多层神经网络也不是完美的,不要以为深度学习已经完全可以超过人类的水平,这只是在一定的条件环境下。

展望未来,院士认为,未来的大方向是把传统信息处理和人工智能结合起来,也就是“数据驱动+知识驱动”。

原文发布时间为:2015年6月4日

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-10-23 22:01:36

中科院院士张钹:用人工智能读懂大数据的相关文章

【图解】九张图带你读懂大数据医疗

文章讲的是[图解]九张图带你读懂大数据医疗,互联网大框架的结构下,互联网+医疗的个性化服务,能给医疗保健工作者和消费者带来哪些真正的福利呢,首先可以提高效益减少废物.增强了预防传染病的能力.对于个人公共卫生.疾病预防和治疗都有很大的帮助.医学的临床试验等等工作,都在造福于我们. 人们都想选择个性化的健康医疗,为了实现这个目标,我们必须让大数据参与到破译和分析个人的所思.所需中.除了作为一个行业的流行语以外,大数据可以为医疗保健工作者和消费者带来怎样的成功呢? 下面的信息图是由Evariant公司

十种程序语言帮你读懂大数据的“秘密”

文章讲的是十种程序语言帮你读懂大数据的"秘密",随着大数据的热潮不断升温,几乎各个领域都有洪水倾泻般的信息涌来,面对用户成千上万的浏览记录.记录行为数据,如果就单纯的Excel来进行数据处理是远远不能满足的.但如果只用一些操作软件来分析,而不怎么如何用逻辑数据来分析的话,那也只是简单的数据处理. 替代性很高的工作,而无法深入规划策略的核心. 当然,基本功是最不可忽略的环节,想要成为数据科学家,对于这几个程序你应该要有一定的认识: R 若要列出所有程序语言,你能忘记其他的没关系,但最不能

一图读懂大数据生态 大数据地图3.0

文章讲的是一图读懂大数据生态 大数据地图3.0,2012年,FirstMark资本的Matt Turck绘制了大数据生态地图2.0版本,涵盖了大数据的38种商业模式,被业界奉为大数据创业投资的清明上河图.两年后的今天,经过漫长的等待,Turck终于推出大数据生态地图3.0版本.(期间bloomberg推出过一个2013版大数据生态地图) 在大数据生态地图3.0版中,Turck从一个风险投资者的角度对两年来大数据市场的最新发展进行了深入的研判,并对未来趋势进行解读,以下是Turck眼中大数据市场的

对话院士张钹:人工智能创业如何避免昙花一现

导语:2016年,整个人工智能产业呈现出爆炸式的发展,它给人类生活带来各种各样的可能,更给了人类想象力足够发挥的空间.未来,人工智能的发展趋势究竟是什么?人工智能热潮下,研究和产业能够碰撞出怎样的火花?   6月6日下午,大数据文摘记者有幸在清华大学人工智能论坛专访清华大学计算机系教授.中国科学院院士张钹.针对人工智能领域的产业和创业,年过八旬张院士给出了自己的见解和意见.   人物简介:张钹,清华大学计算机系教授,中国科学院院士.曾任信息学院学术委员会主任,智能技术与系统国家重点实验室主任,中

中科院院士张钹:智能制造中的AI是怎样的

雷锋网(公众号:雷锋网)按:近日,中国智谷大会于南京召开,中国科学院院士.清华大学智能技术与系统国家重点实验室学术委员会名誉主任张钹就人工智能的产业化做的相关主题演讲.本文根据网易科技发布的现场速记编辑整理而来,在未改变原意的基础上略作了删减. 人工智能的问题为什么现在这么热或者是产业化,大家热情这么高?我觉得一个重要的原因首先是需求.这个需求不管是第一产业.第二产业或者第三产业都有这个需求.现在因为大家谈的比较多的是制造业,第二产业或者第三产业,服务业.其实农业对于智能化的需求也是很高的,我们

一文读懂大数据计算框架与平台

1. 前言 计算机的基本工作就是处理数据,包括磁盘文件中的数据,通过网络传输的数据流或数据包,数据库中的结构化数据等.随着互联网.物联网等技术得到越来越广泛的应用,数据规模不断增加,TB.PB量级成为常态,对数据的处理已无法由单台计算机完成,而只能由多台机器共同承担计算任务.而在分布式环境中进行大数据处理,除了与存储系统打交道外,还涉及计算任务的分工,计算负荷的分配,计算机之间的数据迁移等工作,并且要考虑计算机或网络发生故障时的数据安全,情况要复杂得多. 举一个简单的例子,假设我们要从销售记录中

【独家】一文读懂大数据计算框架与平台

1. 前言 计算机的基本工作就是处理数据,包括磁盘文件中的数据,通过网络传输的数据流或数据包,数据库中的结构化数据等.随着互联网.物联网等技术得到越来越广泛的应用,数据规模不断增加,TB.PB量级成为常态,对数据的处理已无法由单台计算机完成,而只能由多台机器共同承担计算任务.而在分布式环境中进行大数据处理,除了与存储系统打交道外,还涉及计算任务的分工,计算负荷的分配,计算机之间的数据迁移等工作,并且要考虑计算机或网络发生故障时的数据安全,情况要复杂得多. 举一个简单的例子,假设我们要从销售记录中

科普|九张图读懂大数据医疗

人们都想选择个性化的健康医疗,为了实现这个目标,我们必须让大数据参与到破译和分析个人的所思.所需中.除了作为一个行业的流行语以外,大数据可以为医疗保健工作者和消费者带来怎样的成功呢? 下面的信息图是由Evariant公司建立的,这些图阐述了当大数据被有效地管理时将会带来的趋势和利益(Evariant是一家领先的为医院提供大数据服务的公司). 大数据为医疗保健行业带来了巨大的进步.在过去的几十年中,大数据已经深深地影响了每一个企业,包括医疗保健行业.如今,大量的数据可以让医疗保健更加高效,更加个性

大数据究竟是什么?一篇文章让你认识并读懂大数据

在写这篇文章之前,我发现身边很多IT人对于这些热门的新技术.新趋势往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少能说出一二三来.究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很"土鳖":二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然. 我希望有些不一样,所以对该如何去认识大数据进行了一番思索,包括查阅了资料,翻阅了最新的专业书籍,但我并不想把那些零散的资料碎片或不同理解论述简单规整并堆