数据、大数据及其本质是什么?

最近几年,数据问题进入哲学视野。对于哲学家们探索的数据本质特征,我们可以从以下几个方面来把握。

数据与大数据

技术进步,主要是计算机、网络和各种类型的传感器以及云技术、分布式计算与存储等海量存储技术的广泛应用和运算能力极速进步,使得数据概念被大数据概念取代。数据量增加速度之快,大致可以这样描述:最近两年生成的数据量,相当于此前一切时代人类所生产的数据量的总和。

大数据指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。大数据的特征,除了巨大、快速、多样多变之外,没有其他。因此,大数据本质上还是数据。

在大数据的上述特征中,其多样多变性值得特别关注。它表现为所生成数据格式的多样,如文字、图片、视频等各有多种不同的格式,取决于生成数据的技术与设备,却反映出数据生产的时代性以及数据处理的能力与条件,也反映出被描摹自然和社会的多姿多彩。另外,随着技术发展和数据量急剧增长,新的数据格式还会层出不穷,多变和多样特征更加突出。

大数据既是一个技术概念,又是一个商业概念,它的出现,有其特定背景,即it领域的商业和渲染新技术的考量。大数据包揽了人类获取数据的所有途径,提示哲学研究一个全新时代的到来,这个时代的先声,很久远之前就已经响起,那时,它仅仅被称作数据。在我们的讨论中,主要考虑数据与哲学的关联。

数据与认识

这里的认识,指的是人的认识,是人对外部世界的认识。

大数据的出现和引起关注,使得一个事实得到确认,这就是,数据覆盖了人类对于外部世界的感知。感官及其所获得的经验退居到显示屏之后,退居到各种类型的技术装置之后,这些装置将自然和外部世界的映像“转译”成人类感官可以接受的图像、声音甚至触觉和嗅觉味觉。这既是技术发展的必然,又是始料未及的情况。如果说,此前,哲学还试图在技术系统生成的数据之外寻找世界的直观映像,到了大数据时代,这种人类的直接感知即使没有被完全取代,也失去了其传统意义上的优势。一言以蔽之,哲学,需要从数据中寻求对世界的认识,舍此即失去认识的来源。

这似乎是一个惊人的变故,其实不然。在影响人类认识的议题上,大数据带来的变化,只是数量和范围上的,并非根本意义上的改变。事实上,回顾历史,我们发现,我们的对外部世界的感知,从来都是依赖于某些技术装置的,也就是说,人的认识,其实是通过数据获得的。

最早的技术装置,可能是直尺,它用于测量长度,例如田亩;更早的述说技术装备,也许是绳结,它用来述说一件重要的事件。在我国,从河北泥河湾先民打造石器,到安阳殷墟龟甲上刻画的文字,都可以看作是某种“数据”,表达着人类对外部世界的某种认知。而面对着所有这些早期的承载数据的技术装备,人们获得对外部世界的某种最早的抽象认识。古代人先后发明过算筹、斗和称、漏刻、浑象仪、量角器等等,无不是用来产生认知外部世界的数据,人们也发明笔、纸张、雕版印刷术,也是用来记录和生产数据。依托所有这些,数据成为人们认识的依据,思考的源泉,表达的工具。

近代以来,西方的技术和科学异军突起,望远镜、显微镜、六分仪、光谱仪、质谱仪乃至加速器、射电望远镜相继出现,成为人类认识外部世界的有力工具。这些技术装备产生的数据成为近现代思想的新的依托。到了当代,伴随着电子计算机的强大数据处理能力的出现,各种延伸和阔展人类感官感知能力的器皿设备层出不穷,终于完全或接近于完全取代人类对外部世界的直接感知,通过把数据呈现给人类,成为人类认识的来源。这就是大数据的时代。

关键点在于,我们所知的世界,全部是数据表达的,其中一部分获得理解和解释,更多的只是数据,没有得到解释甚至没有得到关注,它只是像自在自然那样在那里,等待人们去搜索发现它,解释它,运用它。

数据与本体

根据上述认识,似乎可以通过观察数据的形成和生产,来理解哲学与科学的在解释客观自然议题上彼此消长。

在近代科学初兴时期,它并没有从传统哲学中分离出来,它被冠之以自然哲学。与之相并行不悖的,有哲学本体论和形而上学。后两者都是试图以某些观念描述和解释外部自然,寻求事物的本质,并在哲学领域合法存在。伽利略、牛顿等人推崇的使用先进观测和实验手段观察与调控自然,用数学述说自然过程。当这一切成为风气之后,哲学本体论逐渐衰退,哲学似乎放弃了对客观世界的描蓦和解释,让位于自然科学。

最后一位试图运用科学数据来解释自然的哲学家是康德,他研习了牛顿的运动力学和天体力学,提出宇宙演化学说。然而,拉普拉斯在康德基础上,用物理理论和数学表述了星云说,在无限时空中的恒星和星系演化学说。拉普拉斯之后,科学之描摹自然优越于传统哲学得到公认。

一般认为,在经典科学时代,哲学与科学在描摹自然方面的差异,在于是否运用数据和使用数学方法。今天我们发现,这并非全部问题所在。经典时代,直至大数据崛起的今天,自然科学的确在使用各种技术装备获得的数据方面占据优势地位,哲学则固守传统的概念分析和一般推理方法,这还是指的好的哲学。这与其说是哲学落后于科学,勿宁说人类获得数据的能力尚有不逮,给传统哲学留有施展余地。

大数据的出现,包围了人类认知世界的所有方面,情况发生变化。在科学界开始讨论并实施“计算一切”的时候,同时也给哲学重新回到讨论本体打开方便之门。这里发生的变化是,数据成为认知的源泉,思维的质料;我们对世界的解释转变为对数据的解读,舍此无他。大数据的出现,使得我们发现,我们所知的称作外部世界的东西,是通过数据来呈现的,当我们寻求世界的本质和意义时,我们实际上是在数据中徜徉;当我们觉得有所发现有所体悟时,实际上是自觉找到了一些数据之间的关联。

数据的物理学气质

所谓物理学气质,指的是思考事物的本质,从原理层面上对事物的本质进行探究,揭示出事物的基本规律。当前备受热议的数据和大数据是否具有揭示事物基本规律的功能,可能还有待于观察,但是,数据,就其现象而言,似乎已经展示出某种物理学气质,考察这一特性,既有利于认识数据的本质,也有利于深化对物理学的认识。

这里所说的物理学,主要指的是量子力学。

众所周知,量子力学无论在理论上还是在应用上都获得巨大成功,在场论、粒子物理和天体物理学研究上都扮演者基础角色,在固体物理、半导体物理以及超导物理等应用学科上都有极出色表现。量子力学与哲学的联系,比其他任何自然科学领域都要来得紧密,其中最重要的就是认识论问题。

量子力学发现,建立在测不准关系基础上的认识,受到基本物理原理的限制,客观世界原则上不可能真正被观察到,我们只能根据物理测量结果认识世界。而测量本身形成对客观世界的干扰,导致无法真正认清它的本来面目。所以,我们对于世界的认识,唯一来源就是测量的结果,即所谓经验。

量子力学的这一认识原则引发将近一百年的讨论,至今未能平息。

尼尔斯·玻尔认为我们必须接受量子力学给出的认识原则,承认和接受自然作出的安排,量子力学已经很好地描绘了自然;爱因斯坦则不愿接受玻尔的“绥靖哲学”,他觉得一定是量子力学本身的不完备造成,人对自然的认识应该是能够穷尽的,不可能也不应该像量子力学所描绘的那样。

当我们回顾前述数据与大数据的认识论与本体论含义时,就明白,一直以来有关量子力学问题的争论,本质上就是对于数据的意义的争论。显然,爱因斯坦不愿意接受数据给出的结果,以及对于数据的解释,而玻尔则认为数据揭示的自然正是自然本体,无论我们是不是喜欢它。

有趣的是,人们一直在争论量子力学的测量问题,此前却几乎从来没有人意识到测量的结果本身就是数据,而数据已经成为事实上的认识来源。离开数据,我们对于世界一无所知。

在这个大数据时代,当我们认识到,数据正是我们认识世界的源泉,所谓世界其实就是数据构成的,我们也会看到数据本身所具有的物理学气质,正像量子力学所强调的那样,世界隐藏在经验表象背后,我们所能谈论的,只是经验本身。

本文作者:佚名

来源:51CTO

时间: 2024-09-21 22:08:42

数据、大数据及其本质是什么?的相关文章

星图数据:大数据的想象空间

文章讲的是星图数据:大数据的想象空间,云计算从提出到进化出完善的PaaS.IaaS和SaaS架构,再到被市场广泛接受,用掉了将近十年.而大数据概念从知名学者舍恩伯格提出到现在,刚刚不到三年,最常见的用途不过是为碎片化的营销渠道提供参考坐标.大数据的潜力和商业能量显然还没被充分挖掘出来. 记者就大数据的应用场景和未来的发展趋势,采访了星图数据(Syntun)的创始人谷熠. 产品经理出身的谷熠曾在 SaaS 企业级软件行业工作十多年,主要为企业客户开发数据类和信息类产品;他的合伙人之一,也是星图数据

2015建投数据大数据解决方案发布暨核心客户研讨会落幕

ZD至顶网软件频道消息:10月25日,为期两天的"新启航 新产品--2015建投数据大数据解决方案发布暨核心客户研讨会"在北京成功举办.本次研讨会议由建投数据科技股份有限公司主办,汇聚来自全国各地数十家金融行业客户.会议分享了大数据在互联网征信领域的应用,建投数据在金融辅助营销和工业4.0这两个领域打造大数据应用实践.通过传播行业最佳管理实践,提供行业优秀解决方案,促进业内经验的交流,助力行业企业实现战略转型! 一. 互联网征信现状 今年互联网金融最热门的风口当属互联网征信了,特别是央

谈大数据 大数据的精髓在于“预测用户行为”

谈大数据 大数据的精髓在于"预测用户行为".它能够知道你的喜好,它能够通过你过去留下的行为,看过什么东西,浏览过什么网站,去过什么地方,喜欢什么吃的,就是说你在互联网上都留下了一些足迹,这些信息能够帮助大数据的服务商推进你有兴趣的信息,比如你在玩一个游戏,他会猜你喜欢什么样的游戏,它能推荐你什么样的应用和商品. 企业建立内部的数据平台已是大势所趋,但只有市场出现专业的数据平台实现数据的管理和交易,才能推动大数据快速发展. 未来移动互联网的发展更普及之后,我们可以看到,整个营销会迎来一个

大量数据≠大数据

Intetix Foundation(英明泰思基金会)由从事数据科学.非营利组织和公共政策研究的中国学者发起成立,致力于通过数据科学改善人类社会和自然环境.通过联络.动员中美最顶尖的数据科学家和社会科学家,以及分布在全球的志愿者,我们创造性地践行着我们的使命:为美好生活洞见数据价值. 在大数据时代,人们很容易把一大堆数据定义为"大数据",比如,大型制造企业和仓库可能存有多年积累下来的存货数据,或许高达几兆兆字节,但这并不能算大数据.同样,1500个PoS机的现金数据.一大份工作表中的数

为什么没有“小数据” 大数据就毫无意义

在大数据的火热炒作中迅速追赶行业热潮是一件很容易的事.庞大的数据集.快速移动的分析.复杂多样的数据源,现在这些都十分火热,但是你要明白,如果没有小数据的支撑大数据是毫无意义的. 我所说的传统性能指标的小数据,是任何大数据项目成功的关键. 这些KPI是用以衡量一个公司是否成功.它们可能包括客户保持率.转化率.市场份额或其他几十个决定你的公司运营状况如何的指标.如果没有良好的关键绩效指标(KPI)就不可能有好的大数据计划. 数据本身几乎是毫无用处的.它只是一系列大量的无关联的数字.它的价值只有当它与

大数据商机无限 掘金四行业个股

大数据平台是从各种类型的.漫无边际的数据中,快速获得有价值信息的处理方法或框架.大数据中的"大"不是大数据的唯一指标,而是更强调数据的类型多样.处理的速度和获取价值的能力.分析人士表示,大数据对传统行业的重构有望成为中国经济新一轮快速发展的关键推动力,对于A股上市公司而言,IT业.移动互联网.交运和电力安全设备生产商等四类板块受益明显. 网络是大数据重要信源 数据是平台运营商的重要资产,可能提供API接口允许第三方有限度地使用,但是显然是为了增强自身的业务,与此目的抵触的行为都会受到约

大机会?大风险?大忽悠? ——它们有一个共同的名字叫“大数据”

导读 大数据实际上有三个主要的理解:大数据确实带来了大的机会;大数据也引来了大风险;大数据本身非常像大忽悠. 一.大数据带来大机会 各行各业突飞猛进地运用大数据 先说大数据,大数据到来之后,包括电子商务.零售企业.交通运输.信息产业.公共卫生.教育以及生产企业对零部件的监测,各个产业实际上都在突飞猛进地运用大数据.在这当中,在全球范围内形成了很多重要的案例,我简单介绍几个. 1 TARGET 在大数据领域做的最好的一个公司叫Target.它用抽样调查和大数据结合,构造了整个智能的广告推送系统,做

院士梅宏:真正的大数据应用体现在数据挖掘的深度

2016 CCF大数据与计算智能大赛于2016年9月24日在中国·北京梅地亚中心酒店开幕. 北京理工大学副校长,中国科学院院士梅宏在会上做了<大数据与数据驱动的智慧>的演讲,探索了大数据带来的挑战和可能的应用.梅宏认为,目前来讲,大数据还在炒作的阶段,真正的大数据应用应该体现在数据挖掘的深度.在演讲的梅宏最后提出:当自演化的软件能够让机器自己改代码的时候,才是真正的类脑智能. 大数据文摘为您带来一手演讲实录,以下为梅宏院士演讲全文: *根据主办方提供的速记整理,在不改变原意的情况下,部分有删改

盘点大数据商业智能的十大戒律

如今,各路企业和组织都不再使用上一代架构来存储大数据.既然如此,为什么还要使用上一代商业智能(BI)工具来进行大数据分析呢?在为企业选择BI工具时,应该遵守以下"十诫". 第一诫:不要转移大数据 转移大数据代价高昂:毕竟,大数据很"大",如果打包转移,负担太重.不要将数据提取出来,做成数据集市和数据立方,因为"提取"就意味着转移,会在维护.网络性能附加处理器方面造成纷乱庞杂的问题,出现两个逻辑上相同的备份.让BI深入更底层运行数据就是大数据萌发的

《数据分析变革:大数据时代精准决策之道》一2.3 纵观全局看待大数据

2.3 纵观全局看待大数据 大数据是如何适应现状的?为什么说大数据具有特殊性?大数据以后发展方向是什么?这些问题都很常见,大多数企业都会碰到.就像所有新鲜事物一样,关于大数据究竟能干哪些事情,肯定也会出现混淆和不一致的地方.本节探讨的正是那些必须理解的主题和概念,这样我们才能纵观全局,全面地思考大数据.把大数据放到正确的背景下思考,这样在使用大数据做运营型分析时,会更容易达成目标. 2.3.1 与其说是大数据,还不如说是差异化数据 正如本章先前所述,大数据让人兴奋的原因之一是它包含了新的信息.但