大数据时代下小数据又被提起了

&">nbsp;

  在本月新出版的一期CACM上又有两篇文章谈到小数据。大数据很热门,小数据也不可忽略,特别是对于个性化的医疗,小数据不可缺少。而且,小数据与大数据的研究是紧密联系在一起的。

  大数据、智能设备谈得很多,譬如基因组学、蛋白质组学、代谢组学等等将要改变医学。但是,另一股力量要改变我们关于健康的想法和实践,那就是由个人数字跟踪驱动的小数据。考虑一类基于云的应用,随时间连续地、安全地、私人地分析你工作、购物、睡觉、吃饭、锻炼和通讯的数字追踪而得到的你的健康的一幅画。这里需要私人的装置和网络服务,特别是自跟踪。而现在对于患者的数字跟踪是由临床医生来做,而不是由患者;数据是关于临床治疗的,而不是日常活动的。当你作为一个患者和用户,如果你要确定一种服药的剂量哪个更好?改变两周以后,你可以拿出你的数字跟踪数据与前两周的做比较,看你的日常功能有什么变化,以确定哪种剂量更适合你。对于慢性病、抑郁症、记忆力衰退和克罗恩病,很需要日常活动变化的数据。你是你的数据的用户;我是我的数据的用户。我的数据为我所用。大数据一般是从一个大N的种群里面取得的,而小数据n=me。我们需要数据解放,把移动和网络服务的数据解放到你我自己。我们需要一个开放的体系结构,产生丰富的小数据的APP和服务,就像HTTP标准使得WWW具有了如此之多的APP和服务一样。就像移动APP大大提高了智能手机的价值一样,个人数据跟踪的APP也应该能提高智能手机的价值,及小数据和个人数据仓库的市场。

  攻克癌症长期以来都是人们的梦想。现在许多人认识到需要用患者的数据进行个性化的癌症治疗。我们要特征化所有患者。肿瘤细胞的DNA引起不同的癌症病人非常不同的变化。譬如,大致相同的基因变异或删除只占患者的10%。即使是同一个肿瘤,其细胞的变异也不同。所以,对许多患者用同一个治疗方法不可能是成功的。个性化的或者说层次式的药物治疗是要按照特定患者的条件开出药方。不是“对症下药”,而是“对人下药”。基因之间的相互作用可能引起二次变异,对患者的治疗影响很大。这些个性化的治疗都需要记录和分析个人行为随时间变化的规律,这就是小数据。

  当然,治疗的一般规律的发现需要大数据。欧美各国都在计划编制患者信息的数据库,不但为了癌症治疗,也为开发新的治疗方法。集成大量在线数据库可以推动个性化用药,减轻他们的痛苦。从大数据得到规律,用小数据去匹配个人。

  最近,在科学网上发表了很多关于大数据的博文,但大部分都是概括性的哲学性的议论,很少接触具体问题。彭思龙博主发表的“大数据的结果是福是祸?”一文已有7816次阅读,64个评论,击中了统计分析中的许多要害。而小数据较少引起注意。本人发表的大数据与小数据(131209)一文,承蒙彭思龙研究员的推荐,修改后送到《中国计算机学会通讯》,至今渺无音讯,说明对小数据可能还有争议。中国人不爱标新立异,可能怕小数据会削弱大数据这个研究大方向。其实,“立异”才是创新的源泉。不立异,跟在人家后面喊,怎么能创新?我一直说,大数据分析与大数据技术不是一回事。大数据技术由IT行业来解决,而大数据分析要靠各行各业的专家。还有一种说法,说小数据是大数据的一部分,小数据集多了就变成大数据了。这完全是从字面上去理解大数据、小数据,在技术上它们是不同的,核心的技术问题也完全不同。不要碰到大量的数据,就给它戴上一顶帽子,“大数据”。就像20年前,系统工程也很时髦。哪管是做报告谈到一个比较大的工程,就说那是系统工程。可系统工程怎么样呢?“那是很难的”,没有下文了。这种概念,没有内涵,能说明什么呢?所以,我们应该敞开思想,研究实际问题,切忌空谈。

时间: 2024-09-12 05:44:30

大数据时代下小数据又被提起了的相关文章

大数据时代,小数据中心

文章讲的是大数据时代,小数据中心,中国(上海)国际数据中心技术设备展览会在上海隆重开幕.紧跟德国工业4.0的新趋势,威图(Rittal)携绿色.节能.可靠的数据中心系统解决方案登陆本次展会.在变革的大数据时代,威图(Rittal)将引领数据中心行业健康稳步发展. 展会现场,威图针对模拟的微模块.通道封闭系统,进行了实时监测,参观者可以通过液晶屏,直接了解数据中心内部各项指标信息.威图(Rittal)的微模块,它可根据客户需求在工厂进行预制,并可灵活拆卸,快速组装.威图(Rittal)的LCP机柜

大数据时代下的“数据失控”危机

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 麻省理工学院的阿莱克斯·彭特兰教授说"赤裸裸地站在数字聚光灯下接受审查不是人们应该得到的待遇",这句话听起来既包含着对改善人类当前数字化生活尴尬处境的坚决,又透露出对人们失去个人数据控制力的无奈.频繁发生的数据泄漏事件已经宣告了"数据失控"时代的到来. 在过去差不多十几年的时间里,我们毫无保留地把个人信息交给了互联网,这些信息

大数据时代的小数据

现在好像人人都爱说"大数据",就像平时我去开会,不是用大数据分析这个,就是用大数据建构那个.可是我最近看<美国计算机学会通讯>(CACM)上面提到了几次小数据,我觉得大家也有必要了解一下这个有趣的概念. 什么是小数据?小数据就是个体化的数据,是我们每个个体的数字化信息.比如我天天都喝一两酒,突然有天喝完酒了胃疼,我就想了,这天和之前有何不同?原来,这天喝的酒是个新牌子,可能就是喝了这个新牌子的酒让我胃疼.这就是我生活中的"小数据",它不比大数据那样浩瀚繁

大数据时代的“小数据”

如今,CIO们都已经接受了"大数据"的概念,另一个概念也逐渐受到关注:小数据. 这两者看似是相对立的两端,但是这不完全正确.小数据往往指数据量;而大数据当然也包含了数据量,但是也包含了多样性,时效性,特定的技术或者其他概念. Kirk Borne,是美国乔治梅森大学的天体物理学和计算机科学的教授, 他认为这两者的区别是很重要的.Borne有关大数据的课程专注于大数据的属性和先进的分析技术, 而这些也几乎总是可以应用于小数据.但是后者却可以使学生进行实验,磨练他们在数据分析上的技能.而大

大数据时代下的任意点,2亿步只是个小目标

 "大数据"早已成为这个时代炙手可热的关键词,有关"大数据"的表述已经连续四年被写进了政府工作报告.从引入概念到明确提出了大数据建设行动计划,再到今年的加快应用及推动变革,大数据技术及应用已经逐渐渗透.融入社会各个领域,并在不断推动互联网甚至传统产业的转型与升级.专家预测,在未来的5-10年,中国有可能成为世界上最大的信息技术市场.而大数据不仅是一种海量的数据状态及其相应的数据处理技术,更是一种思维方式,一项重要的基础设施,对未来经济和社会的发展而言举足轻重,这也是

大数据时代下商业调查展开全新变革

文章讲的是大数据时代下商业调查展开全新变革,"数据是新的石油."亚马逊前任首席科学家韦思岸如是说.全球最著名的管理咨询公司麦肯锡在一份名为<大数据,是下一轮创新.竞争和生产力的前沿>的专题研究报告中也指出:"对于企业来说,海量数据的运用将成为未来竞争和增长的基础." 随着IT技术的迅猛发展,商业活动更多基于精确的数据分析做出决策,而非领导层的"拍脑门"或"灵感迸发". 基于智能移动设备和移动互联网,运营付费移动调研

大数据时代下的银行业:围绕客户体验创新求变

大数据时代下的银行业:围绕客户体验创新求变 "中国金融服务业正在发生翻天覆地的变化,除了持续的金融系统改革外,中国的商业银行面临着更具挑战的客户预期以及诸多新机构的竞争.为了保持竞争优势,金融机构采取措施,利用更加先进的数据和分析能力,提供移动银行等数字渠道服务,提升客户参与度和全渠道体验."在6月23日举行的2016年中国国际银行会议上,亚洲银行家主席以理表示. 进入大数据时代,变革正在银行业中迅速蔓延.从银行家们的视角来看,大数据技术赋予了银行业新的转型驱动力,提升客户体验则成为现

大数据时代下的个人信息安全

伴随着科技进步,互联网及移动互联网的快速发展,云计算大数据时代的到来,人们的生活正在被数字化,被记录,被跟踪,被传播,大量数据产生的背后隐藏着巨大的经济和政治利益.大数据犹如一把双刃剑,它给予我们社会及个人的利益是不可估量的,但同时其带来个人信息安全及隐私保护方面的问题也正成为社会关注的热点.今年两会期间,维护网络安全被首次写入政府工作报告.全国政协委员.联想集团董事长兼CEO杨元庆也在会议上呼吁"政府对个人信息安全立法,加强监管,并在整个社会中树立起诚信文化".大数据时代下维护个人安

分析:大数据时代下的存储平台选择

文章讲的是分析:大数据时代下的存储平台选择,大数据是时下最热门的企业IT话题,那么大数据对存储有什么要求呢? 为了解决这个问题,我们首先来分析一下大数据的特点. Gartner对大数据下了一个简洁的定义:"大数据是需要新处理模式才能具有更强的决策力.洞察力和流程优化能力的海量.高增长率和多样化的信息资产." 所以,大数据既包含结构化数据也包括非结构化数据,而且是以数量巨大.变化率高的形式存在. 大数据如此热门的主要原因是因为它能提供可行性的见解.企业通常使用分析应用来提取大数据里的本来