生命之圈:生物数据可视化的美丽新方法

当Martin Krzywinski在加拿大的迈克尔·史密斯基因组中心做系统管理员时,他并没有打算成为21世纪的生物学数据可视化的先驱。事实上,他甚至没有生物学的背景,虽然他已经完成了物理学和数学的研究生课程。但那是上世纪90年代末,他能够操控一台电脑。

Krzywinski建立了该中心的第一个信息系统,加强了其安全性,设计并优化了键盘布局,基本把极客能做的事情都做了。与此同时,他开始帮助研究人员做他们的项目,逐渐了解了他们的数据和数据的潜力。剩下的就是创造历史了。

急速下降的DNA测序价格以及细胞复杂性的日益增加很快释放了基因数据的洪流。但是,收集数据的工具已经远远超过了那些描绘数据的工具。Krzywinski说:“我很沮丧,阅读了大量的科学论文却不理解他们在说什么。我只是希望它们能够变得更简单,我没办法做什么使生物学更加简单,但我开始嘱咐人们做出更清晰的图(来描绘生物学)。”

为了做到这一点, Krzywinski开发了Circos ,一个开源的可视化工具用来以圆形排列表格数据。这是一个简单的想法,但具有革命性的意义:它已经数千次被用于可视化,并成为了我们当下信息丰富性的独特审美代名词。

从右上角顺时针看,人类、黑猩猩、老鼠、斑马鱼的基因排列成一个圆圈,每一个颜色方格对应一对染色体颜色。线条相连类似DNA序列,只是在视觉上强调,我们与其它物种共享多少基因。(图:Martin Krzywinski/EMBO)

这是英国图书馆正在进行的项目,从马到鸭嘴兽,对比16个不同物种与我们基因的不同。在每个小格中,一个圆圈代表与一个人类染色体之间的对比结果,人类的基因沿着圆的下半部分排列,而给定物种的整个基因组则位于圆的上半部分。(图:Martin Krzywinski)

在1848年9月13日,一次爆炸使得一根铁棒穿进了铁路建筑工头Phineas Gage的头骨。令人难以置信的是,Gage活下来了,但他的个性和气质发生了巨大的变化,这使他成为早年的行为神经解剖学教科书的案例。在这幅图像中,研究人员为那根铁棒如何扰乱人脑的特定系统建立模型,排列在Circos图的圆周上,它们之间的联系用连线表示。(图:Van Horn 等/PNAS)

对于这幅图像,Krzywinski试图以一种新的方式来思考基因组,转换它们的特征(即重复内容的数量)为方向矢量。他说:“现在,这些基因组都有意想不到的形状,这只是纯路径算法。有的图是圆形,有的图看似像大陆或国家的形状。我只是认为这是用一种令人吸引的方式来看基因组,而不只是给出一个序列。”(图:Martin Krzywinski)

对于信息设计者,π值是非常具有魅力的。Krzywinski为了绘制这两幅图,用颜色对数组编码,左图中,显示的是π值的前3422位;右图中,显示的是π值的前123,201位,它们以阿基米德螺旋状排列。(图:Martin Krzywinski)

乱糟糟的毛球:像这样的可视化帮助激发了Krzywinski的工作灵感。通常所说的毛线团,被用于将网络间的相互作用可视化。在正确的场景中,它们非常有用,但是当网络变得庞大而复杂时,它们没有辜负它们的绰号。Krzywinski说:“许多毛球看起来是随机的,而且许多时候,它们的结构会迷惑我们而让我们陷入思考我们知道某些实际上不知道的东西。”例如,上面的毛球来自于人类蛋白质的相互作用图,暗示了实际上并不存在的架构。研究人员写到:“明显地,黄色的节点带是图布局算法的一个伪影。”。该算法并没有解释红和蓝边缘明显的分离,但是人的裸眼能识别。(图:Rual 等/Nature)

Krzywinski最新的可视化工具是Hive Plot,在Hive Plot中网络节点被分配给有属性定义的轴,比如:连通性、密度、中心度。正是如此排列,结构特征变得明显,上图中,处于上方的是现在的E. coli(左)和Linux(右),对比处于下方的原来版本的结构特征要明显很多。Krzywinski说过,设计hive plots或者任何可视化的关键是要了解需要强调什么参数。虽然一些信息学家仍然相信,只要有足够的数据,就能按照规则简单地呈现原始数据。他说:“我不相信那个,你需要策划和解释。结果不会就这样出现。”(图:Martin Krzywinski)

在这里,研究人员比较三株拟南芥(一种经常被用来研究植物遗传模式的植物)和它们共同的祖先。每一株的基因组被放置在一个轴上;如果它们来自同一祖先序列,这两个区域就派生相连。(图:Mandáková 等/植物细胞)

Circos不仅用于比较基因组,也用于描绘它们,比如Gloeobacterviolaceus,一种最原始的光合细菌品种之一的直系后裔。虽然这张图无疑对科学家比对一个门外汉富含更多的意义,它仍然是一个引人注目的图:相比于十年前基因组的可视化,是意义深远的,并且明显更加丰富的。图:Saw等/ PLoS One

并非所有的Krzywinski的工作都涉及到数据可视化。这些小鼠胚胎血管图像是去年一期美国国家科学院院刊的封面图片,它来自多个微观横截面图像的合成,它们的颜色根据哈勃太空望远镜的照片和《星际迷航》进行了调整。Krzywinski说:“现在可以说已经完成了我的一个人生目标了,使生物学看起来像天体物理学”。(图: Krzywinski / PNAS)

原文发布时间为:2015-09-22

时间: 2024-08-03 04:25:57

生命之圈:生物数据可视化的美丽新方法的相关文章

用Python进行数据可视化的10种方法

引言 艺术之美根植于其所传达的信息.有时候,现实并非我们所看到或感知到的.达芬奇(Da Vinci)和毕加索(Picasso)等艺术家都通过其具有特定主题的非凡艺术品,试图让人们更加接近现实. 数据科学家并不逊色于艺术家.他们用数据可视化的方式绘画,试图展现数据内隐藏的模式或表达对数据的见解.更有趣的是,一旦接触到任何可视化的内容.数据时,人类会有更强烈的知觉.认知和交流. 在数据科学中,有多种工具可以进行可视化.在本文中,我展示了使用Python来实现的各种可视化图表. 怎样才能在Python

数据可视化是如何被创造出来的

我多次被炫目的数据可视化或信息可视化震惊,在我知道这些图片背后的数据来源和创造历程后,更是为之诧异不止.它涉足制图学.图形绘制设计.计算机视觉.数据采集.统计学.图解技术.数型结合以及动画.立体渲染.用户交互等.相关领域有影像学.视知觉.空间分析.科学建模等. 这是创造性设计美学和严谨的工程科学的卓越产物.用极美丽的形式呈现可能非常沉闷繁冗的数据,其表现和创作过程完全可以称之为艺术.所以我翻译了来自SM上的3篇数据可视化和信息图形的文章,主要是鉴赏并提供一些参考资料.我尽量查找了每张数据图表背后

传媒大学沈浩:数据可视化的前世今生

文章讲的是传媒大学沈浩:数据可视化的前世今生,今年春节期间,百度基于LBS(基于地理位置的服务).大数据和可视化技术推出了"百度迁徙",结合央视的报道,首次实现了全程.动态.即时.直观地展现中国春节前后人口大迁徙的轨迹与特征,也让老百姓真正体会到了大数据的价值. 由此可见,大数据在可视化后更容易被人们接受和理解.在中国传媒大学的校园里,有一位老师对数据可视化也非常推崇,他经常对自己的学生说"只有看得见,才能做得到;只有看得见,才能做得好"--他就是沈浩教授. 沈浩教

大数据可视化的最新动态

引言 数据可视化 是将数据以不同形式展现在不同系统中,其中包括属性和变量的单位信息.基于可视化发现数据的方法允许用户使用不同的数据源,来创建自定义分析.先进的分析集成了许多方法,为了支持交互式动画在台式电脑.笔记本电脑或平板电脑.智能手机等移动设备上创建图形桌面.根据调查,表1显示了数据可视化的好处. 对于可视化有以下几点建议 大数据 是大容量.高速度并且数据之间差异很大的数据集,因此需要新的处理方法来优化决策的流程.大数据的挑战在于数据采集.存储.分析.共享.搜索和可视化[5] 1."所有数据

Python数据可视化1.3 数据可视化历史

1.3 数据可视化历史 可视化的历史悠久,最早用墙上的原始绘图和图像,表中的数字以及黏土上的图像来呈现信息.然而,它们并没有被称为可视化或数据的可视化.数据可视化是一个新术语:它传达出可视化不仅仅是以图表的形式展示数据.数据背后的信息应该用效果良好的图表直观揭示出来:图表本身应该帮助读者看到数据结构. 计算机出现前的可视化 在巴比伦时代早期,图片被绘制在黏土上,随后被渲染在纸草上.那些图的目标是给人们提供对信息的定性理解.众所周知,作为一种信息的可视化展示,我们对图片的理解是一种本能,因此理解过

大数据可视化的新进展

在简化数据量和降低大数据应用的复杂性中,大数据分析发挥着关键的作用.可视化是其中一个重要的途径,它能够帮助大数据获得完整的数据视图并挖掘数据的价值.大数据分析和可视化应该无缝连接,这样才能在大数据应用中发挥最大的功效.这篇文章将介绍一些常规的数据可视化方法以及在大数据应用领域突破常规的可视化手段,也会讨论大数据可视化带来的挑战,同时介绍大数据可视化领域新的方法.应用程序以及其技术的进步. 一.引言 数据可视化是将数据以不同形式展现在不同系统中,其中包括属性和变量的单位信息[1] .基于可视化发现

数据可视化设计:给数据穿上美丽的外衣

文章描述:如今,在设计,通讯,信息及数据新闻,用户界面多个领域都可以见到数据可视化的身影,引入视觉设计的数据大大提升了说服力,可读性和逻辑性都得到了增强,他带来的不仅仅是颠覆表格那么简单,而是一种思想理念,它不仅把可视化信息作为一种沟通工具:同时也是一种重要的 如今,在设计,通讯,信息及数据新闻,用户界面多个领域都可以见到数据可视化的身影,引入视觉设计的数据大大提升了说服力,可读性和逻辑性都得到了增强,他带来的不仅仅是颠覆表格那么简单,而是一种思想理念,它不仅把可视化信息作为一种沟通工具:同时也

惊艳全球数据行业的16个数据可视化例子

文章讲的是惊艳全球数据行业的16个数据可视化例子,数据是非常强大的.当然,如果你能真正理解它想告诉你的内容,那它的强大之处就更能体现出来了. 通过观察数字和统计数据的转换以获得清晰的结论并不是一件容易的事.必须用一个合乎逻辑的.易于理解的方式来呈现数据. 谈谈数据可视化.人类的大脑对视觉信息的处理优于对文本的处理--因此使用图表.图形和设计元素,数据可视化可以帮你更容易的解释趋势和统计数据. 但是,并非所有的数据可视化是平等的.(点击"为什么大多数人的图表和图形看起来像废话"了解我想表

16个数据可视化例子告诉你数据分析是如何惊艳全球的

通过观察数字和统计数据的转换以获得清晰的结论并不是一件容易的事.必须用一个合乎逻辑的.易于理解的方式来呈现数据. 谈谈数据可视化.人类的大脑对视觉信息的处理优于对文本的处理--因此使用图表.图形和设计元素,数据可视化可以帮你更容易的解释趋势和统计数据. 但是,并非所有的数据可视化是平等的.(点击"为什么大多数人的图表和图形看起来像废话"了解我想表达的意思) 那么,如何将数据组织起来,使其既有吸引力又易于理解?通过下面的16个有趣的例子获得启发,它们是既注重风格和也注重内容的数据可视化案