数据可视化在数据分析领域算难度最高最具挑战性的部分,但它的重要性却不容我们质疑,实际上,可视化绝对算得上分析数据分析领域最重要的部分之一。当然,存储、数据库的查询处理以及算法都是非常的重要。而且离开它们可视化也无从实现。但是在一个数据驱动的世界里,它们只是处在基本层的位置。下面是6家初创公司,他们试图从根本上改变数据的可视化。其中有一些是高度复杂的可视化处理过程,有些不是。虽然没有一个是完美的,但他们所做的一切,会让我们反思:数据究竟意味着什么?
Ayasdi
Ayasdi来自印第安语,是“寻找”的意思。斯坦福大学的Gurjeet Singh, Gunnar Carlsson和Harlan Sexton一直在致力于将拓扑学的研究方法应用于数据分析。在2008年,他们联合成立了Ayasdi公司。Ayasdi成立以后,就获得了DARPA(美国国防部高级研究项目组)350万美元的资助。
Ayasdi的底层使用的是HBase数据存储,然后再利用拓扑数据分析技术和上百种机器学习的算法来处理复杂的数据集,最终确定数据节点之间的相似度。而对终端用户而言,这看起来更像是一个数据集的拓扑图,只是强调了集群中有关联的数据点。
Ayasdi的技术有一个重要的特点,它不像别的系统需要类似搜索查询式语句,Ayasdi可以自动从数据中发现隐藏的模式。Ayasdi的一个应用就是在医学研究领域,Mount Sinai医学院基因与多尺度生物学系的主任Eric Schadt就带领一个团队,利用Ayasdi的技术进行一些疾病的遗传倾向的研究,而且利用Ayasdi的数据分析技术,帮助发现了乳腺癌的14个变种。
BeyondCORE
实际上BeyondCore运作的基本前提和Ayasdi是相同的——只是展示给用户显著相关的联系,而无需考虑这个结果是如何发现的——虽然BeyondCore使用的是标准化图表,但是事实上还提供了另一种选择:在发现软件发现关联性结果时,会让化身(见图片)通知用户。
ClearStory
ClearStory拥有一个独一无二的产品,即使该产品的很多细节并没有公布。也许只有在产品正式发布之后,我们才能“一睹真容”。ClearStory将与存储在数据库、网络和其他来源的数据连接,在数据源变化时进行动态的更新,并加入虚拟的数据挖掘组件,使用户分析数据并理解信息。在今年3月份,ClearStory获得了来自谷歌风投、安德里森·霍洛维茨、Khosla Ventures等多家风投的青睐,融资金额不详。
Datahero
Datahero是由来自Aster Data的大数据分析业务骨干Chris Neumann、宝马的高级工程师Jeff Zabel联合创立,该公司尚在起步阶段就获得了100万美元的融资。他们打着“你的数据你做主”的口号,试图弥合大数据与普通用户之间的鸿沟,不仅帮助用户分析密切相关的数据,而且通过可视化的形式,让用户更好地理解这些数据。
据外媒报道,Datahero是基于浏览器的一个平台,数据的输出、整理以及解释都会在一个单独的窗口完成,而不是通常意义上的借助不同的应用。通过浏览器,用户可以将多种网络服务的信息输入到Datahero,也可以从公共的数据库下载报告,还可以直接在本地把电子表格及文件上传到Datahero。Datahero会根据它的算法自动为这些信息归类,并给他们加上标签。
Platfora
初创公司 Platfora声称“要把Hadpoop平民化”。该公司认为只有把冗杂的数据进行有效处理、视觉化,让数据变成普通的用户都能看得懂的东西,“大数据”才能真正变成一盘生意,这家大数据创业公司已经获得了2000万美元B轮融资。
Platfora在Hadpoop的基础上进行数据的操作,并为用户提供一个简单易用的操作平台。因为Hadpoop有很多不同的发行版,所以Platfora的重点之一就是确保它能在所有的发行版上运行,这样大大降低了Hadpoop的使用门槛,让更多的人能够体验Hadpoop的技术优势,实现真正意义上的“平民化”。
Zoomdata
初创公司ZoomData是为数不多的支持移动设备的数据分析公司,它们的数据可视化系统能够将实施的大数据流转化为触屏友好的、艺术感十足的三维数据。苹果iPad和Android平板电脑用户可以用手指缩放数据可视化界面,随着界面缩放的级别不同,数据将实时进行更新。ZoomData的数据可视化技术支持多种数据源,包括社交媒体、企业应用系统以及Hadoop HDFS数据。