大数据“显影”:Ayasdi用拓扑数据分析癌症

大数据蕴含的宝藏就在每个人的脚下,而Ayasdi这样的大数据创业公司能借你一双慧眼,从现有的数据中发现新的金矿。

最近,硅谷的创业公司Ayasdi最近刚刚完成了一笔1000万美元的融资,该公司利用拓扑数据分析的算法,来推动癌症的研究。

Ayasdi所代表的大数据垂直应用显然正在成为大数据投资的焦点之一,在IT经理网之前的文章:大数据的下一个热点在于应用软件中,我们曾指出:

就长期价值而言, 行业或细分市场的突破性大数据软件应用要超过目前火热的大数据基础设施平台。

旧数据里的新财富

斯坦福大学的学者Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton一直在致力于用拓扑学的方法, 进行数据分析。 拓扑学是一个很古老的数学分支, 从欧拉时代就开始研究,不过最近15年左右, 拓扑学开始和数据分析相结合, 用来发现大数据中的一些隐形的关系。 Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton在2008年, 觉得将这一技术进行商用。 于是成了了Ayasdi公司。 (Ayasdi来自印第安语, 意思是“寻找“)。 而Ayasdi的目标, 也是为了帮助用户从现有数据中进行一些新的发现。

用Ayasdi的创始人 Gunnar Carlsson的话说:

“人们先有数据, 然后根据这些数据提问, 按照不同的问题轨迹进行寻找答案。 而有的问题轨迹是正确的,有的则不一定正确。而Ayasdi的目标, 这是帮助用户回答他们还没想到的问题。”

Ayasdi成立以后,就获得了DARPA(美国国防部高级研究项目组)350万美元的资助。(编者:DARPA的很多项目都非常具有前瞻性, DAPRA的网络项目ARPANET就是现在Internet的前身)。 随后, Ayasdi的综合了机器学习和拓扑数据分析的技术引起了硅谷投资界的关注。

Ayasdi的技术的一个重要特点就是,不像别的系统需要类似搜索查询式语句。 Ayasdi可以自动从数据中发现隐藏的模式。

随着Khosla Ventures和 Floodgate等基金的投资到位, Ayasdi目前30人的技术团队将扩充, 同时将营销和销售也将展开。

Ayasdi的投资人Vinod Khosla 有句名言, 说将来80%的医生将会被机器代替。 他认为, Ayasdi的“机器智能”技术, 将使我们的探索能力达到过去难以企及的高度。从而帮助解决一些全球性的社会和经济问题。

让大数据“显影”

Ayasdi的一个应用就是在医学研究领域。 Mount Sinai医学院基因与多尺度生物学系的主任Eric Schadt就带领了一个团队,利用Ayasdi的技术进行一些疾病的遗传倾向的研究。 这些疾病中包括癌症。 Eric Schadt希望这种技术能够帮助找到一些新的发现, 从而可能带来一些治疗上的突破。

事实上, Ayasdi一直在美国各个顶级医院和药厂合作。 医院和制药公司可以从公开的信息源获得很多数据, 和他们自己的数据结合起来,进行一些新的研究。

Ayasdi的CEO Gurjeet Singh说:

“数据还是那些数据, 只是我们用了新的技术, 可以从这些数据里自动地得出一些新的发现。”

通过对一个累计采集15年, 被成千科学家研究过的数据集的分析。 Ayasdi的数据分析技术,帮助发现了乳腺癌的14个变种。 Ayasdi的算法发现了某一个基因子组的病人乳腺癌的存活率比较高。如果病人的基因是在这样的子组里, 可以免受化疗之苦。

风险基金Data Collective 的合伙人Matt Ocko是一个专注于大数据领域的投资人,他看到了这个医学上的突破的新闻后, 决定给Ayasdi投资。 他说:

目前,政府和企业的问题,不在于数据量的缺乏,而是对数据进行发现和直觉能力不足。 Ayasdi的技术, 能够在短时间内, 提高分析人员面对海量数据的直觉能力,这一点是个突破。

对于医疗行业而言,大数据财富其实就在脚下,甚至在那些被遗弃的数据中,(在本站“Rich Smolan:大数据的人类面孔”一文中提到一个例子,麻省理工学院的计算机科学家和密歇根大学计算机科学家创建了一个全新的计算机模型,可以分析那些被丢弃的心电图数据,发现被忽视的心脏疾病复发信号,并能大大改进今天的心脏病风险筛查技术。)

Ayasdi获得风险投资的青睐,从一个侧面表明,数据直觉化和数据分析创新才是医疗大数据的发展重点。

(责任编辑:蒙遗善)

时间: 2024-10-27 16:18:19

大数据“显影”:Ayasdi用拓扑数据分析癌症的相关文章

大数据下的又一创举:看Ayasdi如何用拓扑数据分析癌症

如果说大数据是一个资源丰富的藏宝库,那么开启宝库的钥匙就在我们每个人身上.Ayasdi这样的大数据创业公司能借你一双慧眼,让你找到自己身上的钥匙,打开大数据的宝库. 最近,硅谷的创业公司Ayasdi打算利用刚完成一笔1000万美元的融资,用拓扑数据分析的算法,来推动癌症的研究. Ayasdi所代表的大数据垂直应用显然正在成为大数据投资的焦点之一,在IT经理网之前的文章:大数据的下一个热点在于应用软件中,我们曾指出: 就长期价值而言, 行业或细分市场的突破性大数据软件应用要超过目前火热的大数据基础

大数据时代:统计学是数据分析的灵魂

7月中旬以来,从中央到地方,今年上半年经济社会发展的统计数据陆续进入人们的视野.在观察.使用统计数据时,类似"大数据时代怎样用好数据"这样的话题,再次引起人们的关注. 7月20日出版的<人民日报>,刊发了清华大学统计学研究中心主任刘军做客人民日报.人民网<文化讲坛>时,对相关问题所做的介绍和分析.其内容包括: 什么是数据? 数据(data)在拉丁文里是"已知"的意思,在英文中的一个解释是"一组事实的集合,从中可以分析出结论"

大数据能否挽救我父亲于癌症

(图为作者身患前列腺癌的父亲,作者母亲以及作者本人) (编者注:作者是美国GNS 医疗保健大数据分析公司的首席执行官和创建者之一) 我的父亲名叫Foster Hill,他在69岁时患上了三期前列腺癌.他是个很安静的人,年轻时的他经常被人称赞说长得像穆罕默德•阿里.20多岁时为了在甘蔗和旅游业之外寻找更好的机会,他从加勒比海那个很小的安提瓜岛移民到了加拿大. 他在一家著名的炼油厂当了化工技术员,业余时间里则坚持着他生命里真正热爱的事业 - 管风琴演奏.从我能记事时起,他就会在每个星期天去休伦湖附近

大数据时代 统计学依然是数据分析灵魂

在数据"爆炸"的时代,大数据常常被寄予厚望.到底,什么样的数据才算大数据,怎样才能用好大数据,传统统计学还有用武之地吗?清华大学统计学研究中心前不久成立,著名统计学家.哈佛大学终身教授刘军担任主任.日前,刘军做客人民日报.人民网<文化讲坛>,分享他的思考. 让大数据区别于数据的,是其海量积累.高增长率和多样性 什么是数据?数据(data)在拉丁文里是"已知"的意思,在英文中的一个解释是"一组事实的集合,从中可以分析出结论".笼统地说,

“大数据”时代,什么是数据分析做不了的?

不久之前我曾与一位大型银行的首席执行官一同用餐.他正在考虑是否要退出意大利市场,因为经济形势不景气,而且未来很可能出现一场欧元危机. 这位CEO手下的经济学家描绘出一片惨淡的景象,并且计算出经济低迷对公司意味着什么.但是最终,他还是在自己价值观念的指引下做出了决定. 这家银行在意大利已经有了几十年的历史.他不希望意大利人觉得他的银行只能同甘不能共苦.他不希望银行的员工认为他们在时局艰难之际会弃甲而逃.他决定留在意大利,不管未来有什么危机都要坚持下去,即便付出短期代价也在所不惜. 做决策之时他并没

大数据不是万精油:数据分析做不到的事

不久之前我曾与一位大型银行的http://www.aliyun.com/zixun/aggregation/32086.html">首席执行官一同用餐.他正在考虑是否要退出意大利市场,因为920.html">经济形势不景气,而且未来很可能出现一场欧元危机. 这位CEO手下的经济学家描绘出一片惨淡的景象,并且计算出经济低迷对公司意味着什么.但是最终,他还是在自己价值观念的指引下做出了决定. 这家银行在意大利已经有了几十年的历史.他不希望意大利人觉得他的银行只能同甘不能共苦.他

大数据工具为企业提供更多数据分析选择

在云端部署大数据应用时,企业有各种各样的选择,而且选择的数量还在不断增加中.拥有更多的选择意味着IT团队也要做出一些重要的决定.他们应该信赖云设备还是自己构建必要的基础架构呢? 大数据云设备的第一波浪潮始于去年.Cloudera.EMC.Yahoo旗下Hortonworks.Infobright.MapR Technologies和YottaStor都加入了这场游戏. 使用大数据设备对于企业来说有很多好处,首先是便捷.但是通常第三方大数据工具的高成本驳斥了这个好处. "厂商配置了这些类型的设备,

大数据产业迎来修正期 数据分析市场今年增速达14%

据美国国家风险投资协会的<资金树报告>,今年上半年共有1972笔投资,低于去年同期的2318笔.其中,软件业的形势继续良好,成为吸引风投资金最多的行业;然而风投资金正在变得更加集中于少数企业,基本上正在从早期投资转移向后期投资. 大数据产业正进入整合阶段,前几年出现过的超级交易,比如Cloudera在2014年的7.4亿美元融资,Hortonworks在同年的1.5 亿美元融资,今年不再见到.2013至2015年间涌现不少大数据初创公司,从数据分析.可视化.数据整合到自动化,某些领域的技术供货

游击式大数据软件使农民的数据分析速度加快了五倍

收集数据后,在批处理模式数据集市下聚集和查询数据,以获取商业智能,这是实际应用大数据及分析的主要方式.它还有助于为新兴国家的人们确保有一个公平的竞争环境,为他们节省时间,并且迅速深入了解数据查询情况. Springg就是个例子,荷兰的这家农业软件公司在与世界各地的农民合作.由于发展中国家缺乏基础设施,又认识到这些国家的农民需要与发达国家的农民那样同样可以访问农业信息,Springg想要找到一种方法,可以从田间获取宝贵数据,这些数据经评估后,可以将宝贵的信息迅速返回给较偏远地区的农民. Talen