大数据技术市场正处于这样一个阶段:Garnter认为是从IT主导的、报告系统转向业务主导、自助式服务分析的最后阶段。其结果是出现了很多新业务智能和分析平台可以满足企业机构对可访问性、敏捷性和更深入的分析洞察力的要求。
现在有很多初创公司提供这种下一代系统,他们开发新技术用于收集、管理和分析大数据,不管这些数据是结构化的还是非结构化的、动态的还是静态的、本地的还是在云中的。
下面就是2016年引起我们注意的10个很酷的大数据初创公司。
Anodot
CEO: David Drai
Anodot在2015年11月走出隐身模式,推出了实时异常检测和操作智能技术——拥有机器学习专利算法的软件,可以自动进行业务分析、查明性能问题并寻找商业机会。Anodot的目标是从大量数据中查找异常值,并将这些结果转化为有价值的业务洞察。
Anodot的技术旨在用于电子商务网站、数字广告系统和物联网网络,以提高运营效率,最大限度增加收入。
Anodot位于以色列的Ra'Anana,以及加州的桑尼维尔,在9月的B轮融资中获得了800万美元。
Confluent
CEO: Jay Kreps
在大数据管理和分析中,处理实时的流式数据是最大的挑战之一。解决这个问题的其中一项技术就是开源的Apache Kafka通讯代理项目,提供了高吞吐、低延迟的软件,用于处理实时数据。
Confluent是由Apache Kafka创始开发者创建的,提供了一个围绕Kafka的完整实时数据平台,可作为一个容错的、高度可扩展的通讯系统。该软件可用于手机来自用户活动日志、股票行情系统、设备仪表的数据,以及其他广泛用例中的数据。
今年5月,这家位于加州帕洛阿尔托的公司宣布提供Confluent Platform 3.0,通过融合Kafka Streams把流处理能力添加到应用中,还有在企业机构上下操作Kafka的Confluent Control Center。
Koverse
CEO: Jon Matsuo
Koverse开发了一款“盒中数据湖”的平台,并称它可以收集大数据并更快速地运用于生产中,其成本要低于现有的技术和方法。
这家位于西雅图的公司创建于2012年,最早的1.0版本是在两年前首次公布的。Koverse Platform 2.0是在6月发布的,将Apache Accumulo“分布式键值库”技术和该公司自己的Universal Indexing Engine结合到一起。
联合创始人Paul Brown(首席产品官)和Aaron Cordova(首席技术官)曾经是美国国家安全局的数据科学家,在那里他们帮助开发了最早的Accumulo项目,重新架构了国家安全局的数据基础架构,以更好地处理意外的数据分析情况。
Maana
CEO: Babur Ozden
Maana开发了Maana Knowledge Platform,这个数据搜索和发现软件是从大量系统或者“孤岛”中收集数据,并将其转变为可以被业务线应用采用的业务洞察。该系统是构建在Apache Spark处理引擎的。
Maana位于加州帕洛阿尔托,创建于2012年,在2015年5月正式发布,定位是收集和分析由物联网网络生成的大量数据。9月该公司首次公布了其产品的Winter '17版本,Knowledge Applications用于优化像供应链和呼叫中心管理这样的业务流程,Knowledge Assistants用于创建新的分析模型。
Maana在2016年5月进行的B轮融资中获得2600万美元,气走好难过大部分来自该公司的石油和天然气及行业客户,包括壳牌、雪佛龙、沙特阿美、英特尔和通用电气等公司。
Pachyderm
CEO: Joe Doliner
掌握着当前一代大数据技术的初创公司Pachyderm,已经开发出了一种开源分析引擎,采用Docker容器做分布式计算。
这里的重点是提供了一个容器化、模块化、可扩展的数据分析基础设施,采用像Docker和Kubernetes这样的工具作为构建块。该公司的Pachyderm File System和Pachyderm Pipeline System软件帮助数据经理和分析师构建机器学习通道和数据ETL(提取、转换和加载)工作流程。
Pachyderm创建于2014年,位于旧金山,在今年6月的种子轮融资中获得了200万美元。
StreamSets
CEO: Girish Pancha
StreamSets是另外一家解决管理动态数据挑战的公司。更具体地说,StreamSets开发的软件防止“数据漂移”的潜在问题——数据在源头的时候可能会遇到这种不可预测的突变情况,并在应用使用这些数据的时候出现问题。
StreamSets的StreamSets Data Collector软件被用于在任何数据源和任何应用之间构建复杂的数据流。9月,StreamSets首次推出了StreamSets Dataflow Performance Manager用于管理数据流操作。
StreamSets位于旧金山,创建于2014年,创始人包括CEO Girish Pancha、前Informatica首席产品官、现首席技术官Arvind Prabhaker,以及前Cloudera的早期员工、工程负责人。
Striim
President and CEO: Ali Kutay
Striim创建于2012年,创始人包括来自Golden Gate Software、Oracle、Informatica、WebLogic以及其他知名数据管理公司的前高管。
Striim公司位于加州帕洛阿尔托,它的软件将流数据集成与流操作智能结合到一个系统内,实现持续的查询/处理和流式分析。11月,Striimfault了新版本软件,可以配合Google Big Query、Kafka和MapR Technologies使用。
Striim在3月获得了1000万美元的额外资金,使其B轮融资的总金额得到了3000万美元。
Stytch
CEO: Mark Cunningham
Stytch在4月首次推出了自己端到端的数据分析平台,提供系统工具用于自助服务式的数据准备、数据建模、数据发现、报告和仪表板。Stytch得到了Dun & Bradstreet的支持,Stytch系统的主要卖点是它连接到了Dun & Bradstreet庞大业务数据库。
这家位于温哥华的公司创建与2015年8月。创始人、首席执行官Mark Cunningham从1992年就涉足商业智能领域,当时他的家族企业开始开发Crystal Reports,一款早期的、非常成功的Windows报告工具。
Talena
CEO: Nitin Donde
Talena提供了“永远在线”的大数据管理软件,帮助企业保护有价值的数据资产,并基于关键业务应用快速迭代。Talena的技术提供了备份和恢复、测试和开发管理、以及跨Hadoop、NoSQL数据库(例如Cassandra和Couchbase)以及现代数据仓库(例如HPE Vertica)的归档能力。
今年3月Talena发布了针对大数据管理任务的ActiveRx预测分析基础设施。该软件解决了如何将机器学习用于预测数据可用性、如何将备份数据转变为动态数据资产的问题。
Waterline Data
CEO: Alex Gorelik
随着企业机构将基于Hadoop的数据湖聚合起来用于存储海量数据,找到如何以最佳方式利用这些信息就变成一个重大挑战——更不用说随之而来令人头疼的数据治理问题了。
Waterline Data解决了Smart Data Catalog软件的问题,构建了一个完成的数据湖资产库,改善了数据发现和数据监管,让企业更容易从这些资产中获取价值。
Waterline Data创建于2013年,位于加州山景城,在1月的B轮融资中获得1600万美元。
原文发布时间为:2016年12月18日
本文作者:孙博