备份界的特斯拉:解析初创公司Datos IO

 初创公司Datos IO就像是备份界的特斯拉,针对分布式应用重新设计了数据保护,并专注于高端客户,解决特定其他人无法解决的问题。

2016年6月发布之后的6个月中,Datos IO的RecoverX分布式数据库备份产品已经获得10家付费客户。该软件采用语意的重复数据删除功能作为其秘密武器之一,这就是为什么今天我们要来看一看这家公司的原因。

RecoverX备份运行在本地或者运行在AWS、Google或者其他云中的非关系型数据库。RecoverX 1.5版本支持Google Compute Engine以及Google Cloud Storage。它帮助Google Cloud Platform用户保护他们托管在非关系型数据库(NoSQL、图形等)的下一代应用,这些数据库部署在IaaS和PaaS环境中。

这10家客户来自于金融服务、零售、电子商务、媒体和娱乐、医疗和物联网。Ayla Networks是Datos IO的物联网客户,Datos IO主要是备份这家公司的AWS云基础设施和非关系型数据库。Ayla因为成本和无法扩展的问题认为基于脚本的备份不适合自己之后,决定购买RecoverX软件。

Datos IO的零售客户是一家财富100强的大型家庭装修零售企业,他们将现有的电子商务应用从本地数据中心迁移到Google Cloud Platform公有云上,以满足法规遵从标准并提高运营效率。

Cassandra DBA Ishinder Singh的推特上询问Home Depot是否是Datos IO的客户

另外一家客户是梭子鱼(Barracuda Networks)。

Datos IO表示:“RecoverX是基于Consistent Orchestrated Distributed Recovery (CODR),这个下一代横向扩展数据保护架构是基于可以自动扩展的弹性计算服务,避免了对媒体服务器的依赖,并将数据并行地发送到基于文件的或者基于对象的二级存储,或者从二级存储中迁移出来。CODR让RecoverX能够提供可扩展的版本控制,这样企业就可以以任何间隔或者颗粒度保护和备份他们的数据,从而实现操作恢复和测试/设备使用实例中一键点击、协调的、无需修复的恢复,此外行业首推的语意重复数据删除功能让客户可以节约高达70%的二级存储成本。”

那么什么是语意重复数据删除?Datos IO的网页上有一份可下载的PDF,是由包括Datos IO共同创始人、首席执行官Tarun Thakur,以及首席技术官Prasenjit Sarkar在内的多名作者撰写的研究论文。该论文谈到了下一代最终一致存储系统(NECST,例如像Cassandra和MongoDB这样的非关系型数据库)备份和恢复的问题,并建议“对保存在系统中的数据具有深度语意方面的了解是一种解决方案”。

这篇论文中写道,“这种现代化的系统是如何不再将数据保存在单一设备的磁盘(或者SSD)上,而是把数据以复制的方式分布于多台设备上;复制是以最终一致性的方式进行的……正如我们所说,核心问题很简单:工具和系统还无法实现对这些复杂的、多样化的、分布式的NECST系统下的数据具有有效的、一致的逻辑视图。”

然后他们说:

我们相信成功的关键是对保存在这些新型存储系统中的数据具有深度语意的了解。只有通过监控和检查I/O传输和重构其含义(例如是否达到定量,或者动地如何复制特定的数据条目)关键NECST管理功能才能得到有效地、可扩展地发挥其作用。

因此,语意重复数据删除的第一个特点就是,它是应用感知的,应用就是非关系型数据库。

语意了解的特点,或者数据库操作结构理解,包括:

仲裁协调——传统存储相对比较容易知道什么时候进行更新,与传统存储不同,了解什么时候应该对存储系统进行升级的这个简单任务却是存在诸多挑战的。NECST系统要求那些想要了解其中保存了什么内容的工具和系统要知道数据是如何以及何时安全地在系统中进行了复制。通过全面了解NECST复制协议,备份工具可以决定升级的顺序,从而形成一致的存储视图。

冗余拷贝检测——传统条带或者镜像系统中的冗余性是很容易观察到的,与之不同,NECST系统能够以不同数位的方式对数据拷贝进行编码。因此,NECST备份或者归档系统必须能够仔细梳理NECST系统,以确定逻辑上相同的拷贝在哪里,这样才能将其合并,从而实现存储高效的备份。

配置忽略的备份和恢复——分布式系统会频繁更改配置,纵向扩展以满足新的要求,或者在发生故障、系统掉线的情况下出现问题。NECST工具必须能够保存数据,然后重建数据,尽管事实是配置已经更改了。

Datos IO的CODR软件“对数据库进行全面快照;在这之后,CODR追踪数据库的变更,生成这些变更的增量版本,有一个版本是对横向扩展分布式数据库的集群一致快照”,我们得知:

完整快照和增量快照是并行传输到一个备份存储系统中的,这个系统可以是小规模部署中心的单一节点,或者是更大规模部署的一个集群。在备份库CODR必须处理本地快照集以发现一个版本。CODR通过运行集成仲裁和语意重复数据删除算法来做到这一点,最终结果是数据的单一拷贝,节省了空间。这意味着CODR中必须有算法是专门针对单独数据库产品的,不能简单地说一个新数据库产品是不具备语意(操作结构)知识的。

CODR部署示意图

在这里有几个视频,你可以了解关于Datos IO CODR是如何工作的。

RecoverX的年度订购许可是基于物理数据库大小容量层($/TB)。在6个月内只获得了10家客户意味着定价并不便宜,这些客户在切换到Datos IO之前他们可能已经被自己的备份和恢复操作搞的焦头烂额了。

为什么我们在文章一开始的时候说Datos IO是备份界的特斯拉呢?如果把Veeam、Veritas和Dell EMC比作是备份界的福特、通用和克莱斯勒,那么我们认为Datos IO就像是特斯拉,以他们自己的方式重新定义了人们的备份方式,专注于一种精心设计的、高端产品来打造他们的业务。

我们相信未来它会扩大在数据库方面的覆盖面,可能会在市场中遇到Veeam和Veritas的竞争,对于备份界来说这将是一个有趣的时刻。

原文发布时间为:2017年1月8日

本文作者:齐丰润

时间: 2024-10-27 14:15:45

备份界的特斯拉:解析初创公司Datos IO的相关文章

备份软件体系架构解析

从今天开始,我将陆续分享有关备份架构和特性系列知识,数据保护方案目前主要分了两大类,一类是备份,另一类是容灾.备份主要是对数据提供多副本冗余,当数据发生误操作.病毒感染和丢失等逻辑错误后,可以用备份副本进行恢复,保证数据少丢失或甚至不丢失,CDP也是一种实时数据备份技术. 然而容灾是保证业务连续性的一种技术,主站点和容灾站点数据基本一致,主站点的数据错误也会同步到容灾站点,所以,容灾技术是当业务发生逻辑或物理故障后,通过容灾切换迅速拉起业务并提供服务,保证业务连续在线. 备份技术概述 数据备份的

安防:激光对射周界报警系统原理解析系统组成

激光对射报警系统主要由激光发射机.激光接收机.报警主机及报警输出设备等四大部分组成. 激光对射报警系统主要由激光发射机.激光接收机.报警主机及报警输出设备等四大部分组成. 报警主机:根据防区设计的实际需要,选配能够控制和接收开关量信号的报警主机,常安装在中心控制室. 发射机:是能够发射一定功率激光的专用设备,它是由供电单元.激光发射控制器和结构安装机架组成. 接收机:它是由供电单元.激光控制器和结构安装机架组成. 工作原理 激光对射报警系统属于主动入侵报警系统.在警戒区域内安装有激光发射和接收机

SQLServer数据库备份及还原策略解析

a.数据丢失的原因: 程序错误 人为错误 计算机错误 磁盘失败 灾难(如火灾,地震)和偷窃 b.什么是备份 备份即建立数据的副本 用于在系统发生故障后还原和恢复数据 文件复制不等于备份 c.备份类型 完全备份:备份完成时刻的数据库提供了任何其他备份的基准 差异备份:事先已执行过一次完全备份,对上一次完全备份之后所有的更改的数据做备份 事务日志备份:事先已执行过一次完全备份,从上一次事务日志备份或者完全备份到当前事务日志的尾部截断已确认的事务日志的备份. 文件或文件组备份 d.SQL Server

虚拟机备份克隆导致SQL SERVER 出现IO错误案例

   案例环境:               服务器配置: CPU: Intel E5-2690  RAM: 12G   虚拟机             操作系统  : Windows Server 2008 R2 Standard Edtion   x64             数据库版本: SQL SERVER 2008R2   案例介绍:         晚上收到数据库一封告警邮件SQL Server Alert System: 'Severity 016' occurred on \\

NAS如何进行快速备份

如何对NAS进行快速备份已经成为NAS厂商和用户关注的一个问题,特别是IO瓶颈方面的问题.近来,Isilon公司简要介绍了一个新产品的补充,其中包括他们的备份加速器和操作系统OneFS的升级.他们所提供的把Isilon公司的产品线推到了存储主流,并且他们也继续专注解决存储IO瓶颈的问题,这个问题是越来越多的数据中心要面对的. 现在,NAS备份的实现方法一般是二选一,或者是跨成串文件系统备份,这种方法可能会碰到任何基于网络备份的所有问题,加上不得不通过NFS/CIFS协议连通:或者是通过NDMP直

【转】Orion - oracle提供的测试io性能的工具

Orion是oracle提供的测试io性能的工具.它可以用来模拟Oracle数据库IO,也可以用来仿 真ASM的条带化的功能. Orion可以支持下列IO负载 1. 小的随机的IO:OLTP的应用主要是随机的读写,大小和数据的块大小一样(一般是8K).这样的应用主要是关注的吞吐量是IOPS和一个请求的平均延时时间.Orion可以仿真一个随机IO负载.指定的读写百分比,指定的IO大小,指定的IOs,IOs是分布在不同的磁盘上. 2. 大的连续的IO:数据仓库的应用,数据装载,备份,和恢复会产生连续

PostgreSQL 最佳实践 - 块级增量备份(ZFS篇)多zfs卷场景一致性备份

背景 当我们使用了多个ZFS卷或者文件系统时,如果一个实例的多个部分,如表空间,放在了不同的zfs上,再使用基于ZFS快照的备份时,可能出现多个文件系统不一致的情况. 例如控制文件是新的,但是数据是旧的. 保物理备份的一致性检查 基于文件的物理备份,为了保证备份的一致性,在备份开始时,需要做一个检查点,同时打开FULL PAGE WRTIE,同时还会生成backup_label文件记录备份开始时的WAL文件,检查点位置等信息. backup_label文件内容示例 START WAL LOCAT

百度云iPad版开启“相册自动备份功能”教程

给各位百度云软件的用户们来详细的解析分享一下百度云iPad版开启"相册自动备份功能"的教程. 教程分享: 百度云iPad版开启"相册自动备份功能"方法:在"更多"中开启"相册自动备份功能". 开启该功能后,当你的iPad相册有新照片和视频时,打开百度云,上传列表会显示自动备份的进度条,将新照片和视频自动备份到云端,且仅在Wi-Fi下进行,不会浪费流量.   好了,以上的信息就是小编给各位百度云的这一款软件的用户们带来的详细的百

Windows Phone8备份功能怎么用? WP8系统手机备份教程

一.备份功能的基本设置 1.点击"设置"进入设置界面,点击"备份". 2.进入备份界面后,点击"应用列表+设置"可以进入应用列表界面. 3.点击备份开关,在"要关闭备份吗?"对话框中点击"关闭"就可以关闭手机备份功能. 二.应用列表的操作 1.手机连接网络后,点击"立即备份"可以将Internet Explorer收藏夹.已安装应用列表和大多数设置备份到云中,以便以后能够进行还原. 2.