Distributed File System(簇文件系统)

Distributed File System(簇文件系统)

我吧分布式文件系统分为三类,聚合文件系统,全局文件系统,负载均衡文件系统。除了gfs其他文件系统都是建立在本地文件系统之上的网络文件系统。

几乎所有DFS都能通过fuse mount 到本地,但有些DFS mount 后性能不佳。

3.1. 聚合文件系统

以NFS, glusterfs 为代表,其特点是server独立运行,Server与Server间没有通信,然后访问者将其聚合组织并规划目录,为client提供数据共享。

glusterfs 可以实现Mirror与Strip等更复杂的组合,但全由client完成,server之间没有交互。


+-------------------------+        +-----------------------+
| Client                  |       /| Images Data           |
+-------------------------+      / +-----------------------+
| /mnt                    |     /  +-----------------------+     +--------------------+
| /mnt/images             |<----  /| Include Data          |     | Design by neo chen |
| /mnt/include            |<------ +-----------------------+     +--------------------+
| /mnt/lib                | ...    netkiller.github.com
| /mnt/data               | ...    +-----------------------+
| /mnt/data/backup        |<-------| Backup Data           |
+-------------------------+        +-----------------------+

3.2. 全局文件系统

如 gfs,它可以提供server间文件系统协商,同步元数据等等。常规文件系统只能用于本地硬盘,如果两个服务器同时mount iscsi存储,会出现A服务器写入后,B服务器无法看到A刚刚写入的数据,如果两台同时写入数据,会损坏文件系统。


		    +--------------------------------+
		    | Server Load Balancing          |
		    +--------------------------------+
		                    |
		                    V
--------------------- 1Gbps Ethernet ---------------------
            |                                |
            |        netkiller.sf.net        |
            V                                V
+------------------------+        +-----------------------+
| Server Master          |        | Server Master / Slave |
+------------------------+        +-----------------------+
| /u01                   |        | /u01                  |     +--------------------+
| /u02                   |        | /u02                  |     | Design by neo chen |
| /u03                   |        | /u03                  |     +--------------------+
+------------------------+        +-----------------------+
          |   |                             |   |
          V   V                             V   V
--------------------- 10Gbps Ethernet ---------------------
                           |  |
                           V  V
              +----------------------------+
              | IP SAN - ISCSI target      |
              +----------------------------+
              | LUN0 | LUN1 | LUN2 | ...   |
              +----------------------------+

3.3. 负载均衡文件系统

这种文件系统通常至少有三部分组成,存储节点,访问节点,管理节点。不同的系统叫法不同,但其原理相同。

存储节点,负责数据存储,数据通过hash散列

访问节点,用户通过该节点访问数据,做数据上传下载。访问方式分为点对点与三角方式

管理节点,服务数据Mirror,Strip等,元数据同步等等...

点到点系统只提供一个访问入口,如:MooseFS

          +--------------------------------+
          | User                           |
          +--------------------------------+
          | mount ip_address => /mnt/test  |
          +--------------------------------+
                          |
                          V
------------------ 1Gbps Ethernet ---------------------
         |                                   |
         V                                   V
+-------------------------+       +----------------------+
| Manager Node            |       | Access node          |
+-------------------------+       +----------------------+
| Mirror | Strip |  ...   |       | Index                |
+-------------------------+       +----------------------+
		 |
		 V
--------------------- 1Gbps Ethernet ---------------------
         |                                     |
         |            netkiller.sf.net         |
         V                                     V
+---------------------+              +--------------------+
| Data Node           |              | Date Node          |
+---------------------+              +--------------------+
| 01 02 03 ...    10  |              | 01 02 03 ...    10 |     +--------------------+
| 0A 0B 0C ...    0F  |<-- Mirror -->| 0A 0B 0C ...    0F |     | Design by neo chen |
| FA FB FC ...    FF  |              | FA FB FC ...    FF |     +--------------------+
+---------------------+              +--------------------+
三角链路

          +--------------------------------+
          | Server Load Balancing          |
          +--------------------------------+
                          |
                          V
------------------ 1Gbps Ethernet ----------------------------------
         |                               |                  |
         V                               V                  V
+-------------------------+       +-------------+    +-------------+
| Manager Node            |       | Access Node |    | Access Node |
+-------------------------+       +-------------+    +-------------+
| Mirror | Strip |  ...   |       | Index       |    | Index       |
+-------------------------+       +-------------+    +-------------+
		 |
		 V
--------------------- 1Gbps Ethernet ---------------------
         |                                     |
         |            netkiller.sf.net         |
         V                                     V
+---------------------+              +--------------------+
| Data Node           |              | Date Node          |
+---------------------+              +--------------------+
| 01 02 03 ...    10  |              | 01 02 03 ...    10 |     +--------------------+
| 0A 0B 0C ...    0F  |<-- Mirror -->| 0A 0B 0C ...    0F |     | Design by neo chen |
| FA FB FC ...    FF  |              | FA FB FC ...    FF |     +--------------------+
+---------------------+              +--------------------+

这种文件系统的特点是,当用户访问文件系统时,首先访问管理节点,管理节点会返回一个数据地址,用户再从访问节点的地址取得数据。

以MogileFS为代表

某些系统甚至直接使用反向代理或者WEB服务器作为访问节点。这种系统非常适合多媒体数据存储。通过负载均衡可能实现横向与纵向灵活扩展

时间: 2024-09-27 15:33:26

Distributed File System(簇文件系统)的相关文章

第 21 章 Distributed File System(簇文件系统)

我吧分布式文件系统分为三类,聚合文件系统,全局文件系统,负载均衡文件系统. 除了gfs其他文件系统都是建立在本地文件系统之上的网络文件系统. 几乎所有DFS都能通过fuse mount 到本地,但有些DFS mount 后性能不佳. 还有一个与分布式文件系统密切相关的,就是块设备,块设备不是文件系统,可以称为裸设备. 21.1. 聚合文件系统 以NFS, glusterfs 为代表,其特点是server独立运行,Server与Server间没有通信,然后访问者将其聚合组织并规划目录,为clien

笔记:Ceph: A Scalable, High-Performance Distributed File System

关于Ceph的名篇.Ceph是现在很火的一个存储系统,不同于HDSF主要是面向大数据应用,Ceph是立志要做一个通用的存储解决方案,要同时很好的支持对象存储(Object Storage),块存储(Block Storage)以及文件系统(File System) .现在很多Openstack私有云的存储都是基于Ceph的.Ceph就是基于这篇论文做得. 摘要 很明确的指出了Ceph的使命: We have developed Ceph, a distributed file system th

GFS - The Google File System

The Google File System http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.125.789&rep=rep1&type=pdf http://www.dbthink.com/?p=501, 中文翻译   Google牛人云集的地方, 但在设计系统时, 却非常务实, 没有采用什么复杂和时髦的算法和机制  设计大型系统, 最重要的就是, 简单和可靠, 复杂就意味着失控... 在设计GFS, 首先一个选择就是,

bigtable: A Distributed Storage System for Structured Data

bigtable: A Distributed Storage System for Structured Data http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//archive/bigtable-osdi06.pdf http://www.dbthink.com/?p=493, 中文翻译   总结 A Bigtable is a sparse, distri

GFS, HDFS, Blob File System架构对比

分布式文件系统很多,包括GFS,HDFS,淘宝开源的TFS,Tencent用于相册存储的TFS (Tencent FS,为了便于区别,后续称为QFS),以及Facebook Haystack.其中,TFS,QFS以及Haystack需要解决的问题以及架构都很类似,这三个文件系统称为Blob FS (Blob File System).本文从分布式架构的角度对三种典型的文件系统进行对比. 我们先看GFS和HDFS.HDFS基本可以认为是GFS的一个简化版实现,二者因此有很多相似之处.首先,GFS和

ganglia - distributed monitor system

传统的监控系统, 通常采用agent+server的方式, agent负责收集监控信息, 主动或被动发送给server, server负责向agent请求监控数据(agent被动), server和agent都通常使用TCP来进行连接.  传统监控的主要弊端, 当被监控的主机很多的情况下, server端的压力会很大, 例如要监控2万台主机的30个监控项, 就有60万个监控数据要从agent收集, 假设每分钟收集一次监控数据, 每秒需要上千次的metric get请求.  ganglia的设计思

nilfs (a continuent snapshot file system) used with PostgreSQL

NILFS 是NTT开发的一个文件系统, 持续的提供快照, 为误操作提供回滚可能.  相比lvm的快照, nilfs更有利于SSD环境. 因为在写频繁的环境中不需要大量的cow.  简介 :  http://nilfs.sourceforge.net/en/ NILFS is a log-structured file system supporting versioning of the entire file system and continuous snapshotting which

checking file system on win7开机自检

有时我们会电脑遇到这样一个问题,每次开机都出现这个"checking file system on d或e".这是什么意思,怎么解决?今天小编就和大家一起分析下. checking file system on 是什么意思? 电脑开机出现checking file system on D,从开机的错误提示可以看出,属于D盘有错误导致的.一般如果电脑某个磁盘产生错误即可容易导致此类故障的发生,一般伴随着开机会有相应的提示信息,如checking file system on D/E/F等

Distributed Message System

http://dongxicheng.org/search-engine/log-systems/ 包括facebook的scribe,apache的chukwa,linkedin的kafka和cloudera的flume   Kafka http://www.cnblogs.com/fxjwind/archive/2013/03/22/2975573.html http://www.cnblogs.com/fxjwind/archive/2013/03/19/2969655.html    F