基于Hadoop的云安全存储系统的设计与实现

基于Hadoop的云安全存储系统的设计与实现

广东工业大学  蒋向阳

云计算是分布式计算、并行计算和网格计算的发展,给人类生活、生产方式和商业模式带来根本性改变,是当前全社会关注的热点之一。云存储是从云计算概念上延伸发展出来的一个新的概念,它是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。随着云计算技术与云存储技术的广泛应用,其存在的安全问题不断突显出来,安全问题已成为阻碍云计算和云存储发展的关键因素。Hadoop是Apache软件基金会下的一个开源分布式计算平台,为开发者提供了一个分布式系统的基础架构,用户可以在不了解分布式系统底层细节的情况下开发分布式应用。分布式文件系统HDFS作为Hadoop的核心组件,具有强大的存储能力,适合作为云存储系统,但是其设计上存在一些缺陷,仍在不断发展之中,存在改进与完善的空间。本文研究了HDFS多副本存储技术和身份认证技术,针对其中存在的问题提出了改进方法。研究了基于Hadoop的云计算环境下数据存储的安全问题,设计了云安全存储系统,且实现了系统原型。主要工作如下:(1)分析了HDFS多副本存储方案存在的存储效率不高、容易出现负载不均衡的问题,提出了一种基于信息分散法的分布式存储方案,设计了一个改进的文件块存放策略,进行了仿真实验,验证了方案的有效性。(2)指出了HDFS系统的身份认证存在用户容易被冒充等问题,设计了一个安全有效的一次性口令身份认证方案,使用该认证方案与HDFS身份认证结合的方式来对用户进行身份认证,提高HDFS的安全性。(3)采用JSP等技术结合HadoopAPI开发了一个基于Hadoop的云安全存储系统,可视化了HDFS的操作界面,实现了文件的加密传输、权限控制、安全共享等,克服了HDFS系统中数据明文传输及存储存在的安全隐患,提高了用户数据的安全性。论文的创新之处包括:(1)提出一种基于信息分散算法的分布式存储方案,设计的改进的文件块存放策略,改善了HDFS的存储负载均衡能力;(2)设计了一个安全有效的一次性口令身份认证方案,将该口令身份认证方案与HDFS认证相结合来提高HDFS的安全性;(3)设计了基于Hadoop的云安全存储系统,实现了系统原型。

基于Hadoop的云安全存储系统的设计与实现

时间: 2024-10-22 11:18:27

基于Hadoop的云安全存储系统的设计与实现的相关文章

ZFS在基于Hadoop的视频存储系统中的应用

ZFS在基于Hadoop的视频存储系统中的应用 高煜红 陈清华 方路平 随着视频点播技术的不断发展,视频数据呈现出爆炸式增长,对文件存储及其扩容性方面提出了苛刻的要求.该文首先简单地描述了数据存储服务集群及该集群主要采用分布式平台Hadoop,使用ZFS动态文件系统作为后端存储文件系统.接着简单介绍了ZFS的特性,其次着重介绍ZFS在HDFS上的集成设计,最后通过相应的实现和ZFS性能比较测试,证明ZFS文件系统在视频文件存储中具有很好的应用价值. ZFS在基于Hadoop的视频存储系统中的应用

基于Hadoop的电子商务推荐系统的设计与实现

基于Hadoop的电子商务推荐系统的设计与实现 李文海 许舒人 为了解决大数据应用背景下大型电子商务系统所面临的信息过载问题 研 究 了 基于构建分布式电子商务推荐系统的方案采用基于模型实现的算法具有较高的伸缩性和性能 能高效地进行离线数据分析为了克服单一推荐技术的不足 设计了融合多种互补性推荐技术的混合推荐模型实验结果表明基于平台实现的推荐系统具有较好的伸缩性和性能. 基于Hadoop的电子商务推荐系统的设计与实现

基于Hadoop的视频摘要的设计与实现

基于Hadoop的视频摘要的设计与实现 华南理工大学 彭华聪 本文意图利用云计算技术将目前主流的基于运动过程的动态视频摘要技术由单机提取模式改造成分布式模式.从而在面对数据膨胀时,仅仅通过加入廉价的计算节点来提高视频摘要的提取速率,使得视频摘要技术能更好的投入实际生产中.首先,对云计算技术和视频摘要技术进行了大量的研究.选取了合适的开源云计算平台Hadoop分布式系统,并对Hadoop分布式系统与处理视频摘要的相关机制进行了分析.在视频摘要技术方面,概述了视频摘要技术的总体状况,详细介绍了基于运

基于Hadoop云存储系统在设计院的应用研究

基于Hadoop云存储系统在设计院的应用研究 黄滨 徐勇 吕岩 近年来,三维设计.协同设计在设计院中逐渐推广使用,设计院面临着文件和数据量的快速增长,现有的文件存储设施已不能适应业务增长的需求.本文首先描述了云计算和云存储的概念,分析了云存储的体系结构和技术优势,提出了基于 Hadoop 构建的云存储系统模型,并应用于数据备份.归档及数据共享等领域,满足了设计院对海量数据存储.数据共享和数据挖掘等要求. 关键词-设计院:云计算:云存储:Hadoop:海量数据 temp_1211210942558

基于Hadoop 的校园云存储系统的研究

基于Hadoop 的校园云存储系统的研究 高新成, 王莉利 针对海量数据的存储问题,传统方法一般是通过购置更多数量的服务器来提升计算和存储能力,存在硬件成本高,存储效率低等缺点.通过对Hadoop 框架和MapReduce 编程模型等云计算核心技术的分析和研究,提出了一种基于Hadoop 框架的海量数据存储模型,并在此模型的基础上,设计并实现了基于Hadoop 的校园云存储系统. 关键词-Hadoop; MapReduce; 云计算; 分布式计算; 存储模型 temp_1210021608512

基于Hadoop的海量小型XML数据文件处理技术的设计和实现

基于Hadoop的海量小型XML数据文件处理技术的设计和实现 西安电子科技大学 孔鑫 本文重点研究了如下内容:1)设计了专门针对海量小数据XML文件进行处理的分布式海量小型XML数据处理系统(Distributed Massive SmallXML files system,DMSX),该系统的主要思想就是将海量小数据XML文件在Hadoop系统中高效的进行处理.2)该系统通过运用生产者-消费模式,多线程并发技术,多级缓存技术等,来提高系统的整体处理能力.3)该系统通过对合并后的文件进行分段存储

基于反馈的动态负载平衡调度算法在Hadoop异构环境中的设计与实现

基于反馈的动态负载平衡调度算法在Hadoop异构环境中的设计与实现 南京理工大学  李元洪 本文在介绍云计算的基本概念.体系结构及其应用发展的基础上,分析了云计算模型的实现框架和容错机制.针对云计算Hadoop开源平台,详细分析了其中的分布式文件系统(HDFS, Hadoop Distributed File System)和MapReduce计算模型,并对Hadoop平台下的作业调度技术.FIFO.公平队列和计算能力作业调度算法做了深入的研究. 对Hadoop现有的调度算法在异构环境下的计算性

[文档]基于Hadoop/Hive的web日志分析系统的设计

基于Hadoop/Hive的web日志分析系统的设计 刘永增,张晓景,李先毅 利用Hadoop.Hive设计了一个用于处理web日志分析的系统,既充分利用了Hadoop的海量数据处理的能力,又降低了开发的难度.通过与单机实验的对比,证明系统是有效的和有价值的. 关键词:web日志:云计算:Hadoop:Hive [下载地址]http://bbs.chinacloud.cn/showtopic-12968.aspx

[文档]基于Hadoop 平台的数据分析方案的设计应用

基于Hadoop 平台的数据分析方案的设计应用 姜文,辛阳,陈林顺 摘要:面对互联网上的海量数据,单台主机已无法满足其存储和计算要求,分布式存储和分布式计算的应用成为必然的趋势.其中Hadoop 是应用较多的分布式存储和计算框架之一.本文在该平台下,通过对国内某搜索引擎两个月内的上千万条用户搜索日志进行数据统计分析,给出相应Map/Reduce 程序的设计思路和实例,并提出Map/Reduce 分布式程序的部分设计和性能优化方法,实验结果表明,本文提出的这些方法能简化Map/Reduce 程序设