Alluxio 1.5.0开源发布版的技术亮点

开源Alluxio 1.5.0已经发布了大量的新功能和改进。Alluxio允许任何应用程序以内存级速度且透明地从任何存储系统访问数据。与生态系统中的其他技术的互操作性是实现这一目标的重要一步,在1.5.0版本中,我们从以下几个关键方面改进了Alluxio的可访问性。

  • Alluxio Docker集成
  • Alluxio Golang Client
  • 使用S3A在Ceph上部署Allluxio
  • 挂载特定配置属性

1.Alluxio Docker集成

Alluxio 1.5.0添加了文档和脚本,以便在Docker容器中运行Alluxio。可以使用-e参数传递Alluxio配置参数,并将日志写入stdout,以便它们显示在docker日志的输出中。下面的例子演示了如何在HDFS上通过Docker容器运行Alluxio。

cd alluxio-1.5.0/integration/docker
docker build -t alluxio .

docker run -d --net=host \
           -e ALLUXIO_UNDERFS_ADDRESS=hdfs://HdfsMaster:9000/ \
           alluxio master

docker run -d --net=host --shm-size=10GB \
           -e ALLUXIO_MASTER_HOSTNAME=AlluxioMaster \
           -e ALLUXIO_WORKER_MEMORY_SIZE=10GB \
           -e ALLUXIO_UNDERFS_ADDRESS=hdfs://HdfsMaster:9000/ \
           alluxio worker

在EC2实例上通过Docker容器运行Alluxio的相关教程, 请参阅文档

2.Alluxio Golang Client

此前,Alluxio推出了一个代理进程,默认情况下与每一个Alluxio Master和Worker一起运行,并且提供了REST API,相当于Alluxio本地文件系统API。为了能基于REST API与Alluxio进行交互,在1.5.0版本中,Alluxio推出了GO Client。该客户端可从其自身的Repository中获取,通过“go get”机制导入用户程序中。
除了提供在GO环境下与Allluxio通信外,该客户端的实现也体现了基于REST API实现一种语言绑定Alluxio是十分容易的。
注意通过REST API与Alluxio通信需要额外的网路跳数和(或)内存副本,因此预期其性能不如原生Java客户端。另一方面,基于REST API的客户端都将从任何本地java客户端的改进中受益,意味着GO Client 与其他针对REST API开发的客户端将始终具有最新特性。
下面的例子演示了使用GO程序与Alluxio交互:

package main

import (
"fmt"
    "log"

    alluxio "github.com/Alluxio/alluxio-go"
    "github.com/Alluxio/alluxio-go/option"
)

func main() {
    fs := alluxio.NewClient(<proxy-host>, <proxy-port>, <timeout>)
    ok, err := fs.Exists(<path>, &option.Exists{})
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println(“path %v exists: %v”, <path>, ok)
}

3.使用S3A在Ceph上部署Allluxio

在1.5.0版本中,Alluxio可以使用S3A连接器连接到Ceph。相较于Swift连接器,S3A连接器提供了显着的功能和性能改进。
如下图所示,当读取1 GB大小的文件时,S3A连接器的读取性能可提高3倍。

4.挂载特定配置属性

使用Alluxio的一个重要优势是将不同的底层文件系统(如S3,HDFS,GCS等)映射到一个统一的Alluxio命名空间,与在本地文件系统上设备类似,每个文件系统都位于隔离的挂载点下。从1.5.0版本开始,除了遵守特定类型的存储系统的全局配置设置外,Alluxio还支持为每一个挂载点设置(各自的)配置属性。配置且挂载不同底层文件系统后,访问这些系统对于Alluxio文件系统应用来说是完全透明的。因此,Alluxio可以帮助系统管理员隐藏复杂性并且降低管理难度。
举例说明,用户Alice在AWS上有多个S3 bucket,她需要从不同的bucket中访问数据。原来Alice只能将共享同一系统认证密钥的S3 bucket挂载到Alluxio中,而现在Alice可以使用单独的认证密钥挂载每个bucket,如下所示:

$ bin/alluxio fs mount /mnt1 s3a://alice-bucket1/ --option aws.accessKeyId=<accessKey1> --option aws.secretKey=<secretKey1>
$ bin/alluxio fs mount /mnt2 s3a://alice-bucket2/ --option aws.accessKeyId=<accessKey2> --option aws.secretKey=<secretKey2>

此后,所有认证的Alluxio用户可以自由访问 /mnt1 和 /mnt2,甚至没有注意到它们来自两个不同的桶,并使用不同的认证密钥进行访问。

5.更多

本博客仅强调了Alluxio 1.5.0中的一些新功能和改进。 更详细的内容,请查看发行说明
您可以按照快速入门指南,轻松开始使用Alluxio开源版或社区版

版权申明:本文由南京大学顾荣等专家翻译整理自Alluxio公司技术博客,由Alluxio公司授权及CSDN首发(联合),版权归Alluxio公司所有,未经版权所有者同意请勿转载。

时间: 2024-11-07 06:13:12

Alluxio 1.5.0开源发布版的技术亮点的相关文章

Taurus.MVC 2.0 开源发布:WebAPI开发教程

背景: 有用户反映,Tausus.MVC 能写WebAPI么? 能! 教程呢? 嗯,木有! 好吧,刚好2.0出来,就带上WEBAPI教程了! 开源地址: https://github.com/cyq1162/taurus.mvc 下面为教程: 步骤一:新建ASP.NET Web应用程序:WebAPI项目 步骤二:Nuget上引用Taurus.MVC   安装后,框架默认引入两个Taurus.Core.dll和CYQ.Data.dll,以及自动配置web.config 步骤三:新建一个Contro

ASP.NET Aries 4.0 开源发布:已完成基础功能优化重写

主要更新: 1:增加AR.Global.GetUser() 方法返回当前登陆者的用户信息. 2:重写AR.Combobox 支持下拉树. 3:调整及扩展Input下拉的配置参数. 4:优化及新增AR.Combobox相关的方法. 5:重写层级表头的配置及算法. 6:扩展下拉数据的参数. 7:重写Excel导入模块. 8:重写Excel导出相关. 9:部分参数简化和名称调整. 从旧版本升级的注意事项: 1:Config_Excel表字段变更:新增(WhereType.AcceptType)两字段,

NetSNS V1.5.0 build1208正式版免费开源发布

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 2008年12月08日,古羌科技NetSNS V1.5.0 build1208正式版免费开源发布,方便与多种建站系统整合. NetSNS是基于Asp.Net开发的社交网络建站系统.可与多种互动Web应用程序整合,整个产品采用先进的技术(SQL2000数据库.Ajax,.Div+CSS布局等诸多网络流行元素囊括其中),适合各方面应用的要求.提供一个安全.稳定.高效.易用.快捷的SNS平台.NetSNS平台有极其丰富的扩展娱乐功能,将缩短您与F

EasyDB 1.0.1正式版发布,MySQL操作类

EasyDB 1.0.1正式版发布.MySQL操作类 更新内容如下: 支持对insert/update/deldete/select的简化操作: 支持对复杂的insert/update/deldete/select SQL进行链式操作: 链式操作目前支持 field(),where(),order(),group(),limit(),setdata(); 增加调试输出,支持写文件或者屏显打印: 增加调试方法,通过getLastSql可以获取到真正编译后执行的SQL语句; 增加对Eclipse.P

加快中国开源产业发展 Rancher2.0全新发布

本文讲的是加快中国开源产业发展 Rancher2.0全新发布[IT168 云计算]9月27日,"Rancher 2.0发布暨中国区用户及合作伙伴大会"在京成功举办.作为容器技术的行业盛会,Rancher Labs首席执行官兼联合创始人梁胜博士携手合作伙伴向与会专家和行业精英带来了容器技术的最新趋势以及成功案例. 此外,在大会上,Rancher Labs更隆重推出首个能在同一平台上管理全部Kubernetes集群的最新平台技术--Rancher 2.0,其强大的功能和优质的用户体验,能够

OneThink v1.0.131018开发版发布

这周主要完善了数据库备份功能和分类的合并,移动操作公功能.如果不出意外,下周会新增大家期待已久的模型http://www.aliyun.com/zixun/aggregation/17569.html">管理功能. 在正式版发布之前,BUG反馈和建议请到 http://www.thinkphp.cn/topic/onethink.html 文档工作我们正在紧张整理中,再次感谢大家对OT的关注和支持,你们的努力让OT走的更远! 另外,OneThink的二次开发手册和ThinkPHP3.2的开

PHP 7.0.2 正式版发布_php实例

七年以来,PHP一直是第四大最流行的编程语言,驱动全球超过2亿多个网站,全球超过81.7%的公共网站在服务器端采用PHP.PHP在这个星期有了自2004年以来最大的飞跃,因为PHP 7已经发布. PHP 7最大特色是极大地改进了性能,在一些WordPress基准测试当中,性能可以达到PHP 5.6的3倍. 下载地址: PHP 7.0.2 Final for Windows 32-bit (14.59 MB) PHP 7.0.2 Final for Windows 64-bit (14.59 MB

CYQ.Data 数据框架 V4.0 开源版本发布(源码提供下载,秋色园V2.5版本标配框架)

说明的说明:   博客园团队两次移此文出首页,说 这篇文章不属于知识分享型文章,并且有广告嫌疑. 本文的确属于分享型文章,而且分享的知识点比其它文章都多很多,看看网友回复"谢谢分享"就知道是分享型文章了.   所谓广告嫌疑,这东西一被扣上,就很难说的清. 本框架从2007年就始发布在博客园,一直更新维护到现在,其中是有过渡到最新版本是收费,但是仍保留开放很多版本的开源的. 但目前发布的,都是开源的免费版本,再说,涉及到收费就是广告?ext也有收费版本,出现ext相关文章你咋不说是广告?

开源团队协作 TMS 2.4.0 版本发布

开源团队协作TMS发布新版本:v2.4.0 开源团队协作系统 TMS 是类似slack barrychat 的团队协作沟通&博文wiki&国际化翻译管理的web管理系统. git repo: https://git.oschina.net/xiweicheng/tms 演示环境: http://tms000.sh1.newtouch.com/page/index.html 测试账户: admin/88888888 user/88888888 v2.4.0: http://git.oschi