操作系统顶级会议SOSP 阿里云MaxCompute开启NewSQL时代

  近日,第26届操作系统原理大会(SOSP)在上海举行,来自亚洲、欧洲、北美等地区的高校、学术机构和众多科技企业研究人员齐聚一堂。阿里巴巴受邀参加此次会议,除在展区展示系统软件技术的同时,阿里集团副总裁周靖人在BOF环节向参会人员介绍了阿里在数据库、计算、机器学习、网络等领域的多项重点技术。

  SOSP和另一个计算机系统领域会议OSDI同被誉为操作系统原理领域的奥斯卡,拥有极高的学术地位,参会人员在学术界、工业界取得的成绩是衡量能否参加SOSP的重要指标之一。

阿里巴巴BOF现场

  在主题为“Big Data Infrastructure at Alibaba:Challenges and Opportunities”的BOF环节,周靖人表示:“阿里经济体横跨电商、金融、物流、云计算、大数据、全球化等方方面面。2016年GMV(交易总额)突破5000亿美元、在零售平台上的年度活跃消费者达到4亿多,差不多相当于中国总人口的1/3;移动月度活跃用户更高达5亿多。如此大规模的用户数、交易数,让阿里拥有世界上最复杂、最丰富的计算场景、网络场景、机器学习场景,也让阿里巴巴成为世界上最大的技术练兵场。”

阿里集团副总裁周靖人(右四)和参会学者合影

  周靖人认为正是基于这样的背景,使得阿里在分布式计算、大数据处理、机器学习、图计算、网络系统等方面,取得了世界级的成果。希望通过SOSP,和操作系统领域的研究人员架起一座与学术界沟通的桥梁。

  融合SQL和NoSQL优势 阿里在NewSQL上的实践

  阿里巴巴计算平台研究员林伟在主题为“NewSQL for BigData Analyzing In Alibaba”的演讲上,介绍了阿里大数据计算服务MaxCompute在NewSQL上所做的优化和实践工作。

  “阿里推出NewSQL的目的就是要将SQL和NoSQL的优势结合起来”,林伟表示,从行业看,实现SQL和NewSQL两者间平衡,有多个关键技术要做好,包括需要有强大的DAG执行图以突破MapReduce的束缚;需要强大的优化器,实现存储过程的支持,从单一语句到成千上万的存储过程,从RuleBased Opt慢慢演变成CostBased Opt;以及通过分布式实现众多用户自定义函数(UDF)扩展,进而帮助用户生成好的Plan。

优化器与UDF的结合效果

  林伟表示,强大的优化器,能够处理好NoSQL引入的模糊的数据特性,并且能够优化更大规模的任务从而发挥全局优化的能力,需要cost-based的优化器能够很好感知数据和环境的变化,从而自适应产生最优的执行计划,并通过完整且丰富的UDF集合,做到逻辑计划和物理计划完美的融合,提高整个计算引擎的表达能力和系统智能优化的能力。

  据了解,阿里巴巴MaxCompute采用抽象的作业处理框架,将不同场景的各种计算任务统一在同一个平台之上,共享安全、存储、数据管理和资源调度,为来自不同用户需求的各种数据处理任务提供统一的编程接口和界面。提供了数据上传下载通道,NewSQL、机器学习算法、图编程模型、流式计算模型多种计算分析服务,并且提供了完善的安全解决方案。MaxCompute正在通过阿里云平台,为百万级企业级用户提供服务。

  首秀阿里新一代图计算引擎FLASH

  作为人工智能技术的有效工具之一,图模型能够整合多样化的数据,帮助挖掘大数据隐含的深层信息和商业价值。

  阿里巴巴计算平台资深专家钱正平现场分享了阿里在图分析方面的应用案例,总结了图存储与查询、迭代计算、模式匹配和可视化等方面的进展,同时也提到了当前面临的挑战。

分布式系统发展趋势与多样化场景的挑战

  “图计算”正变得越来越重要,阿里巴巴包含搜索推荐、个性化,以及智能风控等越来越多的应用场景,使用图模型为异构数据的分析提供了统一视图。结合算法与可视化技术,在线服务能够有效地捕捉数据之间的关联、理解用户行为和意图。

  钱正平表示,阿里巴巴已经通过真实场景积累了很多解决方案,并正在研发新一代的图计算引擎FLASH。相比业界和大部分开源图计算系统关注相对简单的图遍历查询和计算全图属性(如PageRank),FLASH旨在帮助用户更好的探索、发现、匹配,甚至在线检测复杂的“图模式”。另一方面,面对海量的图数据与多样化的场景(如上图所示),我们仍然需要更多易用、高效的大(图)数据分析工具。“阿里巴巴期待与学术界同行和领域专家紧密合作,通过解决真实问题,共同探索关键的系统抽象和做出更多有影响力的创新”。

  同时支持TCP和RDMA的软硬件一体化网络

  阿里的人工智能,大数据和云业务的快速发展给网络基础设施提出了更高的要求,8年“双十一”业务规模增长上百倍,系统的规模和复杂性以指数级上升,上层业务比以往任何时候都更需要高带宽和低延迟的网络。

  例如在数据包的处理能力上,随着摩尔定律趋于终结,CPU性能的提升开始落后于网络端口速率和带宽增长,越来越多的CPU资源被用于网络数据包的处理上,极大影响了上层业务提升性能的成本。与此同时,除了高带宽、低延迟需求,上层业务仍然依赖网络在提供复杂的安全、负载均衡和可视化等网络功能的同时满足高稳定和高可用需求。

  为应对这些挑战,阿里巴巴AIS(Alibaba Infrastructure Service)网络团队开始了软硬件一体化的高性能网络建设,在支持RDMA物理网络、基于智能网卡硬件加速的虚拟网络等领域沉淀了诸多技术。

阿里巴巴软硬件一体化的高性能网络

  阿里巴巴基础设施高级专家刘永锋介绍,阿里是国内首家大规模支持RDMA的互联网公司,网络架构同时支持TCP和RDMA,端到端的保证基于TCP和RDMA不同业务的高带宽和低延迟。在保证性能的同时,阿里RDMA网络架构能够做到兼容多家厂商的硬件,自动化的监控和隔离线上网络故障。在网络虚拟化方面,阿里经过了两代智能网卡的演进,从基于可编程NPU的vSwitch full offload到基于ASIC硬加速的快慢分离架构,在满足高性能、低成本的同时,通过软件定义的方式给大数据业务提供了满足业务灵活调度的虚拟网络方案。

  此次的SOSP会议上,阿里除了在BOF环节向参会者介绍阿里的部分重点技术外,来自系统软件事业部的高级专家秦承刚在展区为更多参会者介绍了阿里的系统软件内容。

清华大学陈渝(左一)、陆游游(右一)老师与阿里工程师合影

  据秦承刚介绍,系统软件是运行在阿里集团所有机器上的基础软件,对阿里巴巴业务的运行效率起到了非常关键的作用。此次重点展示的技术包括基于阿里场景的定制版Linux内核--AliKernel,它实现了进程间的资源隔离,面向容器场景的优化等技术。Alikernel的代码会回馈到社区,拥抱开源;基于OpenJDK定制的增强版JDK--AJDK,有效提升了阿里巴巴Java应用的性能、吞吐能力和问题解决的速度;以及资源调度系统Sigma、阿里自研的开源容器Pouch等。

  在阿里展区不断有知名高校学者前来交流,清华大学陈渝和陆游游老师与阿里工程师交流时表示:“我们更多的是看到阿里在商业上取得的成绩,没想到阿里在众多工程技术领域也取得了好成绩,这些创新工作在工程实践上很有价值”。

  一直以来,阿里巴巴都注重与学术界的合作,不仅推出首个全球性科研项目“AIR计划”,更与全球知名高校和科研机构成立研究中心,包括中国科学院-阿里巴巴量子计算实验室、UC Berkeley RISE 实验室、阿里巴巴-浙江大学前沿技术联合研究中心,以及与浙江省政府、浙江大学共建的之江实验室,强烈地向外界传递出阿里巴巴搭建“取自全球、用至全球”的全球化技术创新生态体系理念。

MaxCompute招聘信息:DT时代,与坚持梦想者同行!

阿里巴巴大数据-玩家社区 /

---阿里大数据博文,问答,社群,实践,有朋自远方来,不亦说乎……

时间: 2024-09-26 05:42:14

操作系统顶级会议SOSP 阿里云MaxCompute开启NewSQL时代的相关文章

阿里云MaxCompute澳大利亚开服,“领跑”人工智能市场

9月27日,阿里云宣布大数据计算服务MaxCompute将于10月10日在澳大利亚正式开服.通过MaxCompute强大的计算能力,阿里云将为澳大利亚市场提供更多的人工智能产品,助力当地企业智能化升级. 据了解,MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速解决用户海量数据计算问题,有效降低企业成本.保障数据安全. ​ 澳大利亚节点部署的为MaxCompute2.0版本.新版本依托全新的SQL2.0计算引擎带来更高性能运算,支持图像.视频等非结构化数据

【物流大数据实践】基于阿里云Maxcompute实现物流跟踪

免费开通大数据服务:https://www.aliyun.com/product/odps 摘要: 目前我国物流业保持较快增长,但还是存在一些问题:物流成本高.效率低,条块分割严重(自营物流.规模小.技术落后.标准不统一).基础设施相对滞后(物流基础设施之间不衔接.不配套),对订单创建到用户签收整套完整流程缺乏完善的监控和预警手段. 基于建设统一物流平台的基本要求,用户希望打通各大系统,能够跟踪所有订单在物流系统中的流转过程.处理状态等信息,具体如下需求: 1:订单分为5个阶段,订单处理.发运处

数据智能需求旺盛 阿里云MaxCompute 2.0华南区开服

8月31日,阿里云宣布将在深圳区域正式部署大数据计算服务MaxCompute,以进一步提升对华南区域客户服务的响应速度,并推动该地域人工智能产业的发展. 此前,凭借大规模计算存储.多种计算模型.强数据安全和低成本的优势,MaxCompute一直供不应求. 官方预计,深圳区域将于9月7日正式开放售卖,此后阿里云MaxCompute还将在年底前陆续新开北京.杭州.香港.新加坡.美国.日本.欧洲等节点.这显示了,阿里云正将MaxCompute这样的"核武器"快速推向全球市场. 新节点将部署M

阿里云MaxCompute入欧 方便欧洲企业挖掘自身价值

当地时间6月15日,阿里云在巴黎VivaTech科技展上宣布大数据计算产品"MaxCompute"将于年内在欧洲市场开服,该技术涵盖处理分析.机器学习等一系列完善的数据智能服务.这也是国内类似技术的首次出海,以满足当地众多企业日益增长的数字化转型需求. 图为阿里云展台 MaxCompute是阿里云研发的快速.完全托管.安全可靠的 GB/TB/PB 级数据仓库解决方案,单个MaxCompute集群最多可扩展至1万台服务器.MaxCompute向用户提供完善的导入方案以及多种经典的分布式计

阿里云MaxCompute香港开服 将引入更多人工智能服务

9月18日,阿里云宣布大数据计算服务MaxCompute在香港正式开服.通过MaxCompute强大的计算能力,阿里云将为香港市场提供更多的人工智能产品,助力当地企业智能化升级. 据了解,MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速解决用户海量数据计算问题,有效降低企业成本.保障数据安全. 香港节点部署的为MaxCompute2.0版本.新版本依托全新的SQL 2.0计算引擎带来更高性能运算:支持非结构化数据处理,通过外表与外部数据源关联,提供自定义

阿里云MaxCompute香港开服 引入更多人工智能

9月18日,阿里云宣布大数据计算服务MaxCompute在香港正式开服.通过MaxCompute强大的计算能力,阿里云将为香港市场提供更多的人工智能产品,助力当地企业智能化升级. 据了解,MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速解决用户海量数据计算问题,有效降低企业成本.保障数据安全. 香港节点部署的为MaxCompute2.0版本.新版本依托全新的SQL2.0计算引擎带来更高性能运算;支持非结构化数据处理,通过外表与外部数据源关联,提供自定义解

阿里云MaxCompute携手华大基因打造精准医疗应用云平台

摘要:华大基因股份公司总监金鑫介绍了华大基因,并浅谈了与阿里云的情缘,包括Maxcompute等方面应用案例.一起来看下吧.   关于华大基因 华大基因是中国最领先的基因科技公司,华大基因为消除人类病痛.经济危机.国家灾难.濒危动物保护.缩小贫富差距等方面提供分子遗传层面的技术支持.目前,世界上只有两个国家的三个公司可以生产.量产临床级别的基因测序仪,华大基因是中国的唯一一家.我们在基因的产权研发方面从1999年开始做了很多的工作.在2014年,我们与阿里云有了初步的接触,在2015年上线了我国

一分钟了解阿里云产品:墨迹天气之阿里云MaxCompute实践

  墨迹天气成立到现在5年多,已经积累了4亿用户.同时,在墨迹天气上,每天有超过 5 亿次的天气查询需求.墨迹天气已经集成了多语言版本,可根据手机系统语言自动适配,用户覆盖包括中国大陆.港澳台,日韩及东南亚.欧美等全球各地用户.运营团队每天最关心的是这些用户正在如何使用墨迹,在他们操作中透露了哪些个性化需求.     这些数据全部存储在墨迹的API日志中,墨迹天气的API每天产生的日志量大约在400GB左右,分析工具采用了阿里云的大数据计算服务MaxCompute.   使用MaxCompute

赋能数据处理能力 阿里云MaxCompute助企业洞察市场

阿里云在上月中,就将MaxCompute大数据计算服务向香港市场开放上线,此前该服务已先后于中国大陆及新加坡推出. 阿里巴巴集团旗下电子商务平台最大特点及优势,在于其平台上的人工智能及大数据处理能力,可以洞察消费者的需要,并因不同人的偏好而提供个性化设定,大大提升消费者体验,并可为商家反馈重要的市场数据,从而精准去计划市场策略. 这样强大的人工智能技术,背后是由阿里云独立研发的大数据处理平台MaxCompute提供服务,而这亦不再是商家遥不可及的技术:阿里云在上月中,就将MaxCompute大数