MaxCompute SQL Row_Sequence 实现列自增长

背景：多维数据仓库中的维度表和事实表一般都需要有一个代理键，作为这些表的主键，代理键一般由单列的自增数字序列构成。MaxCompute(原ODPS）没有关系数据库中的自增列 auto-increment id，但可以通过UDF来给海量数据的每一行产生唯一的id。

效果如下：

select  row_sequence(),name from user_info;

一、准备工作

1、准备阿里云账号，文档参考：https://help.aliyun.com/document_detail/27803.html

2、开通大数据开发套件、MaxCompute服务。文档参考：https://help.aliyun.com/document_detail/27815.html

3、配置Eclipse ODPS环境，文档参照：https://help.aliyun.com/document_detail/27981.html

二、通过Eclipse创建UDF

1、在Eclipse环境中，新建Row_Sequence.java，代码如下


package com.aliyun.odps.examples.udf;
import com.aliyun.odps.io.LongWritable;
import com.aliyun.odps.udf.UDF;

public class Row_Sequence   extends UDF {

	 private LongWritable result = new LongWritable();

	  public Row_Sequence () {
	    result.set(0);
	  }

    public String evaluate() {
    	result.set(result.get() + 1);
        return result.toString();
    }
}

2、导出为Row_Sequence.JAR

三、通过大数据开发套件注册函数

1、通过大数据开发数据开发->资源管理，上传Row_Sequence.JAR资源。

2、通过大数据开发数据开发->函数管理，注册row_sequence函数。

四、通过大数据开发套件验证

1、通过SQL查询结果

select row_sequence(),name  from user_info;

我们可以看到，通过UDF可以完成列增长效果，由于MaxCompute读取数据是无序的，所以还需要把数据insert overwrite table到新表中。

注意：本教程UDF在小规模数据单节点是可行的，如果是海量数据多节点并行，会出现重复数，建议用uuid()函数；

select uuid() as id,* from user_info ;

时间： 2024-11-01 04:02:45

MaxCompute SQL Row_Sequence 实现列自增长的相关文章

MaxCompute基础与MaxCompute SQL优化

总论: 大数据计算服务 ( MaxCompute,原名 ODPS )是一种快速.完全托管的 TB/PB 级数据仓库解决方案 .MaxCompute 向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全 .同时,大数据开发套件和 MaxCompute关系紧密,大数据开发套件为 MaxCompute 提供了一站式的数据同步,任务开发,数据工作流开发,数据管理和数据运维等功能,您可以参见大数据开发套件简介来对其进行深入了

MaxCompute SQL 现状与展望

票选最美云上大数据暨大数据技术峰会上,阿里云飞天一部高级专家振禹为大家带来题为"MaxCompute SQL 现状与展望"的演讲.本文重点解析了MaxCompute SQL 现状,详细介绍了各种功能,其中包括编译器用户友好功能.复杂类型.CTE.参数化视图和SEMI JION等,接着说明了MaxCompute SQL即将完成与推进中的功能,最后作了简要总结. 以下是精彩内容整理: MaxCompute SQL 现状目前MaxCompute SQL能力不是很强,虽然在性能.安全和成

MaxCompute SQL与标准SQL的主要区别及解决方法

这里会列举一个写惯了关系型数据库里的SQL的用户,在使用MaxCompute SQL比较容易遇见的问题.但是具体的语法建议还是参考对应的文档 .希望这篇帖子配合文档,能帮助大家少踩坑,快速上手MaxCompute SQL. 概要场景不支持事物(没有commit和rollback,建议代码具有等幂性支持重跑,不推荐使用Insert Into,推荐Insert Overwrite写入数据). 不支持索引和主外键约束. 不支持自增字段和默认值.如果有默认值,请在数据写入时自行赋值. 分区单表支持

SQL中行转列和列转行

行转列,列转行是我们在开发过程中经常碰到的问题.行转列一般通过CASE WHEN 语句来实现,也可以通过 SQL SERVER 2005 新增的运算符PIVOT来实现.用传统的方法,比较好理解.层次清晰,而且比较习惯. 但是PIVOT .UNPIVOT提供的语法比一系列复杂的SELECT...CASE 语句中所指定的语法更简单.更具可读性.下面我们通过几个简单的例子来介绍一下列转行.行转列问题. 我们首先先通过一个老生常谈的例子,学生成绩表(下面简化了些)来形象了解下行转列 CREATE TAB

SQL Server 2016 列存储技术做实时分析

title: SQL Server 2016 列存储技术做实时分析 author: 风移摘要数据分析指导商业行为的价值越来越高,使得用户对数据实时分析的要求变得越来越高.使用传统RDBMS数据分析架构,遇到了前所未有的挑战,高延迟.数据处理流程复杂和成本过高.这篇文章讨论如何利用SQL Server 2016列存储技术做实时数据分析,解决传统分析方法的痛点. 传统RDBMS数据分析在过去很长一段时间,企业均选择传统的关系型数据库做OLAP和Data Warehouse工作.这一节讨论传统R

SQL行转列和列转行代码详解

行列互转,是一个经常遇到的需求.实现的方法,有case when方式和2005之后的内置pivot和unpivot方法来实现. 在读了技术内幕那一节后,虽说这些解决方案早就用过了,却没有系统性的认识和总结过.为了加深认识,再总结一次. 行列互转,可以分为静态互转,即事先就知道要处理多少行(列);动态互转,事先不知道处理多少行(列). --创建测试环境 USE tempdb; GO IF OBJECT_ID('dbo.Orders') IS NOT NULL DROP TABLE dbo.Orde

急，sql通过多列的值选择连接多表的问题！

问题描述急,sql通过多列的值选择连接多表的问题! 语句有点长,见谅哈! select * from ( select c.RQID PR, a.URL, a.Name , ROW_NUMBER() over(PARTITION by c.RQID order by b.ExecutedTime) as num from PR a inner join PRAC b on a.PRId=b.PRId inner join RQ c on b.PRId=c.PRId left join PC2

记录-sql自增列问题，求大大解答

问题描述 sql自增列问题,求大大解答 mysql建立一个自增列,初始为1,新建一个记录,其值为2,如果删除掉这条记录,那么下次新建的记录值是2还是3,如果是2,怎么是sql新建的记录值跳过原有的值呢解决方案不知道你有没有试过,删除所有数据,再插入时id是3,但清空数据表时,再插入又是从1开始的.你可以每次删除某条记录是,重新排序一下,给你一个存储过程看一下 1.传参:传递两个参数进去,每次删除数据时调用一次 CREATE DEFINER=root@localhost PROCEDURE r

sql 行转列 PIVOT 列转行 UNPIVOT

原文:sql 行转列 PIVOT 列转行 UNPIVOT 一: 现有表一(t_table1),想转为表二(t_table2)的格式. 表一: 年公司收入 2013 公司1 12 2013 公司2 22 2013 公司3 32 2012 公司1 42 2012 公司2 52 2012 公司3 62 表二: 年公司1 公司2 公司3 2012 42 52 62 2013 12 22 32 可使用sql2005之后提供的PIVOT 具体操作如下: select * f

问题描述 ListView 里面嵌套了一层ListView 如何写实体类呢左边的是别人用HashMap写的右边是我想换成封装成实体类的时候提示不能获取id 请问如何获取呢

PS鼠绘手拿棒棒糖的萌女孩

教程介绍的非常简单,略述了卡通人物的绘画基本过程,同时也介绍了通透肤色的刻画方法.不过这些都是最基础的,自己需要多练习才能画出好看的作品. 最终效果 1.先在纸张上随意画你喜欢的萌物,有手绘板的同学可 ...

从百度站长平台学SEO技巧：网站换IP不再怕

众所周知,在SEO中希望网站的内容经常有更新价值的内容,但网站的结构等最好还是不太改变的好,所以站长们在处理这些问题的时候尤为谨慎,因为在之前就有网站因为这些原因被搜索引擎清空过所有的索引记录,也就是 ...

网页中屏蔽右键方法

众所周知,要保护一个页面,最基础的就是要屏蔽右键,这篇文章教你如何完美屏蔽. 如何在网页中屏蔽右键众所周知,要保护一个页面,最基础的就是要屏蔽 ...

Oracle常见错误代码

oracle|错误 ORA-01650:unable to extend rollback segment NAME by NUM intablespace NAME 产生原因:上述ORACLE错误为 ...

实现自己的ASP.NET宿主系统

asp.net 实现自己的ASP.NET宿主系统杨山河一. 宿主概念托管是.NET的一个很基础的概念,所有的.NET应用程序代码要完全发挥作用需要进入托管的环境(CLR --Common Lan ...

数据结构学习(C++)之图

图的应用恐怕是所有数据结构中最宽泛的了,但这也注定了在讲"数据结构的图"的时候没什么好讲的--关于图的最重要的是算法,而且相当的一部分都是很专业的,一般的人几乎不会接触到:相对而言 ...

OpenRisc入门（24） ORPSoC boot过程分析

引言之前做了很多工作,能起orpmon,能起linux,能run helloworld.但是这些都可以说是空中楼阁,如果不把CPU的启动过程搞明白,总感觉心里没底似的.所以本小节就看一下ORPSoC ...

ASP.NET服务器控件封装-【事件】-1.1【事件回发.异步回调】

最近,正在学习ASP.NET服务器控件封装相关的知识,把自己学到的和大家分享下. 本次内容的概要如下: 1.事件以及为什么需要事件驱动机制: 2.回发的原理: 3.异步回调的原理: 4.事件回发的实 ...

用任务条跟踪文件下载

注意:本文代码不是最快的和最有效的代码.我有一套更快的代码.希望你在阅读本文之后能编写出自己的高效代码. 概要程序用线程管理下载过程,这样主程序就不会被封闭,程序还有中止下载的功能.下载过程在线程中 ...

Photoshop制作非常破旧的灰绿色老照片教程

老照片制作大致分为两个大的步骤.首先是调色及虚化处理,主色选一些仿古色调如黄褐色.暗蓝色.灰绿色等,然后适当把图片特殊模糊处理做成有点朦胧的旧照片感觉.然后就是划痕部分的制作,可以选一些颓废的纹理素材 ...

jQuery使用prepend()方法在元素前添加内容用法实例

这篇文章主要介绍了jQuery使用prepend()方法在元素前添加内容的方法,实例分析了prepend方法追加内容的使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下本文实例讲述了jQ ...

在PC端iTunes中如何重新下载已购项目?

在今年 9 月的苹果新品发布会中,最让音乐迷们兴奋的无外乎就是 U2 新专辑的首发了,将新专辑的发布放在了全球瞩目的苹果发布会上,想必热爱音乐的乔布斯也会惊叹现在苹果在音乐领域巨大的影响力,U2 ...

Android4.4 webkit底层网络链接超时时长设置

问题描述 Android4.4 webkit底层网络链接超时时长设置 Android4.4 WebView加载解析页面时,加载达到100%之前让它显示圆形加载进度条,若加载的页面中有图片是网络链接地址 ...

编写高效的JAvascript——Nicholas C. Zakas（读书笔记）

Nicholas C. Zakas 在<编写高效的Javascript>一文里总结如下: 管理作用域非常重要,因为存取非局部变量要比局部变量耗时更多.尽量避免使用增长作用域链的结构,比 ...

再读《Parallel Programming with Python》并作笔记

并发编程,在哪个语言里都属于高端应用,一定得会了才好意思说懂了这门语言. 在工作中用得并不是很多,忘了一些内容,就慢慢看,慢慢补上. 今天一天看了近三分之一(我看外文越来越快了??:)), 实践一下多 ...

ExtJS5学习之Hello World

ExtJS5已经发布很久了,还没学过,没什么原因,因为我很懒,哈哈,趁着有空,记录一下学习过程,这也是第一次在iteye写博客,没什么原因,因为我很懒. :D 首先去官网下载ExtJS5的压缩包,首先 ...

有关Java的HashMap的实现的问题

问题描述在Java中,对于HashMap的定义是这样的:public class HashMap<K,V> extends AbstractMap<K,V> implemen ...

unity3d material-unity3d中如何用js代码来更改shader中的3个子着色器

问题描述 unity3d中如何用js代码来更改shader中的3个子着色器 #pragma strictvar alpha;var fadeSpeed : float=10;var timeLeft ...

java基础-学到java集合框架中对那个复写equals的疑问，求解答

问题描述学到java集合框架中对那个复写equals的疑问,求解答 import java.util.*; class Student implements Comparable { private ...

高通的盛世危机

高通刚刚交出了最新一季的财报.其中净利润同比大幅下跌89.7%.这篇文章详细地分析了高通净利润大幅度下滑的原因,以及在目前环境下,高通所拥有的优势和面临的危机.(本文作者:界面新闻,雷锋网获作者授权转 ...

联想 win8 ...-电脑问题太多啦求助啊

问题描述电脑问题太多啦求助啊买了一年的联想t430 win8系统问题不断啊[憋嘴]1.蓝牙打不开驱动大师检测让安蓝牙驱动可是安不上 2无线突然就没有了,无线连接不可用 ,有时360Wi-Fi ...

shiro @RequiresPermissions() 不区分大小写

问题描述 shiro @RequiresPermissions() 不区分大小写最近在学习shiro,但是却遇到这样的问题 @RequiresPermissions(value = "se ...

环信的appkey可以写到代码里面吗

问题描述 **环信的appkey可以写到代码里面吗** 解决方案不可以,必须写在AndroidManifest.xml中,因为在SDK中取appkey是指定到AndroidManifest.xml的

急死人了，SSH整合报错，高手进来帮忙解决啊，org.springframework.beans.factory.BeanCreationException

问题描述 2010-11-13 12:37:39 org.apache.catalina.core.AprLifecycleListener init信息: The APR based Apache ...

c# serial port接收信息后转换格式再显示的问题

问题描述 c# serial port接收信息后转换格式再显示的问题可以确保发送出来的信息是对的,接收到的也是对的.可是我再把它从byte转换成float并显示为string,就不是每次都能成功了. ...

敌人的敌人就是朋友——微软小冰进驻小米、易信

微软"小冰"为微软(亚洲)互联网工程院研发的人工智能聊天机器人,于5月29日在微信公测上线3天后因疑涉及隐私和违反微信平台规则遭到微信"封杀".微软称,该机器人 ...

Python-关于Python中闭包的一些理解

看不懂的定义:闭包是由函数及其相关的引用环境组合而成的实体(即:闭包=函数+引用环境). 既然是看不懂的定义,真看不懂上面定义的话就忽略吧. 在python中,函数可以作为另一个函数的参数或返回值,可 ...

Kwooty 0.7.2发布二进制采集工具

Kwooty是一个.nzb新闻组基于KDE 4的二进制采集工具.其主要功能包括支持多服务器,智能PAR2下载,文件自动验证/修复和归档(RAR,ZIP,7Z)提取,自动文件下载后开放NZB文件,关机调 ...

Ajax+FormData+javascript实现无刷新表单信息提交_javascript技巧

原理: dom收集表单信息,利用FormData快速收集表单信息 ,实例化表单数据对象同时收集fm的表单域信息. var fd = new FormData(fm); //实例化对象 alert(f ...

热搜