hbase-spark创建dataframe导入phoenix如何禁止自动创建字段编号

问题描述

spark创建dataframe导入phoenix如何禁止自动创建字段编号

请教:从HDFS里读一个文件,map开拿出数据,转换成dataframe类型,再放入phoenix里面。转换成dataframe后,为什么给数据自动加一个前缀"_1","_2"。这样导致数据放入phoenix的时候,列簇对应不上,phoenix表已经创建好,定义过列簇名,下面是代码,和报错

我创建phoenix表的行键列簇名字已经定义好了:HANGJIAN , LIECU ,LIECU2 ,LEICU5 ,HANGJIAN5
spark转换rdd的时候自动添加了"_1", "_2","_3"' "_4", "_5"

能不能转换数据的时候 ,不自动 加: _1 _2 等等前缀,直接让数据存入phoenix表中。请问大神们是怎么做的?

解决方案

问题搞定了
df = sqlContext.createDataFrame(sparkRDD2,["HANGJIAN","LIECU","LIECU2","LIECU5","HANGJIAN5"])
这是官网的

from pyspark.sql import Row
Person = Row('name', 'age')
person = rdd.map(lambda r: Person(*r))
df2 = sqlContext.createDataFrame(person)
df2.collect()
[Row(name=u'Alice', age=1)]

解决方案二:

问题搞定了
df = sqlContext.createDataFrame(sparkRDD2,["HANGJIAN","LIECU","LIECU2","LIECU5","HANGJIAN5"])
这是官网的

from pyspark.sql import Row
Person = Row('name', 'age')
person = rdd.map(lambda r: Person(*r))
df2 = sqlContext.createDataFrame(person)
df2.collect()
[Row(name=u'Alice', age=1)]

解决方案三:

应该是这个
上面粘贴错了

rdd = sc.parallelize(l)
sqlContext.createDataFrame(rdd).collect()
[Row(_1=u'Alice', _2=1)]
df = sqlContext.createDataFrame(rdd, ['name', 'age'])
df.collect()
[Row(name=u'Alice', age=1)]

时间: 2024-10-03 17:12:02

hbase-spark创建dataframe导入phoenix如何禁止自动创建字段编号的相关文章

修改Exchange Server 2010默认设置来禁止用户创建通讯组

以前做培训时的学生今天问了我一个问题,说所有用户都可以从其outlook客户端创建并管理通讯组,但是其实是不允许所有人都能自己创建通讯组,想询问看看有没有办法不认用户自己创建通讯组. 其实这个问题比较常见,因为默认情况下Microsoft Exchange 2010 平台下的所有用户都可以从其电子邮件客户端创建并管理组讯组的,但是如果想关闭该功能,禁止用户创建和管理能讯组也是有办法做到的,下面我就分享一下当时给出的一些解决方法: 1.可以创建分配策略将该策略分配给不允许创建和管理通讯组的用户.

怎么禁止Word文档自动创建超链接

  怎么禁止Word文档自动创建超链接                1.启动Word 2013,打开"Word选项"对话框,在左侧选择"校对"选项,在右侧单击"自动更正选项"按钮,如图1所示. 图1 单击"自动更正选项"按钮 2.打开"自动更正"对话框,在"键入时自动套用格式"选项卡中取消对"Internet及网络路径替换为超链接"复选框的勾选,如图2所示.完成设置

win7禁止桌面创建文件夹方法

  为了操作方便,简单好找,很多朋友都习惯在桌面创建文件夹,然后将需要的.重要的文件存放到里面.但是实际上,将重要文件存放在桌面不仅非常的危险,而且很容易将电脑运行的速度拖慢.下面,小编就介绍一下桌面创建文件夹,让我们改掉这样的恶习吧! 首先,也是最基本的,我们需要查看c盘的类型,因为只有NTFS格式的文件才可以操作.查看c盘类型的方式很简单,只需要打开计算机,然后右键点击c盘打开属性窗口,查看文件类型就OK了! 其次,我们需要保证的是,现下必须是管理员账号登陆的,然后找到下面的位置:C:用户A

hive跟hbase整合用hive导入数据报错,报一个路径不是目录。

问题描述 hive跟hbase整合用hive导入数据报错,报一个路径不是目录. hive>load data local inpath '/home/hadoop/ha1.txt' into table ha1; FAILED: Hive Internal Error: java.lang.RuntimeException(org.apache.hadoop.ipc.RemoteException: java.io.FileNotFoundException: Parent path is no

Swift游戏实战-跑酷熊猫 01 创建工程导入素材

原文:Swift游戏实战-跑酷熊猫 01 创建工程导入素材   在这节里,我们将建立一个游戏工程,并导入一些必要的素材,例如序列帧动画文件,声音素材文件.动画文件我们使用atlas形式.在打包发布或者模拟器测试的时候,它会将整个.atlas文件夹下的图片打包成一张png图片. 要点: texture atlas :它包含了一组相关的texture.使用atlas可以提高性能   项目文件地址 http://yun.baidu.com/share/link?shareid=3824235955&u

asp.net实现数据从DataTable导入到Excel文件并创建表的方法_实用技巧

本文实例讲述了asp.net实现数据从DataTable导入到Excel文件并创建表的方法.分享给大家供大家参考,具体如下: /// <summary> /// 把数据从DataTable导入到Excel文件里 /// </summary> /// <param name="dataTable">数据源</param> /// <param name="AbsoluteExcelFilePath">Exce

Windows 7下实现VPN连接自动创建

在完成了Windows XP下VPN自动创建并配置连接后,其实我们还需要对Windows 7下VPN自动配置做一个介绍,因为目前实际上很多企业也已经开始进行了大批量的Windows 7的使用,而且很多用户目前也在逐渐向Windows 7系统迈进,那么如何让Windows 7用户也能有不错的用户体验呢?如何简化这些用户的VPN创建也成为了我们需要考虑的内容,继续前面的内容我来分享一下,我在Windows 7下的配置. 在Windows 7的VPN批处理脚本中还实现了在TMG-VPN中完成的SSTP

【百度地图API】如何快速创建带有标注的地图?——快速创建地图工具+如何标注商家

原文:[百度地图API]如何快速创建带有标注的地图?--快速创建地图工具+如何标注商家 摘要: 如果你不会程序,如果你不想写代码. 如果你想拥有一张自己的地图,如果你想在该地图上标注出你商店的位置. 不要犹豫了,就使用快速创建地图工具吧! -------------------------------------------------------------------------------------- 如何快速创建地图? 一.转入百度提供的快速创建地图工具页面:http://openap

自己创建的文件夹-mfc对话框批量创建文件夹和空文件

问题描述 mfc对话框批量创建文件夹和空文件 mfc对话框批量创建文件夹和空文件,创建文件夹和文件,才学mfc,求解答,求案例 解决方案 CreateDirectory API 解决方案二: 创建空文件用CreateFile,再 CloseFile 解决方案三: 可以用windowsAPI,可以用System()执行md命令. 解决方案四: 得到sFolder了,就可以CreateFile来创建. 解决方案五: CreateDirectory/CFile::Open(...)/Close()/C