问题描述
- hive随机抽取数据,保证数据随机性
-
在hive中随机抽取1000条数据,保证数据的随机性,确保两次抽取数据的不一致。
解决方案
本人已经解决,仅供参考
select * from mydata order by rand() limit 1000;
order by 排序
order by rand() 随机排序
limit 1000 取出前一千条数据
order by rand() limit 1000 取出随机排序后的前一千条数据
解决方案二:
http://blog.sina.com.cn/s/blog_940224600101e8kx.html
时间: 2024-09-15 00:04:33