现在有1500万条数据,想从中随机抽取50万条,采用什么方式比较快捷?

问题描述

现在有1500万条数据,想从中随机抽取50万条,采用什么方式比较快捷?
现在有1500万条数据,想从中随机抽取50万条,采用什么方式比较快捷。数据是存储在mysql里的。

解决方案

额,试试随机生成Where条件来做

解决方案二:
SELECT * FROM table_name ORDER BY RAND() limit 500000

解决方案三:
随机获取索引,limit 会连续取值,不会随机

解决方案四:
随机获取索引,limit 会连续取值,不会随机

解决方案五:
ORDER BY RAND() 比较慢

http://jan.kneschke.de/projects/mysql/order-by-rand/

解决方案六:
如果你表里面有个数值型的递增的唯一主键a从1开始table有俩字段ab;
select tt.att.b
from (select a b from table) tt
where tt.a in
(select FLOOR(1 + RAND() * 15000000)
from dual
connect by limit 500000);
如果没有这样的主键就row_number()下再用上面的方法
由于没有装mysql上面的代码可能要调试下希望这个思想能帮助你

时间: 2024-09-17 11:23:58

现在有1500万条数据,想从中随机抽取50万条,采用什么方式比较快捷?的相关文章

通过T_sql语句向其中一次填入一条数据或一次填入多条数据的方式填充数据

使用T_SQL创建数据库 TestSchool 创建一个学生表 TblStudent 创建学生成绩表 TblScore q tScoreId (成绩 id, 主键 , 自动编号). tSId (学生编号). tEnglish (英语成绩). tMath (数学成绩) 创建老师表 TblTeacher q tTId . tTName . tTGender . tTAge . tTSalary . tTBirthday 并使用T_sql语句向其中一次填入一条数据或一次填入多条数据的方式填入数据. (

从500万条数据中查询,求优化一条SQL语句

问题描述 表结构如下,里面有500W数据.我没有权限修改这个表,所以请大家给我优化下SQL查询CREATE TABLE IF NOT EXISTS `jdp_tb_trade` ( `tid` bigint(20) NOT NULL, `status` varchar(64) DEFAULT NULL, `type` varchar(64) DEFAULT NULL, `seller_nick` varchar(32) DEFAULT NULL, `buyer_nick` varchar(32)

点击事件删除所在行,并在数据库删除这条数据

问题描述 点击事件删除所在行,并在数据库删除这条数据 想这个delete点击事件后,能够删除这条数据 解决方案 前台页面的删除,你可以删除元素,也可以删除后重新加载页面,之后删除这条数据么,把id传到后台,delete form where id=? 就可以了,没懂你哪里不会 解决方案二: 这些不都是有系统方法可以实现的吗?有不懂的直接查方法就好! 解决方案三: 我觉得是这样,点击后生成一个sql语句,然后发到数据库,删除记录. 解决方案四: 在事件中,产生一个SQL删除语句,并执行即可. 解决

急急急!!!asp.net 设置一条数据为默认值

问题描述 急急急!!!asp.net 设置一条数据为默认值 现在有两条,但是要求只能显示一条.因为它导出excel,就会导出两条,然后不符合要求,另外一个excel也会报错.所以我想做一个默认值,只能选择显示一个默认值.各位大神帮帮忙,在线等. 解决方案 导出excel,和多少条没关系吧,是不是你代码有bug啊 解决方案二: 还是没看懂. 只显示一条只要用来绑定的数据查询用 SELECT TOP 1 * FROM ... 的方式进行限定不就行了?

用时间控制要变化的数据怎么做呢-- 一条数据显示一天。到第二天显示下一条数据

问题描述 我有个表例如:idtitle1中国你好,我爱中国2你来了.我叫的么3怎么区别你和我的存在我在页面中用一个table显示其中的一条数据但是我的条件是一条数据显示一天.到第二天显示下一条数据我应该怎么写这个sql语句呢 解决方案 解决方案二:获取下一次显示的数据再定时执行解决方案三:或者直接写在代码里面判断当时间为24:00:00是获取下一条再显示

asp.net DataTable相关操作集锦(筛选,取前N条数据,去重复行,获取指定列数据等)_实用技巧

本文实例总结了asp.net DataTable相关操作.分享给大家供大家参考,具体如下: #region DataTable筛选,排序返回符合条件行组成的新DataTable或直接用DefaultView按条件返回 /// <summary> /// DataTable筛选,排序返回符合条件行组成的新DataTable或直接用DefaultView按条件返回 /// eg:SortExprDataTable(dt,"Sex='男'","Time Desc&quo

javascript-JS关于生成有20W条数据的静态树

问题描述 JS关于生成有20W条数据的静态树 这里有20W条数据,每个数据有ID,PID,NAME属性.现在要把这20W条数据从后台一次性读取,在JAVA中利用freemarker.jar参照模板问卷生成html.现在利用Jquery-zTree做出的静态页面打开需要14s左右,用梅花树倒是非常快,2s搞定.但请问还有没有更快的解决方式? 解决方案 用hightChart绑定,或者用 D3.js都可以.速度还是挺快的.

Twitter发布第50亿条消息

Current Media高管罗宾·斯隆 北京时间10月20早间消息,据国外媒体今日报道,Twitter用户已经发布了50亿条消息.第50亿条消息是由有线电视公司Current Media高管罗宾·斯隆(Robin Sloan)发布的. 斯隆是在回复另外一名用户的消息时发送该消息的,内容为"Oh lord".判断斯隆这条消息是Twitter上第50亿条消息的依据是,Twitter消息的链接末尾的数字表示已经发布的消息总数. 业内分析师指出,Twitter增速已经放慢.Twitter最近

1号店副总裁潘荠:今年新增50万种品类

1号店市场部副总裁潘荠 (TechWeb配图)4 月16日,1号店市场部副总裁潘荠对TechWeb表示,目前,1号店在线销售超过20万种商品,计划再新增50万种品类.同时"无限1号店"以崭新面目重登京城.据1号店方面介绍,这次的无限1号店有两个创新: 一,精准化定位母婴品类;二,国内首次尝试动态电子货架.2008年以超市类用品切入电子商务的1号店,自创业初期即以"综合化平台"之路作为企业发展方向,目前,在线销售超过20万种商品,涵盖食品饮料.美容护理.厨卫清洁.母婴