sqlserver随机取记录方法只要用newid()即可
sqlserver已经有自带的一个newid()函数,它返回的是一个GUID,因此我们可以获取表记录时按这个newid()进行排序,因为newid()的结果是每次都不一样的,所以这样子查询的结果保证了每次排序的结果均是不一样的,以下以Northwind库中的orders表为例写一下获取10条随机记录:
语法
代码如下 | 复制代码 |
select TOP N * From TABLE Order By NewID() 例 SELECT TOP 10 * FROM Northwind.Orders ORDER BY NEWID() |
NewID()函数将创建一个 uniqueidentifier 类型的唯一值。
执行了几次感觉上符合要求,每次出来的都不一样。至于值域分布没深究,随机函数本身也是伪随机的。
做了个简单的测试
代码如下 | 复制代码 |
CREATE TABLE #t(cname char(50) ,sysid uniqueidentifier) DECLARE @i int set @i = 0 WHILE (@i) < 1760 select count(*) from |
库里一共是1760条记录,执行了几次结果在 1100 -1200 左右。
但是上面方法如果过万记录你会发现很慢哦,我们再接着来优化newid()
代码如下 | 复制代码 |
CREATE DEFINER=`root`@`%` PROCEDURE `rand_data`(IN `tbName` VARCHAR(50), IN `rowCnt` INT, IN `tbKey` VARCHAR(50)) LANGUAGE SQL NOT DETERMINISTIC CONTAINS SQL SQL SECURITY DEFINER COMMENT '随机获取若干记录,只适用于单主键表' BEGIN #获取主键名 IF tbKey IS NOT NULL THEN SET @tbKey=tbKey;#参数里面已经有,这种情况比较快 ELSE #参数里面没,从系统表查找主键,比较耗时 SELECT @tbKey:=c.COLUMN_NAME FROM INFORMATION_SCHEMA.TABLE_CONSTRAINTS AS t, INFORMATION_SCHEMA.KEY_COLUMN_USAGE AS c WHERE t.TABLE_NAME = c.TABLE_NAME AND t.TABLE_SCHEMA = c.TABLE_SCHEMA AND t.TABLE_SCHEMA = database() AND t.TABLE_NAME = tbName AND t.CONSTRAINT_TYPE = 'PRIMARY KEY'; END IF; #获取最大id,最小id和记录数 SET @getMaxIdSql = CONCAT('SELECT @maxId:=MAX(', @tbKey, '),', '@minId:=MIN(', @tbKey, '),', '@totalCnt:=COUNT(', @tbKey, ')', ' FROM `', tbName, '`;'); PREPARE getMaxId FROM @getMaxIdSql; EXECUTE getMaxId; DEALLOCATE PREPARE getMaxId; #创建临时表 DROP TABLE IF EXISTS rand_tt; SET @temTbSql = CONCAT('CREATE TEMPORARY TABLE rand_tt SELECT 0 aid,tb.* FROM `',tbName,'` tb LIMIT 0;'); PREPARE temTb FROM @temTbSql; EXECUTE temTb; DEALLOCATE PREPARE temTb; #构建获取一条记录的sql SET @randRowSql = CONCAT('INSERT INTO rand_tt SELECT @cnt:=@cnt+1 aid,tb.* FROM ', tbName, ' tb WHERE tb.', @tbKey, '=?;'); PREPARE addRow FROM @randRowSql; #生成随机记录 SET @cnt=0; insertLoop: LOOP SET @id=FLOOR(RAND()*(@maxId-@minId)+@minId); IF NOT EXISTS (SELECT id FROM rand_tt WHERE id=@id) THEN EXECUTE addRow USING @id; IF @cnt >= rowCnt OR @cnt >= @totalCnt THEN LEAVE insertLoop; END IF; END IF; END LOOP insertLoop; DEALLOCATE PREPARE addRow; #返回数据 ALTER TABLE rand_tt DROP COLUMN aid; SELECT * FROM rand_tt; |
END这样我再执行你会发现100W数据只要0.几步即可解决哦。
时间: 2024-11-16 10:49:36