在PostgreSQL中如何生成线性相关的测试数据

生成线性相关的测试数据。
同样可以用到generate_series和随机数。
例子
生成10万条随机数字。

select trunc(10000 + 1000000*random()) id from generate_series(1,100000);

根据刚才那组数据,加减5以内的随机数,生成另一组数字。

select id, trunc(id + 5-random()*10) from
(select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t;

如下

postgres=# create table corr_test(c1 int, c2 int);
CREATE TABLE
postgres=# insert into corr_test select id, trunc(id + 5-random()10) from (select trunc(10000 + 1000000random()) id from generate_series(1,100000)) t;
INSERT 0 100000

线性相关性如下:

postgres=# select corr(id, trunc(id + 5-random()10)) from (select trunc(10000 + 1000000random()) id from generate_series(1,100000)) t;
       corr
-------------------
 0.999999999954681
(1 row)
... ...
postgres=# select corr(id, trunc(id + 5-random()10)) from (select trunc(10000 + 1000000random()) id from generate_series(1,100000)) t;
       corr
-------------------
 0.999999999954898
(1 row)

p元回归的测试数据也可以使用以上方法生成。

时间: 2025-01-19 09:36:56

在PostgreSQL中如何生成线性相关的测试数据的相关文章

在PostgreSQL中如何生成kmean算法的测试数据

生成Kmeans的测试数据.例如每10000为界,生成10个种子,每个节点以100内的随机数相加,生成一组测试数据. postgres=# create table test(id int, rand int); CREATE TABLE postgres=# insert into test select id10000,trunc(random()100 + id*10000) from generate_series(1,10) t(id), generate_series(1,10000

旋转门数据压缩算法在PostgreSQL中的实现 - 流式压缩在物联网、监控、传感器等场景的应用

背景 在物联网.监控.传感器.金融等应用领域,数据在时间维度上流式的产生,而且数据量非常庞大. 例如我们经常看到的性能监控视图,就是很多点在时间维度上描绘的曲线. 又比如金融行业的走势数据等等. 我们想象一下,如果每个传感器或指标每100毫秒产生1个点,一天就是864000个点. 而传感器或指标是非常多的,例如有100万个传感器或指标,一天的量就接近一亿的量. 假设我们要描绘一个时间段的图形,这么多的点,渲染估计都要很久. 那么有没有好的压缩算法,即能保证失真度,又能很好的对数据进行压缩呢? 旋

PostgreSQL 中如何找出记录中是否包含编码范围内的字符,例如是否包含中文

标签 PostgreSQL , 是否含有中文 背景 从已有字符串内容中找出含有中文,或者找出含有单字节字符的记录. 方法要从字符串在数据库中的编码和存储说起.比如多字节字符集,单字节字符SQL_ASCII. 比如PostgreSQL中UTF8, EUC_CN属于多字节字符集,编码为变长编码. SQL_ASCII为无编码字符集,存储为字节流. 要从不同字符集中找出含有中文的记录,该怎么找? 测试环境 已有数据库如下,注意编码 postgres=# \l List of databases Name

Visual Studio 2010生成SQL Server测试数据

1.创建SQL Server 2005数据库项目 首先,打开Visual Studio 2010,选择新建项目,在下图中,选择建立一个SQL Server 2005的数据库项目,命名为Database1 2.导入数据 在数据库项目中鼠标右键,在弹出的菜单中选择"导入数据对象和设置",如下图: 这时会打开一个数据导入的向导窗口,如下图,会提示用户连接已有的数据库,我们只需要简单按照向导说的去一步步完成即可. 选择需要的数据,并进行测试: 在数据导入完成后,会出现如下的提示信息,表示数据已

曾国藩的"顺势而为"在PostgreSQL中的价值体现

后人对曾国藩的一些评论:"曾国藩顺势而为 成就一番事业,并一定程度上做了一些推动历史前进的事情". "顺势而为"这个词实在是用得太好了,我们身在数字时代,更加应该懂得顺势而为的道理,比如在金融行业中,不断变化的股价:在物联网的传感器中,不断上报的数字:由数据监测不断画出的曲线等等,这些无不体现着一个字:"势". 我们来看看使用PostgreSQL数据库如何抓住这个"势"呢? 首先贴一个最小二乘法least-squares-fi

.NET中如何生成静态页

如何生成静态页:       方案1:    ///   <summary>    ///   传入URL返回网页的html代码    ///   </summary>    ///   <param   name="Url">URL</param>    ///   <returns></returns>    public   static     string   getUrltoHtml(string  

在ASP.NET中动态生成图形(转)

asp.net|动态|图形 在ASP.NET中动态生成图形 .NET有一个很灵巧的特性,就是可以编写代码生成动态图形,然后将生成的图形保存在磁盘上或者直接将其发送到客户端的浏览器. 原理 用.NET生成图形的功能封装在System.Drawing名称空间中,它支持多种图形文件格式,包括:JPEG.GIF.PNG.TIFF.BMP.PhotoCD.FlashPIX.WMF.EMF和EXIF. 创建这些图形的通用机制是构造一个BitMap(位图)对象,它为要创建的图形提供了内存空间.然后,就可以调用

JavaScript中用于生成随机数的Math.random()方法

  这篇文章主要介绍了JavaScript中用于生成随机数的Math.random()方法,是JS入门学习中的基础知识,需要的朋友可以参考下 此方法返回0(含)和1(不包括)之间的随机数 语法 ? 1 Math.random() ; 下面是参数的详细信息: NA 返回值: 返回0(含)和1(不包括)之间的随机数 例子: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 <html> <head> <title>

在Word2007中快速生成指定段落数量的文字

本文我们介绍一个小技巧--在Word2007中快速生成指定段落数量的文字.大家可以用这个方法来快速生成指定段落和句子的文字,进行Word功能测试.学习等. 在Word的编辑界面中输入"=rand(X,Y)"(不包括引号),X和Y是自己指定的数字.比如这里我们写入"=rand(2,3)",然后回车. 电脑教程 现在Word自动给出了一段文字.仔细看,你会发现这些文字分为两段,每段有三个句子. 对,聪明的你一定已经猜到了,这些文字就是"=rand(2,3)&q