careercup-中等难度 17.11

17.11 给定rand5(),实现一个方法rand7().也即,给定一个产生0到4(含)随机数的方法,编写一个产生0到6(含)随机数的方法。

解法:

这个函数要正确实现,则返回0到6之间的值,每个值的概率必须为1/7.

1 第一个尝试(调用次数固定)

第一个尝试时,我们可能会想产生出0到9之间的值,然后再除以7取余数。代码大致如下:

int rand7()
{
    int v=rand5()+rand5();
    return v%7;
}

可惜的是,上面的代码无法以相同的概率产生所有值。

方法二:

解答

rand5可以随机生成1,2,3,4,5;rand7可以随机生成1,2,3,4,5,6,7。 rand5并不能直接产生6,7,所以直接用rand5去实现函数rand7似乎不太好入手。 如果反过来呢?给你rand7,让你实现rand5,这个好实现吗?

一个非常直观的想法就是不断地调用rand7,直到它产生1到5之间的数,然后返回。 代码如下:

int Rand5(){
    int x = ~(1<<31); // max int
    while(x > 5)
        x = Rand7();
    return x;
}

等等,这个函数可以等概率地产生1到5的数吗?首先,它确确实实只会返回1到5这几个数, 其次,对于这些数,都是由Rand7等概率产生的(1/7),没有对任何一个数有偏袒, 直觉告诉我们,Rand5就是等概率地产生1到5的。事实呢?让我们来计算一下, 产生1到5中的数的概率是不是1/5就OK了。比如说,让我们来计算一下Rand5生成1 的概率是多少。上面的函数中有个while循环,只要没生成1到5间的数就会一直执行下去。 因此,我们要的1可能是第一次调用Rand7时产生,也可能是第二次,第三次,…第n次。 第1次就生成1,概率是1/7;第2次生成1,说明第1次没生成1到5间的数而生成了6,7, 所以概率是(2/7)*(1/7),依次类推。生成1的概率计算如下:

P(x=1)=1/7 + (2/7) * 1/7 + (2/7)^2 * 1/7 + (2/7)^3 * 1/7 + ...
      =1/7 * (1 + 2/7 + (2/7)^2 + ...) // 等比数列
      =1/7 * 1 / (1 - 2/7)
      =1/7 * 7/5
      =1/5

上述计算说明Rand5是等概率地生成1,2,3,4,5的(1/5的概率)。从上面的分析中, 我们可以得到一个一般的结论,如果a > b,那么一定可以用Randa去实现Randb。其中, Randa表示等概率生成1到a的函数,Randb表示等概率生成1到b的函数。代码如下:

// a > b
int Randb(){
    int x = ~(1<<31); // max int
    while(x > b)
        x = Randa();
    return x;
}

回到正题,现在题目要求我们要用Rand5来实现Rand7,只要我们将Rand5 映射到一个能产生更大随机数的Randa,其中a > 7,就可以套用上面的模板了。 这里要注意一点的是,你映射后的Randa一定是要满足等概率生成1到a的。比如,

Rand5() + Rand5() - 1

上述代码可以生成1到9的数,但它们是等概率生成的吗?不是。生成1只有一种组合: 两个Rand5()都生成1时:(1, 1);而生成2有两种:(1, 2)和(2, 1);生成6更多。 它们的生成是不等概率的。那要怎样找到一个等概率生成数的组合呢?

我们先给出一个组合,再来进行分析。组合如下:

5 * (Rand5() - 1) + Rand5()

Rand5产生1到5的数,减1就产生0到4的数,乘以5后可以产生的数是:0,5,10,15,20。 再加上第二个Rand5()产生的1,2,3,4,5。我们可以得到1到25, 而且每个数都只由一种组合得到,即上述代码可以等概率地生成1到25。OK, 到这基本上也就解决了。

套用上面的模板,我们可以得到如下代码:

int Rand7(){
    int x = ~(1<<31); // max int
    while(x > 7)
        x = 5 * (Rand5() - 1) + Rand5() // Rand25
    return x;
}

上面的代码有什么问题呢?可能while循环要进行很多次才能返回。 因为Rand25会产生1到25的数,而只有1到7时才跳出while循环, 生成大部分的数都舍弃掉了。这样的实现明显不好。我们应该让舍弃的数尽量少, 于是我们可以修改while中的判断条件,让x与最接近25且小于25的7的倍数相比。 于是判断条件可改为x > 21,于是x的取值就是1到21。 我们再通过取模运算把它映射到1-7即可。代码如下:

int Rand7(){
    int x = ~(1<<31); // max int
    while(x > 21)
        x = 5 * (Rand5() - 1) + Rand5() // Rand25
    return x%7 + 1;
}

这个实现就比上面的实现要好,并且可以保证等概率生成1到7的数。

让我们把这个问题泛化一下,从特殊到一般。现在我给你两个生成随机数的函数Randa, Randb。Randa和Randb分别产生1到a的随机数和1到b的随机数,a,b不相等 (相等就没必要做转换了)。现在让你用Randa实现Randb。

通过上文分析,我们可以得到步骤如下:

  1. 如果a > b,进入步骤2;否则构造Randa2 = a * (Randa – 1) + Randa, 表示生成1到a2 随机数的函数。如果a2 仍小于b,继教构造 Randa3 = a * (Randa2 - 1) + Randa…直到ak > b,这时我们得到Randak , 我们记为RandA。
  2. 步骤1中我们得到了RandA(可能是Randa或Randak ),其中A > b, 我们用下述代码构造Randb:
// A > b
int Randb(){
    int x = ~(1<<31); // max int
    while(x > b*(A/b)) // b*(A/b)表示最接近A且小于A的b的倍数
        x = RandA();
    return x%b + 1;
}

从上面一系列的分析可以发现,如果给你两个生成随机数的函数Randa和Randb, 你可以通过以下方式轻松构造Randab,生成1到a*b的随机数。

Randab = b * (Randa - 1) + Randb
Randab = a * (Randb - 1) + Randa

如果再一般化一下,我们还可以把问题变成:给你一个随机生成a到b的函数, 用它去实现一个随机生成c到d的函数。有兴趣的同学可以思考一下,这里不再讨论。

时间: 2024-10-02 09:03:00

careercup-中等难度 17.11的相关文章

OC语言实现中等难度通讯录

实现中等难度通讯录.需求: 1.定义联系⼈人类Contact.实例变量:姓名(拼⾳音,⾸首字⺟母⼤大写).性别.电话号码. 住址.分组名称.年龄.⽅方法:⾃自定义初始化⽅方法(姓名.电话号码).显⽰示联系⼈人信息 2.在main.m中定义字典,分组管理所有联系⼈人.分组名为26个⼤大写的英⽂文字⺟母. 3.可以添加联系⼈人对象,如果姓名或电话号码为空,添加失败.添加联系⼈人到匹配的分 组. 4.获取某个分组名称下所有联系⼈人,并且按照姓名升序排列. 5.从通讯录中根据电话号码搜索联系⼈人. 6.

17/11/24 05:08:44 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

2017-11-24 21:20:25 1:什么叫失望,什么叫绝望.总之是一脸懵逼的继续...... 之前部署的hadoop都是hadoop-2.4.1.tar.gz,这几天换成了hadoop-2.6.4.tar.gz,部署老生常谈,启动就不一样了,本来吧,也就是warn,不是error,启动hdfs和yarn,节点都可以正常启动,但是对于我这种强迫症,能容忍下面这一大推错误吗?当你看到这篇的时候,显然是不能,虽然网上已经有很多了,但是貌似好多还是不好使.我呢,也算脑补.记录一下. [root@

careercup-中等难度 17.6

17.6 给定一个整数数组,编写一个函数,找出索引m和n,只要将m和n之间的元素排好序,整个数组就是有序的.注意:n越小越好,也就是说,找出符合条件的最短序列. 解法: 开始解题之前,让我们先确认一下答案会是什么样的.如果要找的是两个索引,这表明数组中间有一段有待排序,其中数组开头和末尾部分是排好序的. 现在,我们借用下面的例子来解决此题: 1,2,4,7,10,11,7,12,6,7,16,18,19 首先映入脑海的想法可能是,直接找出位于开头的最长递增子序列,以及位于末尾的最长递增子序列.

careercup-中等难度 17.7

17.7 给定一个整数,打印该整数的英文描述(例如"One Thousand,Two Hundred Thirty Four"). 解法: 举个例子,在转换19 323 984时,我们可以考虑分段处理,没三位转换一次,并在适当的地方插入"thousand"(千)和"million"(百万).也即, convert(19 323 984)=convert(19)+ " million "+convert(323)+"

careercup-中等难度 17.3

17.3 写一个算法计算n的阶乘末尾0的个数? 解答: 首先,算出n的阶乘的结果再去计算末尾有多少个0这种方法是不可取的, 因为n的阶乘是一个非常大的数,分分种就会溢出.我们应当去分析, 是什么使n的阶乘结果末尾出现0. n阶乘末尾的0来自因子5和2相乘,5*2=10.因此,我们只需要计算n的阶乘里, 有多少对5和2.注意到2出现的频率比5多,因此,我们只需要计算有多少个因子5即可. 我们可以列举一些例子,看看需要注意些什么: 5!, 包含1*5, 1个5 10!, 包含1*5,2*5, 2个5

careercup-中等难度 17.9

17.9 设计一个方法,找出任意指定单词在一本书中的出现频率. 解法: 1 单次查询 遍历这本书的每个单词,计算给定单词出现的次数.时间复杂度O(n),我们无法继续优化它,因为书中的每个单次都需要访问一次.当然,如果我们假设书中的单词是均匀分布的,那我们就可以只统计前半本书某个单次出现的次数,然后乘以2:或是只统计前四分之一本书某个单次出现的次数,然后乘以4. 2 多次查询 如果我们要重复执行查询,那么,或许值得我们多花些时间,多花些内存,对全书进行预处理.我们可以构造一个散列表,将单词映射到该

careercup-中等难度 17.8

17.8 给定一个整数数组(有正数和负数),找出总和最大的连续序列,并返回总和. 解法: 就是求连续子序列的和最大,不过存在一个问题: 假设整个数组都是负数,怎么样才是正确的行为呢?看看这个简单的数组{-3,-10,-5},一下答案每个都可以说的通: -3(假设子序列不能为空) 0(子序列的长度为空) INT_MIN(视为错误的情况) 我们会选择第二种(maxSum=0),但并没有所谓的"正确"答案.这一点可以跟面试官好好讨论一番.   C++实现代码: #include<ios

careercup-中等难度 17.5

17.5 写一个函数来模拟游戏. 游戏规则如下: 4个槽,里面放4个球,球的颜色有4种,红(R ),黄(Y),绿(G),蓝(B).比如, 给出一个排列RGGB,表示第一个槽放红色球,第二和第三个槽放绿色球,第四个槽放蓝色球. 你要去猜这个排列.比如你可能猜排列是:YRGB.当你猜的颜色是正确的,位置也是正确的, 你就得到一个hit,比如上面第3和第4个槽猜的和真实排列一样(都是GB),所以得到2个hit. 如果你猜的颜色在真实排列中是存在的,但位置没猜对,你就得到一个pseudo-hit.比如,

careercup-中等难度 17.4

17.4 编写一个方法,找出两个数字中最大的那一个.不得使用if-else或其他比较运算符. 解法: 我们可以通过一步步的分析来将需要用到的if-else和比较操作符去掉: If a > b, return a; else, return b. If (a - b) < 0, return b; else, return a. If (a - b) < 0, 令k = 1; else, 令k = 0. return a - k * (a - b). 令z = a - b. 令k是z的最高