Apollo Connecting the World

Diligence and Intelligence

[zz]概率论感觉测试(答案)

leave a comment »

谢谢大家提出的建议。我改了一些这里的小错误。

1.  假设考试周为1个礼拜(周一到周日),且考试时间为均匀分布,假使你有3门考试,则最后一门考试大约在

A. 周五
B. 周六
C. 周日

Answer: B. 一般的讲在[0,1]之间n个均匀分布的随机变量最大值期望为n/(n+1), 也就是可以认为这n个随机变量分别大约在 1/(n+1), 2/(n+1),…, n(n+1)。这道题那么算一下大概就是在周六的上午。

2. 如果你去参与一项赌博,每次的回报为正态分布,假设你赌了100把发现赢了10000块(明显是很小概率事件,但假设确实发生了),那么你觉得你最有可能是因为

A. 有一把赢了很多
B. 一直在慢慢的赢
C. 两种情况都有可能

Answer: B. 也许答案对很多人有些出乎意料。在这种情况下,可能一般觉得能够连续赢很多把很难,但是实际上赢一把大的更难。这个问题是随机变量的长尾还是短尾的问题。长尾的意思就是取离均值很远的概率不是很小,而短尾正好相反。题目中的正态分布属于短尾,因为密度函数是按照平方的指数下降的,如果稍微改一下题目中的分布,则有可能是因为一次赢了很大而最后赢的。另外说一句,有一本书叫《长尾理论》,里面说明了现在的经济中有很多东西是长尾的,比如说一年销量排在100000名之后的歌曲仍然能占据市场的一部分。这是电子商务流行的很重要原因,因为不必支付储存这个长尾的cost。

3. 有一根密度不均匀的绳子,你想通过测量多点的密度来估计他的重量(你知道截面积)。则如果给你n次测量密度的机会的话,如果n很大,(估算质量就通过这些点取平均然后乘以截面积)

A. 按规律等间隔选取测量点会测得准些
B. 随机选取测量点会测得准些
C. 两种方法差不多

Answer: A. 也许这个也略有些意外。对于一维的情况,方法A略好于方法B。但是在高维的情况下方法A就一般情况下不如方法B了,原因是要想获得相同的效果,这个“有规律的点”需要选取太多。这是所谓的Quasi-Monte Carlo Sampling 和 Monte Carlo Sampling之间的关系。

4. 台湾大选,假定马英九最终得到600000票,谢长廷得到400000票,如果一张一张的唱票,则过程中马英九一直领先谢长廷的概率为

A. 0.1
B. 0.2
C. 0.3
D. 0.4

Answer: B. 直觉上讲这个概率并不会太大,而且尤其是在前面几张的时候多少会出现一些反复。实际上这个结果跟一共多少人投票没什么关系,如果得票比例为a:b (a>b),则这个概率为(a-b)/(a+b)。

5.  你拿10块钱去赌场赌大小,你有两种玩法,一种是每次赌10块,一种每次赌1块,赢了翻倍,输了就没有了。你决定全部输光或者赢到100块就走,则

A. 两种方法输光的概率一样
B. 第一种输光的概率较大
C. 第二种输光的概率较大

Answer: A. 不管什么赌法都不会改变这个概率(如果每一次期望都是0, 且最终不能超过100)。这是随机过程中一个比较简单但是很有意义的结论,意思就是说you can’t beat the system。因此对于像股市,赌博这种系统,如果你假设了随机性(期望为0),则其实怎么操作结果都是一样的,重要的在于发掘其中的非随机性。另外,到100的概率很容易计算,因为初始值是10,假设到100的概率为p,则有100p+0(1-p)=10,也即p=0.1

6. 100个球随机的放在100个箱子里,最后空箱子的数量大约是

A.  0-10
B.  10-20
C.  20-30
D.  30-40
Answer: D. 这个题可以用简单的概率论计算。结论是不管多少个球,c*n个球放到n个箱子里,最后空箱子的个数约为ne^-c,现在的情况是箱子数和球数一样多,那么就约为100*e^-1.

7、打10000副拱猪,总共持有9500-10500个A的概率大约在

A.  80%-90%
B.  90%-95%
C.  95%-99%
D.  99%以上

Answer: D. 这个可以用中心极限定理计算。事实上这个题也不需要计算,只是要考察大家的一个感觉,实际上这个概率大于0.99…9,可以有9个9,尽管有时候我们打牌仍然觉得牌总是很差。。只是我们不注意我们抓好牌的时候罢了。

8. 有以下几个国家,每个国家有自己的习俗。问哪个国家长期以后男人的比例最大

A.  每个家庭不断的生孩子直到得到第一个男孩为止
B.  每个家庭不断的生孩子直到得到第一个女孩为止
C.  每个家庭不断的生孩子直到得到一男一女为止
D.  以上几个国家最后男女比例基本一样

Answer: D. 我们只需要考察一个家庭最后产生多少男女即可以。用概率的方法可以得到不管哪个方法都是1:1。事实上,我们只是把一个很长的男女的序列按照不同的方式来截断。当然这个序列本上包含多少男女是不变的。我每次都愿意以另外一个例子来说明,那就是如果我们在网上下棋,可以每天下到第一盘输为止或是第一盘赢为止或是有输有赢为止,显然不管怎样,因为你的实力是恒定的,你永远都是你本来应有的胜率。

9. 实验室测试灯泡的寿命。在灯泡坏的时候立刻换新灯泡。灯泡寿命约为1小时。考察10000小时时亮着的那个灯泡

A.  那个灯泡的寿命期望也约为1小时
B.  那个灯泡的寿命期望约为2个小时
C.  那个灯泡的期望寿命约为0.5个小时
D.  以上说法都不对

Answer: B. 这个题可能稍难。如果具体的算需要一点本科高年级的知识。不过我们仍然可以从直觉得到结果。事实上,当每个灯泡或是我们观测的事物的生命(Life time) 是随机的时候。在时间足够久以后的一点,那个事物的寿命要长于这个事物本身平均的寿命。因为正是因为它寿命长导致我们容易观测到。简单的说,如果灯泡有两种,一种只能坚持1小时,一种能坚持100小时,那我们观测到的99%都可能是100小时那个。所以观测到的平均寿命较长。通常我们认为灯泡的寿命是指数分布的,在这个情况下,答案是2倍。对于一般的分布,甚至有可能平均寿命有限,而观测的那个寿命期望是无限的。这个问题在美国一次监狱调查中被发现,即被调查的囚犯的平均被判刑年数要远大于全美平均判刑的年数。

10. 如果一个群体里,每个个体以0.2的概率没有后代,0.6的概率有1个后代,0.2的概率有两个后代,则

A.  这个群体最后会灭绝
B.  这个群体最后将稳定在一个分布,即种群大小在一定范围内震荡
C.  这个群体最后将爆炸,人口将到无穷
D.  不一定会发生什么

Answer: A. 这是个简单的人口模型。这个可能直觉比较困难,但是这个实际上和后面的一道题道理是一样的。注意到每一代的期望总是1。因此根据上次的答案,这个群体最后会灭绝。对于这种模型,当每一代的期望小于等于1时,最后的结果都是会灭绝。对于期望大于1的情况,我们也可以很简单的通过解方程得到灭绝的概率。

11. 给一个1-n的排列,与原来位置相同的数字的个数的期望大约是 (如 n=5 则51324 与原来位置只有3是相同的)

A.  1
B.  log n
C.  ln n

Answer: A. 这个题要去算有几个相同的概率是比较难的,不过实际上有一个很简单的方法。在第1个位置,这个排列的第1个数字为1的概率为1/n,而期望是可加的,所以总共与原来位置相同的数字的个数的期望应该是1。也就是说不管是多少的数字,平均总是有一个数与顺序是相同的。这个题会非常经常出现在考试和习题中。

12. 如果有3个门,有一个背后有大奖。你选中一个,主持人知道哪个门后面有奖,并且总会打开另外两个中的某个没奖的。现在你有一次换得机会,你应该

A.  换
B.  不换
C.  换不换都一样

Answer: A. 这个是网上非常经典的一个问题了。不换正确的概率是1/3,换正确得概率是2/3。我比较喜欢这样去想,试想一下如果有100个门,你先选定1个,然后主持人打开98个空的,然后给你机会换不换。我想如果这样,你不难做出正确的选择。

13.  以下那件事情发生的期望时间最短

A.  在第0秒,一个物体从原点出发,每一秒以概率1/2向左走,1/2向右走,第一次回到原点的时间
B.  一只猴子,每秒种随便按键盘上的一个键,第一次打出”Beijing Welcomes You”的时间
C.  在第0秒,一个物体从原点出发,每一秒以概率1/2向左走,1/2向右走,第一次到达1的时间

Answer: B. A和C两个事件发生的时间的期望都是+inf. 只有B是有限的。A和C说明了等概率的赌博不可能赢钱(如果C是有限的则参加赌大小的游戏总能赢钱了)。而B说明的是另外一条概率上的定理,“What always stands a reasonable chance of happening will almost surely happen, sooner rather than later”,也就是说从任何时刻开始,总有一个固定的概率发生的事情(比如一个猴子打出beijing welcomes you, 这个概率可能是 1/26^20左右),不过这个概率是多少,这件事情早晚能发生。

14,  美国的25分硬币共有50种,上面有50个州的图案,如果我们每次得到的硬币是随机的,则大约收集多少可以收集全

A.  200
B.  300
C.  400
D.  500

Answer: A. 这是所谓的收集硬币问题。具体解法不是很容易。不过结论是要收集齐n种硬币,需要大约nlogn个。大约思路是收集第k个时候需要大约n/(n-k)次。平时我们收集一些食品里的卡片,也都遵循这个规律,不过多数时候每种卡片的数量都是很不同的。还记得小时候可乐里收集到苹果加蜡烛可以得到到头等奖,不过最后也没收集到任何一个苹果。

15.  假设有1000次100m短跑大赛,每次比赛的冠军成绩都在9.7-10之间均匀分布,问期望有多少次比赛比赛能够破纪录

A.  7
B.  10
C.  15
D.  32

Answer: A. 这是所谓的破纪录问题。假设均匀分布,则最后n次比赛之后这n个成绩形成一个排列。第k次创纪录的概率是这个排列中第k个在前k-1个之前的概率,也即1/k,所以n次比赛大约有1+1/2+1/3+…1/n次破纪录,也即约为logn次。

16. 在打桥牌的时候,如果你和对家共持有某门花色的9张牌,则剩余的4张牌怎样分布的概率最大

A.  2-2
B.  3-1
C.  4-0

Answer: B. 可以简单计算得到这个结果。3-1的概率应该是50%。2-2的概率是37.5%。4-0的概率是12.5%。但是如果有奇数张,则最平均的就是最可能的。

17. 如果一个物体在3维随机游动,也即每一刻他可以向左,右,上,下,前,后等概率的走,长久来看,则会发生什么情况

A.  此物体无穷多次回到原点
B.  此物体无穷多次回到任何一条坐标轴上,但不会无穷多次回到原点
C.  此物体不会无穷多次回到任何一条坐标轴上

Answer: B. 1维和2维的随机游动是常返的,也就是说会无穷多次回到起点(尽管回来的平均时间不是有限的),而3维以上的随机游动是非常返的。因此对于2维的某个坐标,此物体会无穷多次经过,但是不会无穷多次经过原点。

18. 扔10000次硬币,其中最长一次连着正面的次数大约会是多少

A.  100
B.  13
C.  9
D.  4

Answer: B.这也是一个特殊的概率问题,叫做Head Runs.答案应该是log_2^n.大约为13.

19. 有一支股票,初始价为1,每天的价值变化率独立同分布,且期望为0,不恒为0。则

A.  股票在任何时刻期望价值为1
B.  股票以概率1变成0
C.  A和B都对
D.  A和B都不对

Answer: C.这个可以参见我转载的文章The Flaw of Average和我写的文章Life is a Martingale。 也就是说对于很多投机的东西,平均值总是不变的,但是多数人都会倾家荡产。其实仔细想想很有道理,比如说你的股票第一天涨10%。第二天跌10%或是第一天跌10%,第二天涨10%,最后的结果都是跌了1%。所以要保持增长所需要的是远大于0的平均变化率,这个才是一般人难以做到的。

20. 当我们考虑一种可能重复发生的事件时,哪种方式更科学

A.  按照第一次发生这个事件的时间作为一个起点,考虑从其本身出发之后的性质
B.  按照最后一次发生这个事件的时间作为一个起点,考虑从其本身出发之后的性质
C.  以上都可以
D.  以上都不可以

Answer: A. 这个问题深一些的背景在于Kolmogorov向前向后微分方程。很多人知道向后微分方程更通用,但是并不知道原因。事实上,向后微分方程是基于A的方法对事件进行分解得到的,而向前微分方程是基于B的方法对事件进行分解的。但是有很多重复发生的事情会越发生越频繁,以致没有最后一次发生的事件。但是我们总能找到第一次发生的时间。所以A更科学。

from: http://blog.renren.com/blog/23234538/372615839

Written by apollozhao

2013/05/18 at 12:12

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: