如果一个女生说,她集齐了十二个星座的前男友,我们应该如何估计她前男友的数量?

大家请从纯数学的角度探讨本题噢。 而且,估计数量也不仅仅应当考虑期望,评论中@chenjunrui提到谁能给一个分布函数,计算一下95%条件下的置信区间呢? 另外一种思路,是使“集齐了十二个星座”这个可能性最高的n,对于极其,极值肯定是正无穷,那么对于“刚刚有九个星座”的情况呢,n过低肯定达到九个星座的可能性小,n过大,随着十个星座等可能性增大,九个星座的可能性也要减少,所以一定会有个极大值的。
关注者
3571
被浏览
608249

350 个回答


公式:\[E\left( T \right) = n{H_n}\]
数据:
{白羊座, 金牛座, 双子座, 巨蟹座, 狮子座, 处女座, 天秤座, 天蝎座, 射手座, 摩羯座, 水瓶座, 双鱼座}
实现:
N@# HarmonicNumber@# &@12
答案:37.2385
----------------------------------------------------------------------------------------------------------------
公式:
公式: \[{p^c}\left( n \right) = \frac{{c!S_{n - 1}^{\left( {c - 1} \right)}}}{{{c^n}}}\]
数据:
n=12
实现:
DiscretePlot[c!StirlingS2[n-1,c-1]/c^n/.c->12,{n,1,100}]
答案:
有10%的把握少于17个,有50%的把握少于35个.
有90%的把握少于55个,有99%的把握少于82个.
----------------------------------------------------------------------------------------------------------------
公式
公式 \[\int_0^\infty  {1 - \mathop \prod \limits_{i = 1}^n \left( {1 - {e^{ - {p_i}t}}} \right){\text{d}}t} \]
数据
额外假设1:题主是中国人,所以使用中国的星座分布数据
额外假设2:题主是适龄青年,所以使用年龄18-36的星座分布数据
第一个是白羊座,然后是金牛,以此类推...
p={0.1028,0.0911,0.0843,0.0822,0.0848,0.085,0.0857,0.0795,0.0753,0.0761,0.0808,0.073}
注1:不要吐槽总和不是1,因为有舍入误差...
实现
NIntegrate[1-Fold[Times,1,1-E^(-#t)&/@p],{t,0,9527}]
答案:37.7424,就比均匀分布多了0.5个....
可以类比均值不等式理解为何分布默认均匀的时候最小
----------------------------------------------------------------------------------------------------------------
比如....哦不...显然
比如....哦不...显然
上任是处女,估摸着下任怎么着也不会是处女了...
上任是天蝎,那么我打包票,你不会也不敢有下任了.......
然后顺便把上面的星座分布不均也考虑进去...
所以我们可以用一个转移矩阵来刻画这个情况.
或者画成12个节点的加权有向图...
然后求这个加权图G的随机游走覆盖时间(Cover Time)
然后求这个加权图G的随机游走覆盖时间(Cover Time)
考虑到严谨性我应该证明一下上面的一堆公式,不过上面三个公式每个都能写篇大论文,知乎短短篇幅说不清,所以解释就化归到这个问题一并解决...

随机游走
  • 把12星座画成12个节点,然后可以作为下任的话就画个箭头
  • 箭头有个粗细程度,这个叫加权,加权决定了选这个下任的概率有多大,实际概率波动不大所以不明显
  • 分析这144个关系全都画出来就是上面这张图
  • 选男友的过程数学上被称为图G上的随机游走

Cover Time
  • 这些节点全部经过至少一遍所需要的时间叫做Cover Time
  • 子问题包括各种著名概率问题,生日问题啊,赠券收集啊等等...
  • 衍生问题还有复遍历,多重遍历什么的,可以有效用于氪金估计...
  • 退化问题,退化为Tree的话可以相当有效的进行爬虫策略优化...

显然上面三个公式都是这个问题的特例
  1. 小学生:12阶非加权完全图的Cover Time
  2. 初中生:12阶非加权完全图指定Cover程度后的Time分布
  3. 高中生:12阶加权完全图的Cover Time

这个问题数学上来说的话不难,穷举所有路径首次通过时间的分布的平均值的交错和就行了...写成公式就是这样:

记A为G的所有可能通过的路径
\[{\tau _G} = \sum\limits_A {{{\left( { - 1} \right)}^{\left| A \right| - 1}}E\left( {{T_A}} \right)} \]

虽然能写出公式然而并没有什么用,求解精确值还是个世界难题...
写成代码是这个样子的,复杂度足够让算法学家爆气...
幸好星座只有12个我的小CPU还能踉跄跑完...56个民族的话到宇宙灭亡也跑不完
(*M表示转移矩阵,i表示起始节点编号*)
CoverTime[M_,i_]:=Module[{Start,Roads,Ex,Si},
	Start=ConstantArray[0,Length[M]];Start[[i]]=1;
	Roads=Subsets[DeleteCases[Range@Length[M],i]][[2;;-1]];
	Ex=Mean@FirstPassageTimeDistribution[
		DiscreteMarkovProcess[Start,M],#]&/@Roads;
	Si=If[Length[#]~Mod~2==1,1,-1]&/@Roads;
	Total[Ex*Si]];
CoverTime[M,#]&/@Range[12]
而且蒙特卡洛效果也不太好,小规模精度不够,大规模基本跑不完...
一般可以用Matthews逼近来稍稍有效的求一下上下界...
见Markov Chains and Mixing Times一书

哦,忘记说计算结果了,初始节点对最后的结果影响不小,所以第一个男友很重要啊
第一任是处女座的话最小,只要31.64个,其他都在在35-38之间...
----------------------------------------------------------------------------------------------------------------
某些数理邪教组织啊,宣传什么
某些数理邪教组织啊,宣传什么\[\frac{1}{e}\]法则,就那个传说中能找到最理想男友的法则...
无责任超链接: 关于配偶选择理论的详细解释以及推广
人一生中会遇到大约40有可能进行交往的对象,然后可以取前\[\frac{1}{e}\]也就是13个人为实验组,考察下质量然后放弃掉,然后后面27个只要有超过前13个中最强的就嫁了吧....
Well.....So,Reasons to believe that you are the 13th rebound guy...
简单地说就是找12个星座的男生采样比较均匀...







----------------------------------------------------------------------------------------------------------------
唔,如果你相信真爱的话,说不定是这种情况:
\sum_{i=1}^{12}\frac{12}{i} = 37.23852813852814591655...