计算当前概率相对于先验概率以获得均匀分布

Calculate current probability in respect to prior probabilities to get uniform distribution

免责声明:不确定问题标题是否准确...

假设我需要在接下来的 100 分钟内洗碗。我知道我最迟 必须 在 100 分钟后执行此操作。我每2分钟问自己一次"should I do it or not?"(所以我一共问了自己50次)。每次我问自己是否应该做这件事时,我想计算我做这件事的概率,这将决定我现在是否做。概率应该是这样的,如果我重复这个实验一百万次,那么我在 2 分钟、4 分钟、6 分钟等之后做它的可能性几乎是均匀的——或者换句话说,均匀分布做的概率。

我做了一个实验,我将个体概率设置为 check_number / total_number_of_checks 但这似乎没有给出正确的结果。有什么想法吗?

# gem install ascii_charts
require 'ascii_charts'

time_frame = 100
check_frequenzy = 2
number_of_checks = time_frame / check_frequenzy

checks = (1..number_of_checks)

result = {}
checks.each do |i|
  result[i] = 0
end

10_000.times do |t|
  checks.each do |check_number|
    probability = check_number/number_of_checks.to_f
    if rand() <= probability
      # Oh no! I need to do the dishes now :-(
      result[check_number] += 1
      break
    end
  end
end

puts AsciiCharts::Cartesian.new(result.to_a).draw

#=>

950|                                                                                                                                                      
900|                *  *  *                                                                                                                               
850|                         *                                                                                                                            
800|             *                                                                                                                                        
750|                            *                                                                                                                         
700|          *                                                                                                                                           
650|                               *                                                                                                                      
600|       *                          *                                                                                                                   
550|                                                                                                                                                      
500|                                     *                                                                                                                
450|                                                                                                                                                      
400|    *                                                                                                                                                 
350|                                        *                                                                                                             
300|                                           *                                                                                                          
250|                                                                                                                                                      
200| *                                            *                                                                                                       
150|                                                 *                                                                                                    
100|                                                    *                                                                                                 
 50|                                                       *  *  *                                                                                        
  0+----------------------------------------------------------------*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*-
     1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 

您可以使用 Bayes' Theorem.

计算这些条件概率

T 成为一个随机变量,等于洗碗的时间(以分钟为单位)。

我假设概率是 "linear"(在 0 到 100 分钟之间),你的意思是,对于任何随机变量 t:

P[T <= t] = .01*t, 0 <= t <= 100

如果在 t0 时间没有洗碗,则在接下来的两分钟内洗碗的(条件)概率为:

P[T <= t+2| T > t] = P[T <= t+2 and T > t] / P[T > t]
                   = (P[T <= t+2] - P[T <= t]) / (1-P[T <= t])
                   = (.01*(t+2) - .01t) / (1-.01t)
                   = 2/(100-t)

P[T <= t+2| T > t] 阅读,"the probability (the value of) T is less than or equal t+2, given that (the value of) T is greater than t".

因此:

P[T <=   2 | T >  0] = 2/98
P[T <=   4 | T >  2] = 2/96
...
P[T <=  98 | T > 96] = 2/4
P[T <= 100 | T > 98] = 2/2

如果你放弃线性要求,对我来说,如果我们在谈论菜肴:

P[T <= 98] #=> 0

给定 N 次完成任务的机会,每个机会都有 1/N 的等概率,您可以使用以下算法即时选择一个随机机会。 (我不知道 Ruby 所以我使用了伪代码。)

for i from 1 to N
    r = random integer from 0 to N-i inclusive
    if r == 0
        return 2*i  // wash dishes now, at the ith opportunity (2*i minutes)
                    // otherwise continue the loop

对于N=50的情况,这意味着第一次机会的概率是p(1) = 1/50。之后,第二次机会的概率为p(2) = 1/49。在此之后,p(3) = 1/48,以此类推直到 p(50) = 1/1,这意味着如果我们还没有完成任务,我们必须在最后机会完成。


我们可以确认这为每个机会提供了统一的概率,只需将各个概率相乘直到给定点。比如第4次的机会...

  • 第一次完成任务的概率是49/50
  • 第二次完成任务的概率是48/49
  • 第 3 次完成任务的概率是47/48
  • 第 4 次任务的概率是1/47

产品将 49/50 * 48/49 * 47/48 * 1/47 = 1/50,如您所愿。


也就是说:probability = check_number/number_of_checks.to_f需要改成:probability = 1.0/(number_of_checks - check_number)

这将呈现:

260|                                                                                                                *                                     
240|                                           *                                                                       *                                  
220|             *                                *  *              *              *     *              *     *  *        *  *  *              *  *       
200| *  *  *  *           *  *              *           *  *  *  *     *  *  *  *           *        *     *                       *  *              *    
180|                *  *        *  *  *  *                                            *        *  *                                      *  *             
160|                                                                                                                                                      
140|                                                                                                                                                      
120|                                                                                                                                                      
100|                                                                                                                                                      
 80|                                                                                                                                                      
 60|                                                                                                                                                      
 40|                                                                                                                                                      
 20|                                                                                                                                                      
  0+----------------------------------------------------------------------------------------------------------------------------------------------------*-
     1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 

如果您特别好奇,即使您事先不知道机会的数量 N,实际上也可以生成均匀分布。请参阅 reservoir sampling 了解如何执行此操作。