生成峰度大于 3 的随机正态分布

Question

正态分布的峰度为 3。随着分布中离群值的增加，尾部变为 "fat"，峰度增加超过 3。

如何在峰度大于 3（最好在 5-7 左右）的两个数字之间生成随机分布？

进口

import numpy as np
import scipy.stats import kurtosis

0.01-0.10之间随机制服

# Random Uniform Distribution
runif = np.random.uniform(0.01, 0.10, 10000)

kurtosis(runif, fisher=False)

1.8124891901330156

随机正常在0.01-0.10之间

lower = 0.01
upper = 0.10
mu = (upper)/2
sigma = 0.01
N = 10000
retstats = scipy.stats.truncnorm.rvs((lower-mu)/sigma,(upper-mu)/sigma,loc=mu,scale=sigma,size=N)

mean = .05
stdev = .01  # 99.73% chance the sample will fall in your desired range

values = [gauss(mean, stdev) for _ in range(10000)]

kurtosis(values, fisher=False)

3.015004351756201

带有肥尾的随机正态分布在 0.01-0.10 之间

???

Answer 1

由于峰度不是正态分布函数的参数之一，您必须使用另一种方法来生成近似正态分布的函数。它变得复杂。看看这个： https://stats.stackexchange.com/questions/43482/transformation-to-increase-kurtosis-and-skewness-of-normal-r-v

上面的 link 给出了使用 R（叹息）代码的示例，但我认为它足够简单，可以让您在 Python 中编写等效代码。这是我所知道的允许您实现此目的的几个扩展（即功能分层）之一。

不幸的是，据我所知没有简单的解决方案。

Answer 2

正态分布的峰度始终为 3。均匀分布的峰度始终为 9/5。长尾分布的峰度高于 3。例如，拉普拉斯的峰度为 6。[请注意，通常这些分布是根据超额峰度定义的，等于实际峰度减去 3。]参见 table 这里： http://mathworld.wolfram.com/KurtosisExcess.html

但是，通过切断尾部，您仅降低了峰度。通过切割尾部，不可能生成峰度高于 3 的正态分布。为了生成范围有限且峰度高的分布，您需要确保切割对尾部的影响最小，并从长尾（非正态）分布。通俗地说，你需要有一个非常尖锐的分布。我使用带有小指数衰减参数的拉普拉斯在下面生成了一个。

import numpy as np                                                                       
from scipy.stats import kurtosis                                                         

min_range = 0.01                                                                         
max_range = 0.10                                                                         
midpoint = (max_range + min_range)/2                                                     
samples = 10000                                                                          

def filter_tails(x):                                                                     
    return x[(x >= min_range) & (x <= max_range)]                                        

runif = np.random.uniform(min_range, max_range, samples)                                 
value = kurtosis(filter_tails(runif), fisher=False)                                      
print(f"uniform kurtosis = {value}")                                                     

sigma = 0.01                                                                             
runif = np.random.normal(midpoint, sigma, samples)                                       
value = kurtosis(filter_tails(runif), fisher=False)                                      
print(f"gaussian kurtosis = {value}")                                                    

exponential_decay = 0.001                                                                
runif = np.random.laplace(midpoint, exponential_decay, samples)                          
value = kurtosis(filter_tails(runif), fisher=False)                                      
print(f"laplace kurtosis = {value}")

运行脚本，我得到：

uniform kurtosis = 1.8011863970680828
gaussian kurtosis = 3.0335178694177785
laplace kurtosis = 5.76290423111418

生成峰度大于 3 的随机正态分布

Generate random normal distribution with kurtosis greater than 3

python

statistics

numpy

normal-distribution