使用 bbmle package(R) 中的函数 mle2() 获取指数分布和幂律分布的参数
Use function mle2() in bbmle package(R) to get parameters for exponential and power law distribution
这是我的数据的一部分:
原始数据很大,所以我上传了一部分20行。
x <- [7.6,2.2,1.1,4.7,8.6,7.5,7.5,29.9,5.0,3.0,2.4,1.5,14.9,3.9,3.7,3.2,5.0,1.7,2.9,2.3]
这里是功能说明
- 幂律:
y=A*x^-(u)
- 指数:
y=B*exp^(-βx)
现在,我想使用 MLE(最大似然法)得到 u
的幂律,β
的指数分布。
#set likelihood function of power law
pl <- function(u){-n*log(u-1)-n*(u-1)*log(min(x))+u*sum(log(x))}
#set likelihood function of exponential distribution
ex <- function(β){-n*log(β)+β*sum(x)}
这些功能对吗?
使用mle2()获取参数:
#get the parameter u of power law
s1 <- mle2(pl,start = list(u=2),data = list(x))
summary(s1)
#get the parameter lamda of exponential distribution
s2 <- mle2(ex,start = list(β=2),data = list(x))
summary(s2)
现在有两个问题:
如何确定哪个最适合模型
使用 confint() 可以获得 95% CI,如何获得两个模型的 Rsquared 和 AIC(Akaike weigths)?
- 得到最适合数据后,如何在原始数据上方绘制拟合图?
我在 windows 7.
中使用 R.3.2.2
正如您所料。您没有指定数据的条件分布,所以我将假设正态性。 (鉴于此,您还可以使用 nls()
-- 最小二乘法 是 最大似然估计,用于正常的同方差响应),尽管 mle2
提供了更多使用优化器等的范围)
我打算使用公式界面,如果你的模型不是太复杂的话,这个界面会很方便。
幂律
mle2(y~dnorm(mean=A*x^(-mu),sd=exp(logsd),
start=list(A=...,mu=...,logsd=...),
## no need for list() if mydata is already data.frame
data=mydata)
指数
mle2(y~dnorm(mean=B*exp(-beta*x),sd=exp(logsd),
start=list(B=...,beta=...,logsd=...),
data=mydata)
... 其中 start
中的元素是任何 合理的 起始值。鉴于您上面的数据,这些方法应该在数据的一个子集上合理地工作。但是,它们在 1000 万次观察中可能表现不佳。我会考虑使用
glm(y~x,family=gaussian(link="log"),data=mydata)
拟合指数曲线并且
glm(y~log(x),family=gaussian(link="log"),data=mydata)
拟合幂律曲线。
这是我的数据的一部分:
原始数据很大,所以我上传了一部分20行。
x <- [7.6,2.2,1.1,4.7,8.6,7.5,7.5,29.9,5.0,3.0,2.4,1.5,14.9,3.9,3.7,3.2,5.0,1.7,2.9,2.3]
这里是功能说明
- 幂律:
y=A*x^-(u)
- 指数:
y=B*exp^(-βx)
现在,我想使用 MLE(最大似然法)得到 u
的幂律,β
的指数分布。
#set likelihood function of power law
pl <- function(u){-n*log(u-1)-n*(u-1)*log(min(x))+u*sum(log(x))}
#set likelihood function of exponential distribution
ex <- function(β){-n*log(β)+β*sum(x)}
这些功能对吗?
使用mle2()获取参数:
#get the parameter u of power law
s1 <- mle2(pl,start = list(u=2),data = list(x))
summary(s1)
#get the parameter lamda of exponential distribution
s2 <- mle2(ex,start = list(β=2),data = list(x))
summary(s2)
现在有两个问题:
如何确定哪个最适合模型
使用 confint() 可以获得 95% CI,如何获得两个模型的 Rsquared 和 AIC(Akaike weigths)?
- 得到最适合数据后,如何在原始数据上方绘制拟合图?
我在 windows 7.
中使用 R.3.2.2正如您所料。您没有指定数据的条件分布,所以我将假设正态性。 (鉴于此,您还可以使用 nls()
-- 最小二乘法 是 最大似然估计,用于正常的同方差响应),尽管 mle2
提供了更多使用优化器等的范围)
我打算使用公式界面,如果你的模型不是太复杂的话,这个界面会很方便。
幂律
mle2(y~dnorm(mean=A*x^(-mu),sd=exp(logsd),
start=list(A=...,mu=...,logsd=...),
## no need for list() if mydata is already data.frame
data=mydata)
指数
mle2(y~dnorm(mean=B*exp(-beta*x),sd=exp(logsd),
start=list(B=...,beta=...,logsd=...),
data=mydata)
... 其中 start
中的元素是任何 合理的 起始值。鉴于您上面的数据,这些方法应该在数据的一个子集上合理地工作。但是,它们在 1000 万次观察中可能表现不佳。我会考虑使用
glm(y~x,family=gaussian(link="log"),data=mydata)
拟合指数曲线并且
glm(y~log(x),family=gaussian(link="log"),data=mydata)
拟合幂律曲线。