计算字母序列中的熵

Question

我正在尝试计算字母序列的香农熵，例如，

A <- c('A-A-A-A', 'A-B-C-D-E-E', 'A-B-D-F-G-E')

我正在尝试使用 TraMineR 方法来这样做，但是由于我已经有一个序列对象，所以我无法使用 traMineR 包来这样做，见下文：

http://traminer.unige.ch/doc/seqient.html

有什么建议吗？谢谢

Answer 1

也许：

library(TraMineR)
A<- c( 'A-A-A-A', 'A-B-C-D-E-E', 'A-B-D-F-G-E')
B <- as.data.frame(A)
actcal.seq <- seqdef(B)
## Summarize and plot histogram
## of within sequence entropy
actcal.ient <- seqient(actcal.seq)
summary(actcal.ient)
hist(actcal.seq)

更新：根据 OP 的要求，将熵添加到原始数据：

 cbind(B, actcal.ient)
#              A   Entropy
#[1]     A-A-A-A 0.0000000
#[2] A-B-C-D-E-E 0.8020465
#[3] A-B-D-F-G-E 0.9207822

计算字母序列中的熵

calculating entropy in a sequence of letters

r

entropy

traminer

dplyr

tidyr