seqecmpgroup() 函数的输出格式?

Format of output for seqecmpgroup() function?

seqecmpgroup() 函数 returns a table 其中包括每个指定组的频率。但是,当我 运行 时,它会生成低于 1 的频率(例如 0.00035)。我是否应该将这些频率解释为百分比,以显示每个子序列出现在多少组中?

下面我粘贴了一个示例输出(每个组的频率列为 "Freq.1"、"Freq.2" 等:

      Subsequence     Support     p.value statistic index      Freq.1
1      (FA)-(IN)-(FA) 0.004807692 0.002293660 12.155213   538 0.000000000
2 (NR)-(TR)-(EX)-(IN) 0.004807692 0.002293660 12.155213   685 0.000000000
3 (NR)-(TR)-(IN)-(IN) 0.004807692 0.002293660 12.155213   687 0.000000000
4      (IS)-(IS)-(NR) 0.019230769 0.006788125  9.985161    98 0.040322581
5      (FA)-(NR)-(QU) 0.012820513 0.009031434  9.414088   172 0.008064516
       Freq.2     Freq.3    Resid.1   Resid.2   Resid.3
1 0.000000000 0.02419355 -1.0919284 -1.100699  3.113347
2 0.000000000 0.02419355 -1.0919284 -1.100699  3.113347
3 0.000000000 0.02419355 -1.0919284 -1.100699  3.113347
4 0.007936508 0.00000000  2.3951978 -1.292885 -1.544220
5 0.003968254 0.04032258 -0.6614769 -1.241085  2.704727

Computed on 624 event sequences
  Constraint Value
  countMethod  COBJ

频率实际上是相对频率。它们对应于每个组内的相对支持度,即它们表示每个组中包含子序列的序列在组中的比例。

例如,我们从您的结果中了解到,第一个子序列 (FA)-(IN)-(FA) 从未出现在前两组中,并且是第三组序列的 2.4% 的子序列。

提供的比例占序列权重。

现在,我在您的示例输出中没有看到任何负频率。并且您指定的值 0.00035 不低于 0!