TraMineR 中是否有针对长度超过 300 个事件的序列的建议格式或方法?
Is there a suggested format or approach in TraMineR for sequences with 300+ events in length?
我正在处理超过 300 个事件的时间戳事件序列。此数据类似于网络日志,用户在不同时间访问网站的不同页面。一个序列可能是一个网络会话,每个事件都是一个用户操作(访问页面、单击按钮等)。
我首先使用的是 TSE 格式。当尝试使用 seqefsub() 查找子序列时,TraMineR 挂起。我设置 maxk = 5 并且有效(这将要搜索的子序列的长度限制为 5 个事件)。但是,maxK 6 或更高版本也会挂起。不知道为什么会突然下降。此外,当我将事件序列修剪为只有 15 个事件时,一切都很好地完成了。很明显,事件序列长度在这里是一个问题。
是否有对序列长度更稳健的不同格式,例如STS?在 TraMineR 中处理这种长度的序列还有其他建议吗?
问题与用于输入序列的格式无关。
TraMineR
只有基本的子序列搜索算法。
我建议您查看更适合您的问题的工具。例如考虑 R 包 arulesSequences
。
我正在处理超过 300 个事件的时间戳事件序列。此数据类似于网络日志,用户在不同时间访问网站的不同页面。一个序列可能是一个网络会话,每个事件都是一个用户操作(访问页面、单击按钮等)。
我首先使用的是 TSE 格式。当尝试使用 seqefsub() 查找子序列时,TraMineR 挂起。我设置 maxk = 5 并且有效(这将要搜索的子序列的长度限制为 5 个事件)。但是,maxK 6 或更高版本也会挂起。不知道为什么会突然下降。此外,当我将事件序列修剪为只有 15 个事件时,一切都很好地完成了。很明显,事件序列长度在这里是一个问题。
是否有对序列长度更稳健的不同格式,例如STS?在 TraMineR 中处理这种长度的序列还有其他建议吗?
问题与用于输入序列的格式无关。
TraMineR
只有基本的子序列搜索算法。
我建议您查看更适合您的问题的工具。例如考虑 R 包 arulesSequences
。