如何在自述文件中为输入生成 table.file:自动内容分析软件
How to produce a table.file for input in ReadMe: Software for Automated Content Analysis
我正在尝试使用 Hopkins et al. 的自述文件包,但无法使用我自己的数据。该演示 运行 很好,我按照包的预期转换了我的数据(每个文本的单独 txt 文件和一个带有真实标签的 control.txt 文件等等)。我没能做到的是创建 table.file。 table 文件包含 table 个词频,演示文件在 Excel 中打开时如下所示:
不幸的是,似乎没有关于如何创建这样一个 table.file 的任何文档。文档只说:
table.file: Path of file in which table of word frequencies should be stored. Defaults to “tablefile.txt”. Of course, user must have read and write access to this file, and prior contents of file will be overwritten.
任何人都可以指出生成此类文件的程序或代码吗?还是我遗漏了文档中的某些内容?
我搜索了更长的时间,现在已经解决了我自己的问题。我 post 它让任何发现它的人都能得到关键线索。
tablefile.txt 是一个制表符分隔的文档术语矩阵,带有三个额外的列:"FILENAME"(要分析的每个文本的文件名,例如 'text21.txt.'),"TRUTH" (类别的真实值;对于测试集可以是 NA),"TRAININGSET"(表示文本属于 1=训练集还是 0=测试集)。
文档术语矩阵可以使用来自网络的教程生成e.g. this。
我正在尝试使用 Hopkins et al. 的自述文件包,但无法使用我自己的数据。该演示 运行 很好,我按照包的预期转换了我的数据(每个文本的单独 txt 文件和一个带有真实标签的 control.txt 文件等等)。我没能做到的是创建 table.file。 table 文件包含 table 个词频,演示文件在 Excel 中打开时如下所示:
不幸的是,似乎没有关于如何创建这样一个 table.file 的任何文档。文档只说:
table.file: Path of file in which table of word frequencies should be stored. Defaults to “tablefile.txt”. Of course, user must have read and write access to this file, and prior contents of file will be overwritten.
任何人都可以指出生成此类文件的程序或代码吗?还是我遗漏了文档中的某些内容?
我搜索了更长的时间,现在已经解决了我自己的问题。我 post 它让任何发现它的人都能得到关键线索。
tablefile.txt 是一个制表符分隔的文档术语矩阵,带有三个额外的列:"FILENAME"(要分析的每个文本的文件名,例如 'text21.txt.'),"TRUTH" (类别的真实值;对于测试集可以是 NA),"TRAININGSET"(表示文本属于 1=训练集还是 0=测试集)。
文档术语矩阵可以使用来自网络的教程生成e.g. this。