能不能看到一个pytorchtext.data.Tabulardataset的读取数据?
Is it possible to see the read data of a pytorchtext.data.Tabulardataset?
train, test = data.TabularDataset.splits(path="./data/", train="train.csv",test="test.csv",format="csv",fields=[("Tweet",TEXT), ("Affect Dimension",LABEL)])
我有这段代码,想评估加载的数据是否正确,或者它是否为实际文本字段等使用了错误的列。
如果我的文件有文本列 "Tweet" 和 Class 名称列 "Affect Dimension",像字段部分这样放置它们是否正确?
编辑:TabularDataset 包含一个 Example 对象,可以在其中读取数据。读取 csv 文件时,只接受“,”作为分隔符。其他一切都会导致数据损坏。
无论您的文件包含什么,您都可以输入任何字段名称。另外,我建议不要在字段名称中使用空格。
因此,将 Affect Dimension
重命名为 Affect_Dimension
或您方便的任何名称。
然后您可以像下面这样遍历不同的字段来检查读取的数据。
for i in train.Tweet:
print i
for i in train.Affect_Dimension:
print i
for i in test.Tweet:
print i
for i in test.Affect_Dimension:
print i
train, test = data.TabularDataset.splits(path="./data/", train="train.csv",test="test.csv",format="csv",fields=[("Tweet",TEXT), ("Affect Dimension",LABEL)])
我有这段代码,想评估加载的数据是否正确,或者它是否为实际文本字段等使用了错误的列。
如果我的文件有文本列 "Tweet" 和 Class 名称列 "Affect Dimension",像字段部分这样放置它们是否正确?
编辑:TabularDataset 包含一个 Example 对象,可以在其中读取数据。读取 csv 文件时,只接受“,”作为分隔符。其他一切都会导致数据损坏。
无论您的文件包含什么,您都可以输入任何字段名称。另外,我建议不要在字段名称中使用空格。
因此,将 Affect Dimension
重命名为 Affect_Dimension
或您方便的任何名称。
然后您可以像下面这样遍历不同的字段来检查读取的数据。
for i in train.Tweet:
print i
for i in train.Affect_Dimension:
print i
for i in test.Tweet:
print i
for i in test.Affect_Dimension:
print i