Orange(数据挖掘工具)将分类值视为字符串
Orange (Data mining tool) considering categorical value as String
我刚开始使用 Orange 工具进行数据挖掘。我有一个 csv 文件,其中包含离散值和连续值的混合数据。但是,它将一些离散值视为 'String'.
是我哪里做错了还是其他什么问题?无论哪种情况,我都想知道如何将此 'String' 值转换为离散值。
数据信息:
该文件最初有4个离散值类别包含10-15个值(例如Tech,Media),topcat包含100多个值(Fashion,Art),location包含200多个值(例如New York,Boston),
货币包含 5-10 个值(美元、英镑)。
Orange 将 topcat 和 location 特征视为字符串。
我认为您可以强制 Orange 将变量解释为指定类型,例如要使特定列成为离散变量,您必须将该列的 header 设置为包含 D#
(根据 the documentation)。
我刚开始使用 Orange 工具进行数据挖掘。我有一个 csv 文件,其中包含离散值和连续值的混合数据。但是,它将一些离散值视为 'String'.
是我哪里做错了还是其他什么问题?无论哪种情况,我都想知道如何将此 'String' 值转换为离散值。
数据信息: 该文件最初有4个离散值类别包含10-15个值(例如Tech,Media),topcat包含100多个值(Fashion,Art),location包含200多个值(例如New York,Boston), 货币包含 5-10 个值(美元、英镑)。
Orange 将 topcat 和 location 特征视为字符串。
我认为您可以强制 Orange 将变量解释为指定类型,例如要使特定列成为离散变量,您必须将该列的 header 设置为包含 D#
(根据 the documentation)。