Cloud ML 特征方法

Cloud ML Feature methods

云中的预处理页面 ML How to guide (https://cloud.google.com/ml/docs/how-tos/preprocessing-data) 说您应该查看 SDK 参考文档以了解有关每种功能的详细信息以及

任何人都可以指出此文档或功能类型及其方法的列表吗?我正在尝试设置一个离散目标,但每当我将目标设置为 .discrete() 而不是 .continuous()

时,就会不断收到 "data type int64 expected type: float" 错误

您需要下载SDK参考文档:

  1. 导航到要在其中安装文档的目录
    命令行。如果您使用 ~/google-cloud-ml 下载示例 按照安装指南的建议,这是个好地方。

  2. 将文档存档复制到您选择的目录,使用 gsutil:

    gsutil cp gs://cloud-ml/sdk/cloudml-docs.latest.tar.gz .
    
  3. 解压缩存档:

    tar -xf cloudml-docs.latest.tar.gz
    

这会在您选择的目录中创建一个 docs 目录。这 文档本质上是一个本地网站:在浏览器中打开 docs/index.html 以在其根目录下打开它。您可以在那里找到转换参考。

(此信息现在也在 setup guide 中。这是 LOCAL 下的最后一步:MAC/LINUX

关于与类型相关的错误,我们假设您的功能集是按照以下几行指定的:

feature_set = {
    'target': features.target('category').discrete()
}

当如上所述指定离散目标时,由于以下原因之一,目标特征的数据类型为 int64:

  1. 在分析您的数据期间未生成目标数据列(即 'category')的词汇表,即元数据(在生成的 metadata.yaml 中)具有目标数据的空列表-专栏词汇。
  2. 确实生成了'category'的词汇表,并且这个词汇表的第一个项目(或键)的数据类型是一个int。

在这种情况下,如果遇到浮点数,转换为目标特征的数据类型将失败。

相反,将整个数据列('category' 在这种情况下)转换为浮点数应该有助于解决这个问题。