如何将 Azure Data Lake 存储连接到 Azure ML?

How to connect Azure Data lake storage to Azure ML?

嗨,我开始学习 azure 数据湖和 azure 机器学习,我需要使用 azure 数据湖存储作为 azure 机器学习工作室的输入数据。那里有任何选项,我经历了天蓝色的数据湖和机器学习文档,但我无法达到,最后我得到了一个解决方案 但他们提到没有选项,但是这个 post 是旧的,所以可能是 Microsoft 的人在上面添加了未来,如果它请告诉我,让我知道谢谢.

当然,您可以使用参考程序集根据您的 ADLS 数据向 USQL 添加认知服务。 https://docs.microsoft.com/en-us/azure/data-lake-analytics/data-lake-analytics-u-sql-cognitive

我推荐以下内容:

  • 使用教程 here 为您的 ADLS 获取租户 ID、客户端 ID 和客户端密码。
  • 通过将 azure-datalake-store Python 包作为脚本包附加到执行 Python 脚本模块,在 AML Studio 上安装它。
  • 在执行 Python 脚本模块中,导入 azure-datalake-store 包并使用您的租户 ID、客户端 ID 和客户端密码连接到 ADLS。
  • 从ADLS下载你需要的数据,并在Python脚本模块中将其转换成dataframe; return 该数据框使数据在 AML Studio 的其余部分可用。

您可以查看此 Microsoft Azure 文档,其中涵盖:

  1. 创建数据科学环境以在 Azure Data Lake 中构建可扩展的 end-to-end 解决方案。

  2. 此环境用于分析大型 public 数据集,通过数据科学过程的规范步骤,从数据采集到模型训练,再到部署作为 Web 服务的模型。

  3. U-SQL 用于处理、探索和采样数据。

  4. Python 和 Hive 与 Azure 机器学习工作室一起用于构建和部署预测模型。

Link: https://docs.microsoft.com/en-us/azure/machine-learning/team-data-science-process/data-lake-walkthrough