在 Azure 机器学习中导入 MongoDB 数据的最佳方式

Best way to import MongoDB data in Azure Machine Learning

我有一个托管在 Azure 上的 MongoDB 数据库(Bitnami 数据库)。我想将数据导入那里以在我的 Azure 机器学习实验中使用它。

目前,我正在使用 mongoexport 将数据导出到 .csv,然后 copy/pasting 将其导出到 "Enter Manually Data" 模块。这对于少量数据来说很好,但我更愿意为更大的数据库提供更强大的技术。

我还考虑过使用来自 http url 的 "Import Data" 模块以及我的 http 端口 (28017) =40=] 实例,但阅读本文时不建议使用 http mongodb 功能。

最后,我安装了 cosmosDB 而不是我的 bitnami MongoDB,它运行良好,但是这个东西 需要一个手臂 当与 sitecore 一起使用时(它达到每天 100 欧元左右)我们负担不起所以我切换回 Mongo。

那么有没有更好的方法将数据从 Mongo 导出到 Azure ML?

一种方法是在 AzureML 中使用 Python 代码块,如下所示:

import pandas as p
import pymongo as m

def azureml_main():
    c = m.MongoClient(host='host_IP')
    a = p.DataFrame(c.database_names())
    return a