Azure 机器学习 Reader + Table 存储

Azure Machine Learning Reader + Table Storage

复制:https://social.msdn.microsoft.com/Forums/azure/en-US/6560c2d6-9836-41a1-8076-caf0d514222a/azure-machine-learning-reader-table-storage?forum=MachineLearning

我目前有一个 table 存储设置,它不断地执行插入操作。 table 存储中大约有 2.6 亿行。

我设置了两个机器学习实验来使用 'Reader' 从 'Azure Table' 读取数据。

实验 1 设置为读取所有行以训练模型。

实验 2 设置为仅读取前 1,000 行来训练模型。

实验 1 已经 运行 超过 5 个小时,没有结果。

实验 2 运行 超过 1 小时没有结果。

卡在'Reader'进程中。

我不明白为什么实验 2 花了这么长时间。当我用另一个 table 存储测试 'Reader's 时,我知道我已经正确设置了它。提前感谢任何 help/suggestions.

其中很多可能取决于表格的设计。 Table 存储是键/值存储(将其视为字典)。它具有在一个分区内和跨分区扫描的一些功能——但延迟会有很大差异。理想情况下,如果你想查询 1000 行,它们应该在一个分区内进行本地化。有关详细信息,请参阅 Table Design Guide and Perf and Scalability Checklist