Azure 机器学习 Reader + Table 存储
Azure Machine Learning Reader + Table Storage
我目前有一个 table 存储设置,它不断地执行插入操作。 table 存储中大约有 2.6 亿行。
我设置了两个机器学习实验来使用 'Reader' 从 'Azure Table' 读取数据。
实验 1 设置为读取所有行以训练模型。
实验 2 设置为仅读取前 1,000 行来训练模型。
实验 1 已经 运行 超过 5 个小时,没有结果。
实验 2 运行 超过 1 小时没有结果。
卡在'Reader'进程中。
我不明白为什么实验 2 花了这么长时间。当我用另一个 table 存储测试 'Reader's 时,我知道我已经正确设置了它。提前感谢任何 help/suggestions.
其中很多可能取决于表格的设计。 Table 存储是键/值存储(将其视为字典)。它具有在一个分区内和跨分区扫描的一些功能——但延迟会有很大差异。理想情况下,如果你想查询 1000 行,它们应该在一个分区内进行本地化。有关详细信息,请参阅 Table Design Guide and Perf and Scalability Checklist。
我目前有一个 table 存储设置,它不断地执行插入操作。 table 存储中大约有 2.6 亿行。
我设置了两个机器学习实验来使用 'Reader' 从 'Azure Table' 读取数据。
实验 1 设置为读取所有行以训练模型。
实验 2 设置为仅读取前 1,000 行来训练模型。
实验 1 已经 运行 超过 5 个小时,没有结果。
实验 2 运行 超过 1 小时没有结果。
卡在'Reader'进程中。
我不明白为什么实验 2 花了这么长时间。当我用另一个 table 存储测试 'Reader's 时,我知道我已经正确设置了它。提前感谢任何 help/suggestions.
其中很多可能取决于表格的设计。 Table 存储是键/值存储(将其视为字典)。它具有在一个分区内和跨分区扫描的一些功能——但延迟会有很大差异。理想情况下,如果你想查询 1000 行,它们应该在一个分区内进行本地化。有关详细信息,请参阅 Table Design Guide and Perf and Scalability Checklist。