Apache Zeppelin 是否适合为多个用户呈现仪表板?
Is Apache Zeppelin suitable for presenting dashboard for several users?
换句话说,Zeppelin 能否在小范围内用作 Tableau 的替代品?
我有一个新的 UI/UX 报告仪表板设计。仪表板的数据来自关系数据库(SQL 服务器)。我公司的大约 300 名同事可以查看此仪表板。最多可能会有十个人同时观看。
目前仪表板在 Kibana 中实现,数据会定期从 SQL 服务器导入 Elasticsearch。但是,新设计需要某些超出 Kibana 仪表板功能的小部件和数据聚合。此外,我的组织希望将此仪表板迁移到与我们一起工作的数据科学家认为更熟悉的技术(Kibana 不被认为是这样)。
此报告和仪表板可以迁移到 Tableau。 Tableau 足够强大,可以执行所需的数据聚合并显示所有所需的小部件。然而,我们负担不起许可费用,但我们可以根据需要投入尽可能多的开发人员时间。
我评估了几个开源仪表板工具(Metabase 和 Superset),它们缺少我们需要的聚合和小部件。我不会详细介绍,因为问题不在于细节。很明显,Metabase 和 Superset 的功能不足以满足我们的需求。
我的印象是 Apache Zeppelin 足够强大,它支持任意 Python 代码(我会使用 Pandas 进行数据聚合)、图形和小部件。但是,我不确定单个 Zeppelin 实例是否可以支持大量并发查看器。
我们想建立一套笔记本,让组织中的所有同事都可以使用它们(访问控制不是问题,我们彼此信任)。笔记本将与数据过滤器和日期范围选择器交互。
Zeppelin 似乎有可切换的 interpreter isolation modes,我们可以使用它来使不同用户的会话彼此隔离。我的问题是托管 Zeppelin 的单个 t2.large AWS 实例是否可以维持多达 10 个用户查看在 30 万行数据集上聚合的报告。此外,是否存在任何可用性问题导致 Zeppelin 无法实现多用户查看报告仪表板的想法?
我看到你问了几个问题:
Zeppelin 能否小规模取代 Tableau? 这取决于您在 Tableau 中使用的功能。每个平台都有自己的一组功能,其他平台有或没有,而且 Tableau 有许多您在其他地方找不到的自定义选项。旨在让您的仪表板尽可能多地转换 1:1 然后让每个人都意识到它会 look/operate 有点不同,因为它在不同的平台上。
托管 Zeppelin 的 t2.large 能否支持最多 10 个并发用户查看 30 万行的聚合报告? t2.large 应该大到足以 运行 Zeppelin、Tableau、Superset 等,10 个并发用户拉出 30 万行的报告。 300k也不算多
利用现有基础架构加快速度并挤压更多并发用户的一个好方法是加速数据源。这就是很多聚合计算发生的地方。查看您的 ETL 并尝试提前聚合会有所帮助,并确保您的数据科学家不会 运行 大量查询减慢您的数据库服务器。
换句话说,Zeppelin 能否在小范围内用作 Tableau 的替代品?
我有一个新的 UI/UX 报告仪表板设计。仪表板的数据来自关系数据库(SQL 服务器)。我公司的大约 300 名同事可以查看此仪表板。最多可能会有十个人同时观看。
目前仪表板在 Kibana 中实现,数据会定期从 SQL 服务器导入 Elasticsearch。但是,新设计需要某些超出 Kibana 仪表板功能的小部件和数据聚合。此外,我的组织希望将此仪表板迁移到与我们一起工作的数据科学家认为更熟悉的技术(Kibana 不被认为是这样)。
此报告和仪表板可以迁移到 Tableau。 Tableau 足够强大,可以执行所需的数据聚合并显示所有所需的小部件。然而,我们负担不起许可费用,但我们可以根据需要投入尽可能多的开发人员时间。
我评估了几个开源仪表板工具(Metabase 和 Superset),它们缺少我们需要的聚合和小部件。我不会详细介绍,因为问题不在于细节。很明显,Metabase 和 Superset 的功能不足以满足我们的需求。
我的印象是 Apache Zeppelin 足够强大,它支持任意 Python 代码(我会使用 Pandas 进行数据聚合)、图形和小部件。但是,我不确定单个 Zeppelin 实例是否可以支持大量并发查看器。
我们想建立一套笔记本,让组织中的所有同事都可以使用它们(访问控制不是问题,我们彼此信任)。笔记本将与数据过滤器和日期范围选择器交互。
Zeppelin 似乎有可切换的 interpreter isolation modes,我们可以使用它来使不同用户的会话彼此隔离。我的问题是托管 Zeppelin 的单个 t2.large AWS 实例是否可以维持多达 10 个用户查看在 30 万行数据集上聚合的报告。此外,是否存在任何可用性问题导致 Zeppelin 无法实现多用户查看报告仪表板的想法?
我看到你问了几个问题:
Zeppelin 能否小规模取代 Tableau? 这取决于您在 Tableau 中使用的功能。每个平台都有自己的一组功能,其他平台有或没有,而且 Tableau 有许多您在其他地方找不到的自定义选项。旨在让您的仪表板尽可能多地转换 1:1 然后让每个人都意识到它会 look/operate 有点不同,因为它在不同的平台上。
托管 Zeppelin 的 t2.large 能否支持最多 10 个并发用户查看 30 万行的聚合报告? t2.large 应该大到足以 运行 Zeppelin、Tableau、Superset 等,10 个并发用户拉出 30 万行的报告。 300k也不算多
利用现有基础架构加快速度并挤压更多并发用户的一个好方法是加速数据源。这就是很多聚合计算发生的地方。查看您的 ETL 并尝试提前聚合会有所帮助,并确保您的数据科学家不会 运行 大量查询减慢您的数据库服务器。