哪个 RDMS 用于 Tableau 连接?

Which RDMS for Tableau connections?

我们终于从 Excel 和 .csv 文件转移到数据库。目前,我的大部分 Tableau 文件都连接到大型 .csv 文件 (.twbx)。

PostgreSQL 和 MySQL 在 Tableau 中有什么性能差异吗?如果你从头开始,你会选择哪个?

现在,我正在使用 pandas 将文件连接在一起并根据连接创建一个新的 .csv 文件。(例如,我使用一个 1000 万行的文件并删除重复项并创建一个主键,然后我在一个 500 万行文件上使用相同的键加入它,然后我将新的 'Consolidated' 文件导出到 .csv 并将 Tableau 连接到它。有时连接很复杂,涉及日期或时间和几列)。

我假设我可以在数据库中创建一个视图,然后连接到该视图而不是创建一个单独的文件,对吗?我的每个文件都可以是一个单独的 table,它应该保存 space 并允许我查询日期,而不是使用 pandas.

将整个文件读入内存

一些使用 RDMS 的人通常对数据库是全新的(这里的仪表板只是 Excel 文件,没有规范化,原始数据中的公式 sheet,等等。它是一团糟)所以希望任何一个选择都有一些好的文档来学习学习曲线(主要插入新数据和选择数据,而不是实际的数据库设计)。

两者都适用于 Tableau。事实上,Tableau 的内部数据引擎是基于 Postgres 的。

两者之间,我觉得Postgres更适合做中央数据仓库。 MySQL 不允许某些 SQL 方法,例如通用 Table 表达式和 Window 函数。

此外,如果您已经在使用 Pandas,Postgres 有一个名为 PL/Python 的内置 Python 扩展。

但是,如果您希望存储少量数据并在不使用高级 SQL 的情况下快速访问它,MySQL 将是一个不错的选择,但 Postgres 会给您一个前进的更多选择。

如前所述,任一数据库都可以使用,而且 Tableau 基本上与您使用的数据库类型无关。查看 https://www.tableau.com/products/techspecs 以获得 Tableau Server 和 Desktop 提供的所有本机(内置和优化)连接的完整列表。但是,如果您的数据库不在该列表中,您始终可以通过 ODBC 进行连接。

就个人而言,我更喜欢 postgres 而不是 mysql(我发现使用 psycopg2 从 python 写入 postgres 真的很容易),但里程会有所不同。