使用 Pentaho 社区版创建一个近乎实时的 DWH
Create a near real time DWH with Pentaho Community edition
我一直在探索用于从 Oracle 中提取数据并将其加载到 SQL 服务器的最佳 ETL 工具。(初始加载大约 200GB data/20-25 oracle 表)我们已经拥有 SSIS 许可证,但我们有一直在探索更好的选择。我们必须创建一个近乎实时的数据仓库(每 5 分钟或更短时间加载一次)。可以使用Pentaho社区版实现还是需要购买企业版?
除了 Pentaho 和 SSIS,我们还可以探索其他更好的选择。
你可以在 pentaho 社区版中创建一个作业并安排它每 5 分钟执行一次来刷新你的数据,在 linux 机器上然后你可以使用 cronjob 实现这个,windows 机器你可以使用 windows 任务计划程序执行此操作。
我一直在探索用于从 Oracle 中提取数据并将其加载到 SQL 服务器的最佳 ETL 工具。(初始加载大约 200GB data/20-25 oracle 表)我们已经拥有 SSIS 许可证,但我们有一直在探索更好的选择。我们必须创建一个近乎实时的数据仓库(每 5 分钟或更短时间加载一次)。可以使用Pentaho社区版实现还是需要购买企业版?
除了 Pentaho 和 SSIS,我们还可以探索其他更好的选择。
你可以在 pentaho 社区版中创建一个作业并安排它每 5 分钟执行一次来刷新你的数据,在 linux 机器上然后你可以使用 cronjob 实现这个,windows 机器你可以使用 windows 任务计划程序执行此操作。