是否可以在后台 运行 OpenRefine 脚本?

Is it possible to run an OpenRefine script in the background?

我可以在后台触发 OpenRefine 脚本到 运行 而无需用户交互吗?可能使用 windows 服务来加载 OpenRefine 配置文件或使用参数启动 OpenRefine Web 服务器并保存输出?

我们从文件中解析各种数据源,并将输出放入 sql 服务器中的特定表和字段中。我们有一个非常古老的应用程序创建了这些 "match patterns" 并且想用更现代的东西替换它。速度很重要,但不是关键。我们通常解析 5 到 1,000,000 行的文件。

如果是这样的话,我可能会在错误的方向上使用 OpenRefine,请告诉我。我们创建这些 "match patterns" 的支持团队最适合使用像 OpenRefine 这样的 UI,而不是编写 Perl 或 Python 脚本。

感谢您的帮助。

OpenRefine 有一组库可以让你自动化现有的工作。以下是可用的: * Python here and here 中的两个 * ruby 中的一个 * nodejs

中的一个

这些库需要两个输入:

  1. 要在 OpenRefine 中处理的源文件
  2. JSON 格式的 OpenRefine 操作。

RefinePro(免责声明我是 RefinePro 的创始人兼首席执行官),我们编写了一些额外的包装器来安排 select 一个 OpenRefine 项目,提取 JSON 操作,启动库并保存结果。然后可以安排新创建的作业。

请记住,OpenRefine 的错误处理非常差,这限制了它作为 ETL 平台的使用。