Alfresco 数据导出和导入

Alfresco data export and import

我们必须导出露天数据并导入到另一个存储库,而不一定是 backup/restore 过程。我们的目标是脚本,它可以是 运行 并在某些条件下提取数据、文件集及其所有元数据。

我得到了下面的 link,它谈论的是相同的,但它是旧的,并且不能像文件的版本、基于条件的提取那样完成。

https://www.ibm.com/developerworks/cn/xml/x-cmis2/index.html

我想知道任何可用于提取露天数据并将其导入其他存储库的方法。

没有任何开箱即用的东西可以做到这一点。复制子系统不适合超过少数节点的频繁复制。

因此,您将不得不编写自定义解决方案或查看可以执行此操作的第三方解决方案。 Simflofy is one example. Another example is the Parashift Alfstream 模块。

如果你想自己开发这个,我建议你这样做:

  1. 编写代码将一个或多个文件导出到文件系统。这应该是源和所有目标存储库之间共享的存储。
  2. 在每个文件旁边,写一个 "manifest" 文件来描述文件的元数据,包括自定义属性和 属性 值。您应该使用批量文件系统导入工具在导入时期望的格式。
  3. 向队列添加一条消息,描述导出数据所在的位置以及需要导入的位置。
  4. 在目标存储库中,编写一个订阅队列的侦听器。
  5. 当侦听器收到消息时,它可以在目标系统中启动批量文件系统导入。 BFSIT 将按照您在步骤 2 中生成的清单文件中的说明导入文件并设置元数据。
  6. 可选地,目标系统可以在队列中放置另一条消息,确认已执行导入,然后源存储库可以选取该消息来完成任务。

有些人为此成功地使用了 Apache Camel,但这并不是绝对必要的。