Alfresco 5.0如何识别文件并按内容归档?

Howto recognize documents in Alfresco 5.0 and filing them according content?

我有以下用例:

  1. 现有扫描仪扫描文档并通过 WebDAV 或共享网络驱动器将它们存储到 Alfresco
  2. 文件用条形码分隔以识别客户和文件类型(例如账单)
  3. 如果文档到达共享驱动器,Alfresco 应该对其进行分析并将其移动(根据客户和文档类型)到合适的内部文件夹结构。

文件夹结构示例:

问题:

P.s。我知道存在像 Ephesoft/Kofax 这样的应用程序,但我希望在 Alfresco 中有一个模块,它可以在没有外部依赖的情况下为我完成工作。

我会建议以下顺序:

1) 您的扫描仪或其他 (OCR) 软件需要解释条形码并保存客户并在文档中的某处键入内容,例如在 docx 元数据中。(我不知道露天模块执行 ocr 或条形码阅读)

2) 通过 webdav 上传后,您必须 运行 露天元数据提取操作,这将必须使用露天规则脚本或行为将客户和类型从文档元数据提取到露天元数据中。

  • 使用规则,您可以选择操作 "extract common metadata fields"
  • 使用 java 行为,您可以像这样调用相同的操作: 动作动作=actionService.createAction("extract-metadata"); actionService.executeAction(动作,节点);

此处描述了此提取操作:https://wiki.alfresco.com/wiki/Metadata_Extraction . You may have to add custom code for your barcode requirement. (https://wiki.alfresco.com/wiki/Content_Transformation_and_Metadata_Extraction_with_Apache_Tika)

3) 一个露天规则脚本或行为现在可以通过读取这个露天元数据来移动您的文档 属性。

这是关于自定义类型的非常好的指南,让我深入了解 Alfresco:

http://ecmarchitect.com/alfresco-developer-series-tutorials/content/tutorial/tutorial.html

Alfresco 开发者教程:http://ecmarchitect.com/alfresco-developer-series