Google 用于文档管理系统的 Drive / App Engine

Google Drive / App Engine for Document Management System

我负责管理一所大学的文档管理系统。该系统是与另一个充当我们的 ERP 系统的第 3 方数据库集成的第 3 方。 DMS 非常笨重,并且有大量可怕的错误/缺乏功能和支持。出于好奇,我在空闲时间一直在玩弄 Google App Engine / Drive SDK。由于我们是 Google Apps for Education 客户,我们有无限的驱动器 space 并且我们所有的用户都是 Google apps 用户。

在内部构建一个 Web 应用程序(可能由 Google App Engine 提供支持)是否可行,该应用程序利用 Drive SDK 来管理大学的所有文件(约 6 TB)。从我的实验来看,它似乎具有所需的所有功能。

由于您将构建自己的软件,"will it do what I want" 的答案始终是 "yes, eventually"。

您需要决定文档格式,这反过来会影响您的索引机制。具体来说,您有两个主要选择:-

  1. 将文件转换为 Google 文档格式(文档、电子表格等)。然后您将能够使用 Google 自己的索引和搜索,例如。就像你从 drive.gogle.com 一样。缺点是格式可能会在 import/export 往返过程中丢失。

  2. 以原始格式(例如 MS .docx)保留文档,并执行您自己的索引。这将需要解析每种文档类型,这是非常重要的,但我确信有第三方库可以提供帮助。好处是您检索的文档与您导入的文档相同。

我想我会考虑执行以上两项操作。因此,当您将文件导入 DMS 时,您会将其存储到 Google 驱动器中两次,转换和未转换。使用 App Engine 数据存储来跟踪配对。这样您就可以使用云端硬盘搜索来查找转换后的文档,但您返回给用户的文件是未转换的孪生文件。