智能地在 MySQL 服务器上存储 PDF 文件

Storing PDF files on a MySQL server Intelligently

我的任务是创建一个搜索系统,帮助用户浏览多个 1000 多页的 pdf 文件。但是,这些文件首先必须放在 MySQL 数据库中。我目前遇到的问题是如何将这些 PDF 文件存储在数据库中并将相关的 PDF headers 分配给数据库。

示例:

在数据库的不同表中分别添加每个 Part/Header/Section/Subsection。

这些都要手动输入吗?请记住,我们谈论的是 100,000 页 + PDF。

谢谢

你最好在数据库中存储一些元数据,并存储PDF文件的位置。

即一个名为 'documents' 的 table 可能有以下字段: ID、路径、关键字、类别

路径为:/some/location/to/my/pdf/file.pdf

关键字可以是; 'pdf1, what is a pdf, some search text'

这将允许您存储 pdf 文件。

或者您可以使用 Google 之类的东西 - 他们允许您使用他们的搜索技术。它以前是 'google yellow box' 的形式,但我相信它现在是他们云产品的一部分!

HTH