在上传到 S3 存储桶之前,如何使用回形针和 pdf-reader 解析 PDF?

How do I use paperclip and pdf-reader to parse PDF before uploading to S3 bucket?

我正在构建一个解析 PDF 格式简历的功能。我有一个在 :before_save 上调用的方法,它处理解析。在使用...

保存之前,我可以使用此方法访问 PDF 文件

file = cv.queued_for_write[:original]

但是我需要将文件传递给 PDF::Reader,但是,pdf-reader 似乎只接受文件的路径或 URL,而不是实际文件本身。这种方法...

reader = PDF::Reader.new(file)

引发此错误:

ArgumentError (input must be an IO-like object or a filename):

我是否需要将文件保存到 tmp 文件夹或其他文件夹,然后将路径传递给 pdf-reader 来解析它?我希望尽快解析 PDF,所以这看起来并不理想。任何建议表示赞赏!

我发现 "queued_for_write" 对象有一个路径属性。

file = cv.queued_for_write[:original]

所以我可以这样访问它:

reader = PDF::Reader.new(file.path)