在上传到 S3 存储桶之前,如何使用回形针和 pdf-reader 解析 PDF?
How do I use paperclip and pdf-reader to parse PDF before uploading to S3 bucket?
我正在构建一个解析 PDF 格式简历的功能。我有一个在 :before_save 上调用的方法,它处理解析。在使用...
保存之前,我可以使用此方法访问 PDF 文件
file = cv.queued_for_write[:original]
但是我需要将文件传递给 PDF::Reader,但是,pdf-reader 似乎只接受文件的路径或 URL,而不是实际文件本身。这种方法...
reader = PDF::Reader.new(file)
引发此错误:
ArgumentError (input must be an IO-like object or a filename):
我是否需要将文件保存到 tmp 文件夹或其他文件夹,然后将路径传递给 pdf-reader 来解析它?我希望尽快解析 PDF,所以这看起来并不理想。任何建议表示赞赏!
我发现 "queued_for_write" 对象有一个路径属性。
file = cv.queued_for_write[:original]
所以我可以这样访问它:
reader = PDF::Reader.new(file.path)
我正在构建一个解析 PDF 格式简历的功能。我有一个在 :before_save 上调用的方法,它处理解析。在使用...
保存之前,我可以使用此方法访问 PDF 文件file = cv.queued_for_write[:original]
但是我需要将文件传递给 PDF::Reader,但是,pdf-reader 似乎只接受文件的路径或 URL,而不是实际文件本身。这种方法...
reader = PDF::Reader.new(file)
引发此错误:
ArgumentError (input must be an IO-like object or a filename):
我是否需要将文件保存到 tmp 文件夹或其他文件夹,然后将路径传递给 pdf-reader 来解析它?我希望尽快解析 PDF,所以这看起来并不理想。任何建议表示赞赏!
我发现 "queued_for_write" 对象有一个路径属性。
file = cv.queued_for_write[:original]
所以我可以这样访问它:
reader = PDF::Reader.new(file.path)