从 Google 文档中提取文本并获取特定页面
Extracting text from a Google document and get particular page
截至目前,我通过从 link:
中获取内容来导出我的 Google 文档
https://docs.google.com/feeds/download/documents/export/Exportid=DOCUMENT_ID&exportFormat=EXPORT_FORMAT
这很好用,实际上我将我的文档导出为 HTML 格式,然后从中读取,但无法知道页面何时开始或结束。
以下是我所知道的所有导出格式:
HTML、PDF、ODT、TXT、RTF 和 DOCX
PDF、ODT、RTF 和 DOCX 在 在渲染器 中打开时都表示单独的页面。但是,在为所有格式(python-docx、PyPDF4、PyRTF 等)搜索了无数 API 之后,我一直无法找到一种逐页阅读 Google 文档的工作方法。
有什么建议吗?
您可以使用 Apps Script with it you can take advantage of the DocumentApp where you can get PageBreaks.
然后您可以将您定制的内容作为 web app。
截至目前,我通过从 link:
中获取内容来导出我的 Google 文档https://docs.google.com/feeds/download/documents/export/Exportid=DOCUMENT_ID&exportFormat=EXPORT_FORMAT
这很好用,实际上我将我的文档导出为 HTML 格式,然后从中读取,但无法知道页面何时开始或结束。
以下是我所知道的所有导出格式:
HTML、PDF、ODT、TXT、RTF 和 DOCX
PDF、ODT、RTF 和 DOCX 在 在渲染器 中打开时都表示单独的页面。但是,在为所有格式(python-docx、PyPDF4、PyRTF 等)搜索了无数 API 之后,我一直无法找到一种逐页阅读 Google 文档的工作方法。
有什么建议吗?
您可以使用 Apps Script with it you can take advantage of the DocumentApp where you can get PageBreaks.
然后您可以将您定制的内容作为 web app。