有没有办法查看是否为屏幕阅读器标记了 PDF JavaScript?
Is there a way to see if a PDF is tagged for screen readers with JavaScript?
我有兴趣制作一个简单的检查器,它接收 PDF 作为输入并查看该 PDF 是否被标记为供屏幕阅读器使用。此信息在元数据中不可用。有没有人 know/can 指出我正确的方向,如果用 JavaScript 可以做到这一点,可能用 PDF.js?
谢谢!
有些 PDF 包含带有标签的对象,可以在没有标签的情况下进行屏幕阅读,有些 PDF 带有无法进行屏幕阅读的标签,并且正确标记的 PDF 文件完全符合所有 PDF/UA 或 PDF/A-2要求。
因此,对于屏幕阅读来说,除了使用一致性检查器测试文件是否通过集合之外,寻找简单的标签或标记是没有意义的。
来自 iText
If you have a document that has a picture of a fox and a dog, iText can't add any missing alt text for those images, because iText can't see that fox nor that dog.
PDF 对象可以加密或编码,因此作为简单结构并不总是容易检测到,但是某些数据不能被编码。如果幸运的话,未编码的元数据可能包含字符串 pdfua 或 PDF/UA,这并不能证明一致性只是一种尝试。
还要注意任何有关于 PDF/UA 生产的文章但不是一个的标记文件:-)
我有兴趣制作一个简单的检查器,它接收 PDF 作为输入并查看该 PDF 是否被标记为供屏幕阅读器使用。此信息在元数据中不可用。有没有人 know/can 指出我正确的方向,如果用 JavaScript 可以做到这一点,可能用 PDF.js?
谢谢!
有些 PDF 包含带有标签的对象,可以在没有标签的情况下进行屏幕阅读,有些 PDF 带有无法进行屏幕阅读的标签,并且正确标记的 PDF 文件完全符合所有 PDF/UA 或 PDF/A-2要求。
因此,对于屏幕阅读来说,除了使用一致性检查器测试文件是否通过集合之外,寻找简单的标签或标记是没有意义的。
来自 iText
If you have a document that has a picture of a fox and a dog, iText can't add any missing alt text for those images, because iText can't see that fox nor that dog.
PDF 对象可以加密或编码,因此作为简单结构并不总是容易检测到,但是某些数据不能被编码。如果幸运的话,未编码的元数据可能包含字符串 pdfua 或 PDF/UA,这并不能证明一致性只是一种尝试。
还要注意任何有关于 PDF/UA 生产的文章但不是一个的标记文件:-)