如何从 PDF 中提取乐谱?
How can I extract music notation from a PDF?
我正在尝试使用另一种嵌入式字体来渲染 PDF,但我不知道该怎么做。
我正在尝试栅格化 PDF 中的音乐五线谱,我意识到 PDF 正在渲染乐谱,因为嵌入的字体很糟糕。然后我想尝试另一种字体。
我用 ghostscript 提取文本,或将 PDF 转换为 PS 并编辑 .ps,但我相信如果我能理解如何重新渲染 PDF...
gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_pdf.txt Betlem.pdf
iconv.exe -f MACROMAN -t UTF-8 Betlem_pdf.txt > Betlem_pdf_txt_utf8.txt
enscript.exe -f Petrucci40 Betlem_pdf_txt_utf8.txt -o Betlem_pdf_txt_utf8.ps
gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=Betlem_2.pdf Betlem_pdf_txt_utf8.ps
预期的结果是看到与原始 PDF 中相同的工作人员,但使用了另一种字体。但是我不知道我在做什么...
http://www.xn--estudiantladolaina-lvb.com/partitures/baixa/pdf/26
您链接的 PDF 没有音符字体。音符是 PDF shape/image 对象。你在这里能做的最好是对 PDF 使用 OCR(光学字符识别),并希望 OCR 支持音符。
我正在尝试使用另一种嵌入式字体来渲染 PDF,但我不知道该怎么做。
我正在尝试栅格化 PDF 中的音乐五线谱,我意识到 PDF 正在渲染乐谱,因为嵌入的字体很糟糕。然后我想尝试另一种字体。
我用 ghostscript 提取文本,或将 PDF 转换为 PS 并编辑 .ps,但我相信如果我能理解如何重新渲染 PDF...
gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_pdf.txt Betlem.pdf
iconv.exe -f MACROMAN -t UTF-8 Betlem_pdf.txt > Betlem_pdf_txt_utf8.txt
enscript.exe -f Petrucci40 Betlem_pdf_txt_utf8.txt -o Betlem_pdf_txt_utf8.ps
gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=Betlem_2.pdf Betlem_pdf_txt_utf8.ps
预期的结果是看到与原始 PDF 中相同的工作人员,但使用了另一种字体。但是我不知道我在做什么...
http://www.xn--estudiantladolaina-lvb.com/partitures/baixa/pdf/26
您链接的 PDF 没有音符字体。音符是 PDF shape/image 对象。你在这里能做的最好是对 PDF 使用 OCR(光学字符识别),并希望 OCR 支持音符。