C# 从具有二进制内容的文件中读取文本
C# Reading text from file with binary content
我想以字符串形式读取 PDF 文件。
我正在使用 File.ReadAllText(path)
,但结果在第一个二进制数据流上结束。
我认为它将流的某些部分识别为文件结尾并停止。
知道如何解决这个问题吗?
您不能将 PDF 文件作为字符串读取,因为 PDF 文件包含其他数据而不仅仅是字符。将文件读入 byte
数组或解析它,当您在 PDF 文件中遇到流对象时,在读取文本和二进制数据之间切换。
某些语言,如 PHP 将字符串和字节数组视为可互换的。在 C# 中不是这种情况。
我想以字符串形式读取 PDF 文件。
我正在使用 File.ReadAllText(path)
,但结果在第一个二进制数据流上结束。
我认为它将流的某些部分识别为文件结尾并停止。
知道如何解决这个问题吗?
您不能将 PDF 文件作为字符串读取,因为 PDF 文件包含其他数据而不仅仅是字符。将文件读入 byte
数组或解析它,当您在 PDF 文件中遇到流对象时,在读取文本和二进制数据之间切换。
某些语言,如 PHP 将字符串和字节数组视为可互换的。在 C# 中不是这种情况。