使用 ISO-8859-1 XML 编码与 UTF-8 编码的 SVG 文件的实际差异
Practical difference in SVG files with ISO-8859-1 XML encoding vs UTF-8
如果将 SVG 用于图形图标并且不显示任何不太典型的字符(更不用说任何字符了),UTF-8 XML 编码与 ISO-8859-1 编码是否存在明显差异?
当我保存 UTF-8 时,我的字节变小了,但我猜那是因为这个词更短,想知道是否因为 UTF-8 编码的字符集更大,是否有任何情况它可能有相反的地方吗?
或者在这种情况下编码不太可能对文件大小产生任何影响?
你可以很容易地自己测量这个。
- 构造两个字符集的交集。
- 所有剩余的字符都会有所不同。
- 将第一步的字节消耗分别添加到两个集合中,得到两个新集合的基数。
- 现在你得到了每组整数值的字节消耗。
这是通过字节数衡量哪种字符编码效率更高的算法。
ISO 8859-1 对于 128-255 范围内的字符更紧凑,UTF-8 对于 255 以上的字符更紧凑,所以这完全取决于文档中字符的统计分布。如果您担心字节数,那么有比担心编码更好的减小大小的方法。
如果将 SVG 用于图形图标并且不显示任何不太典型的字符(更不用说任何字符了),UTF-8 XML 编码与 ISO-8859-1 编码是否存在明显差异?
当我保存 UTF-8 时,我的字节变小了,但我猜那是因为这个词更短,想知道是否因为 UTF-8 编码的字符集更大,是否有任何情况它可能有相反的地方吗?
或者在这种情况下编码不太可能对文件大小产生任何影响?
你可以很容易地自己测量这个。
- 构造两个字符集的交集。
- 所有剩余的字符都会有所不同。
- 将第一步的字节消耗分别添加到两个集合中,得到两个新集合的基数。
- 现在你得到了每组整数值的字节消耗。
这是通过字节数衡量哪种字符编码效率更高的算法。
ISO 8859-1 对于 128-255 范围内的字符更紧凑,UTF-8 对于 255 以上的字符更紧凑,所以这完全取决于文档中字符的统计分布。如果您担心字节数,那么有比担心编码更好的减小大小的方法。