如何从字符串到字节的转换中获得正确的值?

How can I get the correct value from string to byte conversion?

我需要将字符串转换为字节切片,我使用函数 []byte(string),但是当字符串包含字母 ñ 或某些带重音的字母时,我得到的值与预期不同。

fmt.Println([]byte("áéíóúñÁÉÍÓÚÑ"))

预期结果:[ 160 130 161 162 163 181 144 214 224 233 ]

得到的结果:[195 161 195 169 195 173 195 179 195 186 195 177 195 129 195 137 195 141 195 147 195 154 195 145]

所以当我将获得的值转换为字符串时,我得到 ├í├®├¡├│├║├▒├ü├ë├ì├ô├Ü├æ 而不是 áéíóúñÁÉÍÓÚÑ

如何获得正确的值?

这里有几个问题。首先,你给出这个预期结果:

[ 160 130 161 162 163 181 144 214 224 233 ]

但是您遗漏了 ñÑ,因此预期结果应该是:

[160 130 161 162 163 164 181 144 214 224 233 165]

其次,这个页面你link到[1]说是代码页437,其实是 代码页 850。您可以在“其他相关编码”[2] 下看到 850。 这是一个工作示例 [3]:

package main

import (
   "fmt"
   "golang.org/x/text/encoding/charmap"
)

func main() {
   b := []byte("áéíóúñÁÉÍÓÚÑ")
   c, e := charmap.CodePage850.NewEncoder().Bytes(b)
   if e != nil {
      panic(e)
   }
   fmt.Println(c)
}
  1. https://theasciicode.com.ar
  2. https://wikipedia.org/wiki/Code_page_437
  3. https://pkg.go.dev/golang.org/x/text/encoding/charmap

对于这些字符,您可以使用 ascii85 encoder/decoder。

字节切片与您的预期不符,但是,输出将与您的输入相符。 (我假设这是这里的关键)

package main

import (
    "encoding/ascii85"
    "fmt"
)

func main() {
        enc := make([]byte, 30, 30)
        dec := make([]byte, 30, 30)
        ascii85.Encode(enc, []byte("áéíóúñÁÉÍÓÚÑ"))
        ascii85.Decode(dec, enc, false)
        fmt.Println(enc)        
        fmt.Println(string(dec))
}

https://golang.org/pkg/encoding/ascii85/

https://play.golang.org/p/ErBSKYVBXNg