从客户端接收 'utf-8' 时出现问题

Problems with receiving 'utf-8' from client

我正在尝试使用 Flasksocket.io 在服务器和客户端之间创建双向通信。

一切正常,直到服务器收到来自客户端的 utf-8 字符串,该字符串出现乱码。从服务器发送到客户端工作正常,并且在从客户端发送到服务器之前,客户端正确打印消息。

下面是一些重现问题的代码:

app.py:

import flask
from flask_socketio import SocketIO, emit, disconnect

import json

app = flask.Flask(__name__)
socket_io = SocketIO(app)

@socket_io.on('pull')
def socket_io_handle_pull():
    json_msg = {
        'msg': "abcćčddžđefghijklmnnjoprsštuvzž"
    }
    print("Pushing", json_msg)

    socket_io.emit('response', json_msg)

@socket_io.on('push')
def socket_io_handle_push(json_msg):
    print("Pushed:", json_msg)

@socket_io.on('disconnect')
def socket_io_handle_disconnect():
    disconnect()

@app.route('/')
def root():
    return flask.render_template(
        'index.html'
    )

if __name__ == '__main__':
    socket_io.run(app)

index.html:

<!DOCTYPE html>
<html>
  <head>
    <script type="text/javascript" src="//cdnjs.cloudflare.com/ajax/libs/socket.io/1.3.6/socket.io.min.js"></script>
  </head>
  <body>
    <script type="text/javascript">
      var socket = io.connect('http://' + document.domain + ':' + location.port);

      socket.on('response', json => {
        socket.emit('push', json);
      })

      socket.emit('pull');
    </script>
  </body>
</html>

输出:

Pushing {'msg': 'abcćčddžđefghijklmnnjoprsštuvzž'}
Pushed: {'msg': 'abcÄ\x87Ä\x8dddA3Ä\x91efghijklmnnjoprsA!tuvzA3'}

我似乎要找回使用 latin-1 解码并使用 utf-8 编码的 mojibake

为了解决这个问题,我添加了:

json_str = json_str.encode('latin-1').decode('utf-8')

如果您遇到此问题,请查看

您正在使用 1.x 版本的 Socket.IO 客户端,它有 known problems 和 double-encoding 的 UTF-8 字符串。您应该尝试已解决此问题的 2.x 版本。

我通过在反向代理路径的末尾添加 socket.io.js 来使用来自反向代理的服务器 socket.io js 文件 xxx.com/reverse_proxy_path/socket.io