python 转换 url 中的汉字
python convert chinese characters in url
我有一个 url 喜欢
href="../job/jobarea.asp?C_jobtype=经营管理主管&peoplenumber=151",
这显示在检查元素中。
但是在新标签页中打开时显示为
../job/jobarea.asp?C_jobtype=%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE&peoplenumber=151
我怎么知道浏览器使用哪种类型的编码来转换它。当我尝试做 scrapy 时,它显示了一些其他格式,并且由于 500 内部服务器错误而停止。能解释一下吗??
是繁体中文,试试cp950
#-*-coding:utf8 -*-
import urllib
s = '經營管理主管'.decode('utf-8').encode('cp950')
print urllib.quote(s)
q ='%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE'
print urllib.unquote(q).decode('cp950').encode('utf-8')
结果
%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE
經營管理主管
我有一个 url 喜欢
href="../job/jobarea.asp?C_jobtype=经营管理主管&peoplenumber=151",
这显示在检查元素中。 但是在新标签页中打开时显示为
../job/jobarea.asp?C_jobtype=%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE&peoplenumber=151
我怎么知道浏览器使用哪种类型的编码来转换它。当我尝试做 scrapy 时,它显示了一些其他格式,并且由于 500 内部服务器错误而停止。能解释一下吗??
是繁体中文,试试cp950
#-*-coding:utf8 -*-
import urllib
s = '經營管理主管'.decode('utf-8').encode('cp950')
print urllib.quote(s)
q ='%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE'
print urllib.unquote(q).decode('cp950').encode('utf-8')
结果
%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE
經營管理主管