Python 3.6 - 无法在字符串中转换 Unicode
Python 3.6 - Can't convert Unicode in a string
我正在使用 Python 3.6 进行一些抓取工作,并在以下格式的字符串中检索了一些 URL:
someURL = 'http:\u002F\u002Fsomewebsite.com\u002Fsomefile.jpg'
我一直在尝试转换这些字符串中的 Unicode 反斜杠 (\u002F) 以便使用 URL(使用正则表达式方法、字符串上的 encode() 等),但无济于事。该字符串仍然保留 Unicode 反斜杠,如果我将它传递给请求的 get(),例如,我会收到以下错误消息:
InvalidURL: Failed to parse: http:\u002F\u002Fsomewebsite.com\u002Fsomefile.jpg"
我在本论坛和其他论坛中搜索了解决方案,但似乎无法确定。我相信这很简单...
使用 codecs.decode
和名为 'unicode-escape'
:
的编码
import codecs
print(codecs.decode(someURL, 'unicode-escape'))
# prints 'http://somewebsite.com/somefile.jpg'
我正在使用 Python 3.6 进行一些抓取工作,并在以下格式的字符串中检索了一些 URL:
someURL = 'http:\u002F\u002Fsomewebsite.com\u002Fsomefile.jpg'
我一直在尝试转换这些字符串中的 Unicode 反斜杠 (\u002F) 以便使用 URL(使用正则表达式方法、字符串上的 encode() 等),但无济于事。该字符串仍然保留 Unicode 反斜杠,如果我将它传递给请求的 get(),例如,我会收到以下错误消息:
InvalidURL: Failed to parse: http:\u002F\u002Fsomewebsite.com\u002Fsomefile.jpg"
我在本论坛和其他论坛中搜索了解决方案,但似乎无法确定。我相信这很简单...
使用 codecs.decode
和名为 'unicode-escape'
:
import codecs
print(codecs.decode(someURL, 'unicode-escape'))
# prints 'http://somewebsite.com/somefile.jpg'