获取 UNICODE 字符而不是 HEX - cURL PHP
get UNICODE character instead of HEX - cURL PHP
我正在为 IMDB 使用 this scraper,问题是某些字符是 UNICODE ï
。
我将这个 scraper 与 CURL 一起使用,答案是一个以 UTF8 编码的字符串
我尝试使用 mb_detect_encoding() 获取字符串的编码,并使用 UTF-8
进行回答
$html = $this->geturl("${imdbUrl}combined");
mb_detect_encoding($html);
所以我有一个字符串,里面有一些十六进制值,例如:
$var = 'Saïd Taghmaoui'
所以我尝试使用 utf8_decode() 获取 $html 的值,但没有运气,我仍然有一些十六进制字符。
所以我有几个问题:
1- 最好的解决方案是什么?我想象不同的场景,例如读取字符串并使用 REGEX 更改字符的所有十六进制代码,但我不确定这是否是最好的解决方案,而且我也不知道如何为此创建 REGEX。
2- 可以通过 cURL 解决吗?我的意思是管理一些配置以设置 UTF-8 中的 cURL 编码?
我尝试使用函数 recode_string 或 iconv 或 mb_convert_encoding
基本上我的问题是 scraper 的答案带有 UTF-8 编码,但在打印文本之前我需要使用此函数处理数据
$var = 'Saïd Taghmaoui'
htmlspecialchars(html_entity_decode($var, ENT_QUOTES, 'UTF-8'), ENT_NOQUOTES, 'UTF-8');
我正在为 IMDB 使用 this scraper,问题是某些字符是 UNICODE ï
。
我将这个 scraper 与 CURL 一起使用,答案是一个以 UTF8 编码的字符串
我尝试使用 mb_detect_encoding() 获取字符串的编码,并使用 UTF-8
$html = $this->geturl("${imdbUrl}combined");
mb_detect_encoding($html);
所以我有一个字符串,里面有一些十六进制值,例如:
$var = 'Saïd Taghmaoui'
所以我尝试使用 utf8_decode() 获取 $html 的值,但没有运气,我仍然有一些十六进制字符。
所以我有几个问题:
1- 最好的解决方案是什么?我想象不同的场景,例如读取字符串并使用 REGEX 更改字符的所有十六进制代码,但我不确定这是否是最好的解决方案,而且我也不知道如何为此创建 REGEX。
2- 可以通过 cURL 解决吗?我的意思是管理一些配置以设置 UTF-8 中的 cURL 编码?
我尝试使用函数 recode_string 或 iconv 或 mb_convert_encoding
基本上我的问题是 scraper 的答案带有 UTF-8 编码,但在打印文本之前我需要使用此函数处理数据
$var = 'Saïd Taghmaoui'
htmlspecialchars(html_entity_decode($var, ENT_QUOTES, 'UTF-8'), ENT_NOQUOTES, 'UTF-8');