获取 UNICODE 字符而不是 HEX - cURL PHP

get UNICODE character instead of HEX - cURL PHP

我正在为 IMDB 使用 this scraper,问题是某些字符是 UNICODE ï。 我将这个 scraper 与 CURL 一起使用,答案是一个以 UTF8 编码的字符串 我尝试使用 mb_detect_encoding() 获取字符串的编码,并使用 UTF-8

进行回答
$html = $this->geturl("${imdbUrl}combined");
mb_detect_encoding($html);

所以我有一个字符串,里面有一些十六进制值,例如:

$var = 'Saïd Taghmaoui'

所以我尝试使用 utf8_decode() 获取 $html 的值,但没有运气,我仍然有一些十六进制字符。

所以我有几个问题:

1- 最好的解决方案是什么?我想象不同的场景,例如读取字符串并使用 REGEX 更改字符的所有十六进制代码,但我不确定这是否是最好的解决方案,而且我也不知道如何为此创建 REGEX。

2- 可以通过 cURL 解决吗?我的意思是管理一些配置以设置 UTF-8 中的 cURL 编码?

我尝试使用函数 recode_stringiconvmb_convert_encoding

基本上我的问题是 scraper 的答案带有 UTF-8 编码,但在打印文本之前我需要使用此函数处理数据

$var = 'Saïd Taghmaoui'
htmlspecialchars(html_entity_decode($var, ENT_QUOTES, 'UTF-8'), ENT_NOQUOTES, 'UTF-8');