PHP - 自动检测(原始)urlencode
PHP - auto detect (raw)urlencode
PHP 文件正在通过 GET 接收 URL 编码字符串。但是,某些脚本可能会发送使用 urlencode()
函数编码的字符串,而其他脚本可能会发送使用 rawurlencode()
函数编码的字符串。
检查使用哪个函数对字符串进行编码以便调用适当的解码函数(urldecode()
或 rawurldecode()
)的最佳方法是什么?
到目前为止,我唯一的想法是这样的代码:
if (stristr($string, "%20"))...
这两个函数采用正则表达式 [^0-9A-Za-z_~-]
定义的任何字符,并将其转换为百分号后跟十六进制代码点。两种编码方法之间的唯一区别是 rawurlencode()
使用 %20
代替 space,而不是 urlencode()
使用 +
。
对于解码,这意味着任何匹配正则表达式%[0-9A-F]{2}
的序列将被either函数正确解码.这只会让 +
担心,它不会被 rawurldecode()
正确解码。因此,您可以在服务器端使用 urldecode()
而不必担心任何测试。
<?php
$str = "foo bar baz";
$raw = rawurlencode($str);
$enc = urlencode($str);
echo rawurldecode($raw);
echo rawurldecode($enc);
echo urldecode($raw);
echo urldecode($enc);
?>
输出:
foo bar baz
foo+bar+baz
foo bar baz
foo bar baz
PHP 文件正在通过 GET 接收 URL 编码字符串。但是,某些脚本可能会发送使用 urlencode()
函数编码的字符串,而其他脚本可能会发送使用 rawurlencode()
函数编码的字符串。
检查使用哪个函数对字符串进行编码以便调用适当的解码函数(urldecode()
或 rawurldecode()
)的最佳方法是什么?
到目前为止,我唯一的想法是这样的代码:
if (stristr($string, "%20"))...
这两个函数采用正则表达式 [^0-9A-Za-z_~-]
定义的任何字符,并将其转换为百分号后跟十六进制代码点。两种编码方法之间的唯一区别是 rawurlencode()
使用 %20
代替 space,而不是 urlencode()
使用 +
。
对于解码,这意味着任何匹配正则表达式%[0-9A-F]{2}
的序列将被either函数正确解码.这只会让 +
担心,它不会被 rawurldecode()
正确解码。因此,您可以在服务器端使用 urldecode()
而不必担心任何测试。
<?php
$str = "foo bar baz";
$raw = rawurlencode($str);
$enc = urlencode($str);
echo rawurldecode($raw);
echo rawurldecode($enc);
echo urldecode($raw);
echo urldecode($enc);
?>
输出:
foo bar baz
foo+bar+baz
foo bar baz
foo bar baz