PHP 词边界 /b 正则表达式不适用于法语
PHP word boundary /b regex not working with French
我正在尝试将句子“ça vous dit quoi”与正则表达式模式相匹配:
$pattern=(\b".$value."\b)
单词边界适用于除法语专用字符(如 ça 开头的 ç)之外的任何字符。我可以通过更改 PHP 语言环境来解决单词边界问题:
setlocale(LC_ALL, 'fr_FR');
当我这样做时,它成功匹配了句子,但是所有的法语字符都显示为�所以我得到:
�a vous dit quoi
有点烦人。解决一个问题只会产生另一个问题。我已经将 html 语言环境设置为:
<html xmlns="http://www.w3.org/1999/xhtml" lang="fr" xml:lang="fr" version="XHTML+RDFa 1.0" dir="ltr">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
不确定还需要做些什么来解决这个问题?法语当然应该显示正常,所有语言环境都设置为法语...?
编辑:我的服务器通过 phpinfo 将 UTF-8 显示为本地值和主值的默认字符集。
编辑:这个问题与建议的问题不相似,因为这个问题根本不相似。解决方案可能相同,但在 google 中搜索我所遇到的那种问题的任何人都不会找到那个问题,但他们会找到我的。我认为人们开始只是为了它而将问题标记为重复。
这个问题也和我的一样,答案是一样的:
regular expression for French characters
但这会使所有三个问题重复。
修复 ?? 似乎是一场噩梦在法语语言环境中显示,但我能够通过修改正则表达式模式来以另一种方式解决此问题。通过在模式中添加 'u' 作为修饰符,它能够检测到 ça 中的法语字符 ç 并且无需更改语言环境即可正常工作。
来自这里:
$pattern=(\b".$value."\b)
对此:
$pattern=(\b".$value."\b/u)
我正在尝试将句子“ça vous dit quoi”与正则表达式模式相匹配:
$pattern=(\b".$value."\b)
单词边界适用于除法语专用字符(如 ça 开头的 ç)之外的任何字符。我可以通过更改 PHP 语言环境来解决单词边界问题:
setlocale(LC_ALL, 'fr_FR');
当我这样做时,它成功匹配了句子,但是所有的法语字符都显示为�所以我得到:
�a vous dit quoi
有点烦人。解决一个问题只会产生另一个问题。我已经将 html 语言环境设置为:
<html xmlns="http://www.w3.org/1999/xhtml" lang="fr" xml:lang="fr" version="XHTML+RDFa 1.0" dir="ltr">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
不确定还需要做些什么来解决这个问题?法语当然应该显示正常,所有语言环境都设置为法语...?
编辑:我的服务器通过 phpinfo 将 UTF-8 显示为本地值和主值的默认字符集。
编辑:这个问题与建议的问题不相似,因为这个问题根本不相似。解决方案可能相同,但在 google 中搜索我所遇到的那种问题的任何人都不会找到那个问题,但他们会找到我的。我认为人们开始只是为了它而将问题标记为重复。
这个问题也和我的一样,答案是一样的: regular expression for French characters 但这会使所有三个问题重复。
修复 ?? 似乎是一场噩梦在法语语言环境中显示,但我能够通过修改正则表达式模式来以另一种方式解决此问题。通过在模式中添加 'u' 作为修饰符,它能够检测到 ça 中的法语字符 ç 并且无需更改语言环境即可正常工作。
来自这里:
$pattern=(\b".$value."\b)
对此:
$pattern=(\b".$value."\b/u)