无法通过 PDO_ODBC 从 Access 检索 UTF-8 重音字符
Unable to retrieve UTF-8 accented characters from Access via PDO_ODBC
我正在尝试将 Access DB 转换为 MySQL。一切正常,期待一把大活动扳手......如果访问数据库有任何非标准字符,它将无法工作。我的查询会告诉我:
Incorrect string value: '\xE9d'
如果我直接回显具有 'invalid' 字符的行文本,我会在浏览器中的黑色方块中看到一个问号(所以 é 会在回显时变成无效的符号)。
注意:同一个 from 将接受、保存并在用于标题此数据库上传的文本框中显示“é”。另外,如果我 'save as' 页面和 re-open 向上,'é' 会正确显示....
这是我的连接方式:
$conn = new PDO("odbc:Driver={Microsoft Access Driver (*.mdb)};Dbq=$fileLocation;SystemDB=$securefilePath;Uid=developer;Pwd=pass;charset=utf;");
我试过很多东西,包括:
$conn -> exec("set names utf8");
当我在访问中尝试 'CurrentDb.CollatingOrder' 时,它告诉我 1033 显然是 "English, German, French, and Portuguese collating order".
的 dbSortGeneral
怎么了?这几乎就像 PDO 向我发送了我的浏览器的整理,PHP 不完全理解。
问题
当使用本机 PHP ODBC 功能(PDO_ODBC 或更早的 odbc_
功能)和 Access ODBC 驱动程序时,文本不是 UTF-8 编码的,即使它被存储在 Access 数据库中作为 Unicode 字符。因此,对于名为 "Teams"
的示例 table
Team
-----------------------
Boston Bruins
Canadiens de Montréal
Федерация хоккея России
代码
<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr =
'odbc:' .
'Driver={Microsoft Access Driver (*.mdb)};' .
'Dbq=C:\Users\Public\__SO\28311687.mdb;' .
'Uid=Admin;';
$db = new PDO($connStr);
$db->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);
$sql = "SELECT Team FROM Teams";
foreach ($db->query($sql) as $row) {
$s = $row["Team"];
echo $s . "<br/>\n";
}
?>
</body>
</html>
在浏览器中显示这个
Boston Bruins
Canadiens de Montr�al
????????? ?????? ??????
简单但不完整的修复
Access ODBC 返回的文本实际上与该字符集中字符的 Windows-1252 字符编码相匹配,因此只需更改行
$s = $row["Team"];
至
$s = utf8_encode($row["Team"]);
将允许正确显示第二个条目
Boston Bruins
Canadiens de Montréal
????????? ?????? ??????
但是 utf8_encode() 函数 从 ISO-8859-1 转换而来,而不是 Windows-1252,所以一些字符(特别是欧元符号“€”)将会消失。更好的解决方案是使用
$s = mb_convert_encoding($row["Team"], "UTF-8", "Windows-1252");
但这仍然无法解决我们样本中第三个条目的问题 table。
完全修复
要获得完整的 UTF-8 支持,我们需要将 COM 与 ADODB Connection 和 Recordset 对象一起使用
<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr =
'Driver={Microsoft Access Driver (*.mdb)};' .
'Dbq=C:\Users\Public\__SO\28311687.mdb';
$con = new COM("ADODB.Connection", NULL, CP_UTF8); // specify UTF-8 code page
$con->Open($connStr);
$rst = new COM("ADODB.Recordset");
$sql = "SELECT Team FROM Teams";
$rst->Open($sql, $con, 3, 3); // adOpenStatic, adLockOptimistic
while (!$rst->EOF) {
$s = $rst->Fields("Team");
echo $s . "<br/>\n";
$rst->MoveNext;
}
$rst->Close();
$con->Close();
?>
</body>
</html>
操作数据更容易一些。 (矩阵数组).
function consulta($sql) {
$db_path = $_SERVER["DOCUMENT_ROOT"] . '/database/Registros.accdb';
$conn = new COM('ADODB.Connection', NULL, CP_UTF8) or exit('Falha ao iniciar o ADO (objeto COM).');
$conn->Open("Persist Security Info=False;Provider=Microsoft.ACE.OLEDB.12.0;Jet OLEDB:Database Password=ifpb@10510211298;Data Source=$db_path");
$rs = $conn->Execute($sql);
$numRegistos = $rs->Fields->Count;
$index = 0;
while (!$rs->EOF){
for ($n = 0; $n < $numRegistos; $n++) {
if(is_null($rs->Fields[$n]->Value)) continue;
$resultados[$index][$rs->Fields[$n]->Name] = $rs->Fields[$n]->Value;
echo '.';
}
echo '<br>';
$index = $index + 1;
$rs->MoveNext();
}
$conn->Close();
return $resultados;
}
$dados = consulta("select * from campus");
var_dump($dados);
找到以下解决方案。没错,我没有机会在 php 上测试它。但我想它应该会成功。
为了本机 PHP ODBC 功能(PDO_ODBC 或旧的 odbc_ 函数)和 Access ODBC 驱动程序能够正确地减去存储在 Access 数据库中的 Unicode 编码文本作为 Unicode 字符,需要在 Windows 操作系统的区域设置中启用“Beta:使用 Unicode UTF-8 进行全球语言支持”。
在我这样做之后,许多使用标准 ODBC 驱动程序 MC Access 的程序开始以 Unicode 编码显示正确的文本。
所有设置 -> 时间和语言 -> 语言 -> “管理语言设置”
我正在尝试将 Access DB 转换为 MySQL。一切正常,期待一把大活动扳手......如果访问数据库有任何非标准字符,它将无法工作。我的查询会告诉我:
Incorrect string value: '\xE9d'
如果我直接回显具有 'invalid' 字符的行文本,我会在浏览器中的黑色方块中看到一个问号(所以 é 会在回显时变成无效的符号)。
注意:同一个 from 将接受、保存并在用于标题此数据库上传的文本框中显示“é”。另外,如果我 'save as' 页面和 re-open 向上,'é' 会正确显示....
这是我的连接方式:
$conn = new PDO("odbc:Driver={Microsoft Access Driver (*.mdb)};Dbq=$fileLocation;SystemDB=$securefilePath;Uid=developer;Pwd=pass;charset=utf;");
我试过很多东西,包括:
$conn -> exec("set names utf8");
当我在访问中尝试 'CurrentDb.CollatingOrder' 时,它告诉我 1033 显然是 "English, German, French, and Portuguese collating order".
的 dbSortGeneral怎么了?这几乎就像 PDO 向我发送了我的浏览器的整理,PHP 不完全理解。
问题
当使用本机 PHP ODBC 功能(PDO_ODBC 或更早的 odbc_
功能)和 Access ODBC 驱动程序时,文本不是 UTF-8 编码的,即使它被存储在 Access 数据库中作为 Unicode 字符。因此,对于名为 "Teams"
Team
-----------------------
Boston Bruins
Canadiens de Montréal
Федерация хоккея России
代码
<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr =
'odbc:' .
'Driver={Microsoft Access Driver (*.mdb)};' .
'Dbq=C:\Users\Public\__SO\28311687.mdb;' .
'Uid=Admin;';
$db = new PDO($connStr);
$db->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);
$sql = "SELECT Team FROM Teams";
foreach ($db->query($sql) as $row) {
$s = $row["Team"];
echo $s . "<br/>\n";
}
?>
</body>
</html>
在浏览器中显示这个
Boston Bruins
Canadiens de Montr�al
????????? ?????? ??????
简单但不完整的修复
Access ODBC 返回的文本实际上与该字符集中字符的 Windows-1252 字符编码相匹配,因此只需更改行
$s = $row["Team"];
至
$s = utf8_encode($row["Team"]);
将允许正确显示第二个条目
Boston Bruins
Canadiens de Montréal
????????? ?????? ??????
但是 utf8_encode() 函数 从 ISO-8859-1 转换而来,而不是 Windows-1252,所以一些字符(特别是欧元符号“€”)将会消失。更好的解决方案是使用
$s = mb_convert_encoding($row["Team"], "UTF-8", "Windows-1252");
但这仍然无法解决我们样本中第三个条目的问题 table。
完全修复
要获得完整的 UTF-8 支持,我们需要将 COM 与 ADODB Connection 和 Recordset 对象一起使用
<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr =
'Driver={Microsoft Access Driver (*.mdb)};' .
'Dbq=C:\Users\Public\__SO\28311687.mdb';
$con = new COM("ADODB.Connection", NULL, CP_UTF8); // specify UTF-8 code page
$con->Open($connStr);
$rst = new COM("ADODB.Recordset");
$sql = "SELECT Team FROM Teams";
$rst->Open($sql, $con, 3, 3); // adOpenStatic, adLockOptimistic
while (!$rst->EOF) {
$s = $rst->Fields("Team");
echo $s . "<br/>\n";
$rst->MoveNext;
}
$rst->Close();
$con->Close();
?>
</body>
</html>
操作数据更容易一些。 (矩阵数组).
function consulta($sql) {
$db_path = $_SERVER["DOCUMENT_ROOT"] . '/database/Registros.accdb';
$conn = new COM('ADODB.Connection', NULL, CP_UTF8) or exit('Falha ao iniciar o ADO (objeto COM).');
$conn->Open("Persist Security Info=False;Provider=Microsoft.ACE.OLEDB.12.0;Jet OLEDB:Database Password=ifpb@10510211298;Data Source=$db_path");
$rs = $conn->Execute($sql);
$numRegistos = $rs->Fields->Count;
$index = 0;
while (!$rs->EOF){
for ($n = 0; $n < $numRegistos; $n++) {
if(is_null($rs->Fields[$n]->Value)) continue;
$resultados[$index][$rs->Fields[$n]->Name] = $rs->Fields[$n]->Value;
echo '.';
}
echo '<br>';
$index = $index + 1;
$rs->MoveNext();
}
$conn->Close();
return $resultados;
}
$dados = consulta("select * from campus");
var_dump($dados);
找到以下解决方案。没错,我没有机会在 php 上测试它。但我想它应该会成功。
为了本机 PHP ODBC 功能(PDO_ODBC 或旧的 odbc_ 函数)和 Access ODBC 驱动程序能够正确地减去存储在 Access 数据库中的 Unicode 编码文本作为 Unicode 字符,需要在 Windows 操作系统的区域设置中启用“Beta:使用 Unicode UTF-8 进行全球语言支持”。
在我这样做之后,许多使用标准 ODBC 驱动程序 MC Access 的程序开始以 Unicode 编码显示正确的文本。
所有设置 -> 时间和语言 -> 语言 -> “管理语言设置”