导出 csv 文件时出现 UTF-8 编码问题,JavaScript
UTF-8 encoidng issue when exporting csv file , JavaScript
我在JavaScript中使用下面的函数将数组导出到csv文件,但是在Windows7中使用Microsoft Excel 2013中文字符变成了乱码。[=12] =]
我用记事本打开导出的文件,但显示正常。
function arrayToCSVConvertor(arrData, reportTitle) {
var CSV='';
arrData.forEach(function(infoArray, index){
var dataString = infoArray.join(",");
dataString= dataString.split('\n').join(';');
CSV += dataString+ "\n";
});
if (CSV == '') {
alert("Invalid data");
return;
}
//create a link and click, remove
var link = document.createElement("a");
link.id="lnkDwnldLnk";
//this part will append the anchor tag and remove it after automatic click
document.body.appendChild(link);
var csv = CSV;
var blob = new Blob([csv], { type: ' type: "text/csv;charset=UTF-8"' });//Here, I also tried charset=GBK , and it does not work either
var csvUrl = createObjectURL(blob);
var filename = reportTitle+'.csv';
if(navigator.msSaveBlob){//IE 10
return navigator.msSaveBlob(blob, filename);
}else{
$("#lnkDwnldLnk")
.attr({
'download': filename,
'href': csvUrl
});
$('#lnkDwnldLnk')[0].click();
document.body.removeChild(link);
}
}
通过在 csv 字符串的开头添加 BOM 解决了问题:
var csv = "\ufeff"+CSV;
这是我的解决方案:
var blob = new Blob(["\uFEFF"+csv], {
type: 'text/csv; charset=utf-18'
});
根据 RFC2781,字节顺序标记 (BOM) 0xFEFF 是 UTF-16 little endian 编码 (UTF16-LE) 的 BOM。虽然添加 BOM 可能会解决 Windows 的问题,但如果要在 MacOS.
上使用 Excel 打开生成的 CSV 文件,问题仍然存在
编写跨不同 OS 平台(Windows、Linux、MacOS)的多字节 CSV 文件的解决方案应用以下三个规则:
- 用制表符而不是逗号分隔字段
- 使用 UTF16-LE 对内容进行编码
- 内容前缀为UTF16-LE BOM,即0xFEFF
更详细的阐述、示例代码和用例可以在this article
中看到
我在JavaScript中使用下面的函数将数组导出到csv文件,但是在Windows7中使用Microsoft Excel 2013中文字符变成了乱码。[=12] =]
我用记事本打开导出的文件,但显示正常。
function arrayToCSVConvertor(arrData, reportTitle) {
var CSV='';
arrData.forEach(function(infoArray, index){
var dataString = infoArray.join(",");
dataString= dataString.split('\n').join(';');
CSV += dataString+ "\n";
});
if (CSV == '') {
alert("Invalid data");
return;
}
//create a link and click, remove
var link = document.createElement("a");
link.id="lnkDwnldLnk";
//this part will append the anchor tag and remove it after automatic click
document.body.appendChild(link);
var csv = CSV;
var blob = new Blob([csv], { type: ' type: "text/csv;charset=UTF-8"' });//Here, I also tried charset=GBK , and it does not work either
var csvUrl = createObjectURL(blob);
var filename = reportTitle+'.csv';
if(navigator.msSaveBlob){//IE 10
return navigator.msSaveBlob(blob, filename);
}else{
$("#lnkDwnldLnk")
.attr({
'download': filename,
'href': csvUrl
});
$('#lnkDwnldLnk')[0].click();
document.body.removeChild(link);
}
}
通过在 csv 字符串的开头添加 BOM 解决了问题:
var csv = "\ufeff"+CSV;
这是我的解决方案:
var blob = new Blob(["\uFEFF"+csv], {
type: 'text/csv; charset=utf-18'
});
根据 RFC2781,字节顺序标记 (BOM) 0xFEFF 是 UTF-16 little endian 编码 (UTF16-LE) 的 BOM。虽然添加 BOM 可能会解决 Windows 的问题,但如果要在 MacOS.
上使用 Excel 打开生成的 CSV 文件,问题仍然存在编写跨不同 OS 平台(Windows、Linux、MacOS)的多字节 CSV 文件的解决方案应用以下三个规则:
- 用制表符而不是逗号分隔字段
- 使用 UTF16-LE 对内容进行编码
- 内容前缀为UTF16-LE BOM,即0xFEFF
更详细的阐述、示例代码和用例可以在this article
中看到