导出 csv 文件时出现 UTF-8 编码问题,JavaScript

UTF-8 encoidng issue when exporting csv file , JavaScript

我在JavaScript中使用下面的函数将数组导出到csv文件,但是在Windows7中使用Microsoft Excel 2013中文字符变成了乱码。[=12] =]

我用记事本打开导出的文件,但显示正常。

function arrayToCSVConvertor(arrData, reportTitle) {
    var CSV='';
    arrData.forEach(function(infoArray, index){
        var dataString = infoArray.join(",");
        dataString= dataString.split('\n').join(';');
        CSV += dataString+ "\n";
    });

    if (CSV == '') {
        alert("Invalid data");
        return;
    }

    //create a link and click, remove
    var link = document.createElement("a");
    link.id="lnkDwnldLnk";

    //this part will append the anchor tag and remove it after automatic click
    document.body.appendChild(link);

    var csv = CSV;

    var blob = new Blob([csv], { type: ' type: "text/csv;charset=UTF-8"' });//Here, I also tried charset=GBK , and it does not work either
    var csvUrl = createObjectURL(blob);

    var filename = reportTitle+'.csv';

    if(navigator.msSaveBlob){//IE 10
        return navigator.msSaveBlob(blob, filename);
    }else{
        $("#lnkDwnldLnk")
            .attr({
                'download': filename,
                'href': csvUrl
            });
        $('#lnkDwnldLnk')[0].click();
        document.body.removeChild(link);
    }
}

通过在 csv 字符串的开头添加 BOM 解决了问题:

var csv = "\ufeff"+CSV;

这是我的解决方案:

var blob = new Blob(["\uFEFF"+csv], {
    type: 'text/csv; charset=utf-18'
});

根据 RFC2781,字节顺序标记 (BOM) 0xFEFF 是 UTF-16 little endian 编码 (UTF16-LE) 的 BOM。虽然添加 BOM 可能会解决 Windows 的问题,但如果要在 MacOS.

上使用 Excel 打开生成的 CSV 文件,问题仍然存在

编写跨不同 OS 平台(Windows、Linux、MacOS)的多字节 CSV 文件的解决方案应用以下三个规则:

  1. 用制表符而不是逗号分隔字段
  2. 使用 UTF16-LE 对内容进行编码
  3. 内容前缀为UTF16-LE BOM,即0xFEFF

更详细的阐述、示例代码和用例可以在this article

中看到