上传文件名包含 unicode 字符的文件将不起作用

Uploading files with filenames which include unicode characters won't work

我正在尝试从 html 表单上传文件。我为它编写了一个 servlet,它应该在接收到的部分上打开一个输入流,并将数据写入一个具有相同名称和扩展名的文件中。 首先,我对数据本身有问题。例如,具有 unicode 正文的文本文件将无法使用 UTF-8 正确编码字符。然后我开始使用 DataInputStream 和 DataOutputStream 并且出于某种原因现在可以正常工作了。剩下的就是文件名的问题。如果文件名有 unicode 字符,文件名本身将没有正确的编码,并且会出现一些奇怪的字符(如预期的那样)。我已经尝试了几件事,但我不知道如何解决。我正在使用 Wildfly 10.0.10.Final。 因此,例如,如果我的文件名为 ááéé.txt,则生成的文件名为 á

这是我的 HTML 页面:

<html>
<h:head>        
    <meta charset="UTF-8" />
    <meta content="text/html" />
</h:head>
<h:body>
    <div class="container">
        Upload a new file:
        <form enctype="multipart/form-data" method="post" action="upload">
        Files: <input multiple="multiple" id="fileUpload" type="file" name="files" />
        <input type="submit" multiple="multiple" value="upload" />
    </form>
    </div>   
</h:body>
</html>

我的servlet是这样写的:

@WebServlet(name = "fileUploadServlet", urlPatterns = {"/upload"})
@MultipartConfig
public class FileUploadServlet extends HttpServlet {    
    @Override
    protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
        req.setCharacterEncoding("UTF-8");
        int n = 0;
        for (Part file : req.getParts()) {
            String fileName = new String(file.getSubmittedFileName().getBytes("UTF-8"), "UTF-8");            
            try (DataInputStream dis = new DataInputStream(file.getInputStream());
                 DataOutputStream dos = new DataOutputStream(new FileOutputStream("E:\upload\" + fileName))) {
                byte[] buffer = new byte[1024];
                int r;
                while ((r = dis.read(buffer)) != -1) {
                    dos.write(buffer, 0, r);
                }
                n++;
            }
        }
        resp.getWriter().print(n + " files uploaded.");
    }
}

提前致谢!

似乎 WildFly 实现没有使用请求的字符编码。 我找到了解决方案:

String filename = new String(part.getSubmittedFileName().getBytes("ISO-8859-1"), "UTF-8");

req.setCharacterEncoding(...)有时不行。

如果您使用 Tomcat,请在 server.xml 的 Connector 部分设置 URIEncoding="UTF-8",例如

<Connector port="80" protocol="HTTP/1.1" maxThreads="150" connectionTimeout="20000" enableLookups="false"
    URIEncoding="UTF-8" redirectPort="443" />

我想在 Wildfly 中可能有类似的设置。