Apache Tika 将 AC3 文件解析为 application/octet-stream 而不是 audio/ac3
Apache Tika parses AC3 file as application/octet-stream and not audio/ac3
提供一个 AC3 音频文件作为输入,获取 InputStream 并将其传递给 Apache Tika。
虽然库在其 mime 类型 XML 中列出了 audio/ac3,但无法识别类型。它适用于其他标准媒体类型。
任何人都知道如何解决这个问题。
Metadata metadata = new Metadata();
metadata.add(Metadata.RESOURCE_NAME_KEY, fileName);
TikaConfig config = TikaConfig.getDefaultConfig();
MimeTypes mimeTypes = config.getMimeRepository();
tikaMediaType = mimeTypes.detect(new BufferedInputStream(inputStream), metadata);
您需要使用更新版本的 Apache Tika!
具体来说,Apache Tika 2.0,或从 2017 年 12 月 24 日或之后的 Github 开始的夜间构建/构建。
添加了 AC3 和 EAC3 文件的 MIME 检测魔法
提供一个 AC3 音频文件作为输入,获取 InputStream 并将其传递给 Apache Tika。
虽然库在其 mime 类型 XML 中列出了 audio/ac3,但无法识别类型。它适用于其他标准媒体类型。
任何人都知道如何解决这个问题。
Metadata metadata = new Metadata();
metadata.add(Metadata.RESOURCE_NAME_KEY, fileName);
TikaConfig config = TikaConfig.getDefaultConfig();
MimeTypes mimeTypes = config.getMimeRepository();
tikaMediaType = mimeTypes.detect(new BufferedInputStream(inputStream), metadata);
您需要使用更新版本的 Apache Tika!
具体来说,Apache Tika 2.0,或从 2017 年 12 月 24 日或之后的 Github 开始的夜间构建/构建。
添加了 AC3 和 EAC3 文件的 MIME 检测魔法