如何将 Amazon Transcribe json 响应转换为字幕格式（srt、webvvt 等）？

How can I convert Amazon Transcribe json response to a caption format (srt, webvvt, etc)?

试图找到一个包来转换我的 json 来自 Amazon AWS Transcribe 服务的响应，但没有成功。

我不想采用天真的方法，只是 "bundle" 将 10 个单词放在一起，因为那样会 space 字幕以一种奇怪的方式出现。

我什至会接受使用 Google 语音服务或 Speechmatics 的编程方式。他们都是 return 一个 json 按单词分类的文件。

有人以前用过吗？

谢谢！

您可能已经找到了执行该操作的方法或创建了一个脚本。我还尝试找到一些现成的解决方案，因此最终编写了一些 JavaScript 代码以从 Amazon Transcribe 的 JSON 输出生成 SRT。

我在句点 (.) 断句。它是一个独立的 HTML 文件。有需要的可以随意下载修改。

我遇到了这个答案，并且也在寻找它一段时间，通过使用其他一些链接中显示的一些信息 - 接近我可以使用的东西，但没有得到确切的答案，我决定完成解决方案。

第 1 步 - 获取一个 HTML 模板来处理文本块和演讲者姓名，然后按下按钮来处理 javascript 第 2 步 - 将从 Aws 收到的 json 粘贴到文本块中第 3 步 - 单击按钮。

我发现有用的一件事是了解翻译的可信度 - 使用它有助于了解翻译中可能存在的问题，还可以显示翻译作品的确切时间，让您能够去那个录音的地方

好吧，使用它并享受它，有一天可能会对某人有所帮助:)

这是我发现的一个简单的实用程序脚本，用于将 Amazon Transcribe .json 转录本转换为更具可读性的转录本

这是您可能会用到的要点。或者让您了解需要什么。基本上我最终做了什么。 https://gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae

我使用了 github 中的这个 python 脚本，它可以很好地格式化为 docx 格式。输出甚至包括单词置信度的散点图以及更改颜色以降低置信度的单词。

这对我来说非常有效，但我认为如果您想更改 python 脚本，您可以相当简单地将它转到 html。

我最终创建了一个 Bash 脚本来将 AWS Transcribe JSON 文件转换为 SRT。

它使用 'jq' 解析 JSON 文件。

受到的启发，我接受了它并做了一些小改动。放心使用吧。

我个人将此工具用于我自己的目的，因此希望保持更新。

我为此构建了一个网络应用程序（查看和编辑 aws 转录 JSON 文件）：https://scription.app

它将说话者分开，突出显示低置信度的单词并将文本链接到音频播放（如果您加载音频文件）。它仍然是测试版，但希望对遇到此问题的任何人有所帮助 post!