高吞吐量在数据科学领域究竟意味着什么

What exactly high throughput means in Data Science field

在我学习数据工程的过程中,数据科学领域的高吞吐量究竟意味着什么?我遇到过很多次,但我不知道它的确切含义。谁能把这个词分解成简单的词,这样我就能把它联系起来。

吞吐量 通常以每秒处理的数据记录(或字节数)来衡量。它通常与 延迟 一起报告,后者衡量执行该处理所需的时间。

例如,在 2020 年 11 月 11 日中国双十一购物节之后,阿里巴巴报告每秒处理多达 40 亿个事件——我们可以称之为他们的峰值吞吐量.