使用 AWS Rekognition 从视频中提取文本

Question

我的一个 objective 项目是使用 AWS Rekognition 检测流视频中的文本。

我一直在尝试搜索 AWS 文档。 AWS 似乎只允许开发人员从存储的图像中提取文本。

查看此 AWS 文档 - detect text in a Image AWS 文档提供了以下代码来检测图像中的文本。这段代码基本上有 detect_text API，它将来自 S3 的存储图像作为输入，并从图像输出检测到的文本。

我的问题是 -- 是否有任何方法可以使用 AWs Rekognition 从流视频中提取文本？或者我可以说目前无法使用 AWS Rekognition 从流媒体视频中提取文本吗？

让我知道任何解决此问题的方法objective。

import boto3

if __name__ == "__main__":

    bucket='bucket'
    photo='text.png'

    client=boto3.client('rekognition')


    response=client.detect_text(Image={'S3Object':{'Bucket':bucket,'Name':photo}})

    textDetections=response['TextDetections']
    print ('Detected text')
    for text in textDetections:
            print ('Detected text:' + text['DetectedText'])
            print ('Confidence: ' + "{:.2f}".format(text['Confidence']) + "%")
            print ('Id: {}'.format(text['Id']))
            if 'ParentId' in text:
                print ('Parent Id: {}'.format(text['ParentId']))
            print ('Type:' + text['Type'])
            print

Answer 1

文本检测仅适用于 JPG 和 PNG 图片。一种解决方案是从视频中提取帧，然后将它们传递给 Rekognition 进行处理。

这是一个实现此目的的端到端示例，结合了 Kinesis、Lambda 和 Rekognition：https://github.com/aws-samples/amazon-rekognition-video-analyzer

使用 AWS Rekognition 从视频中提取文本

Extracting text from Video using AWS Rekognition

lambda

amazon-s3

amazon-web-services

amazon-kinesis

amazon-rekognition