如何使用 Microsoft.media.ocr 制作带有边界框覆盖的实时摄像头,以便用户可以在 UWP 中触摸并进行文字转语音?
How to make a live camera with Microsoft.media.ocr with bounding box overlay so that user can touch and have text to speech in UWP?
我已经实现了实时摄像头并使用 Android 文本识别,当我触摸边界框叠加层时,文本到语音可以正常工作,但在通用 windows 中,应用程序无法获得任何文档任何人都可以帮助如何在实时相机 OCR 中实施?
API 来自 Windows.Media.Ocr
namespace can extract text and text layout information from images. It’s designed to handle various types of images. For camera, you could capture images from the camera for recognition. You could get VideoFrame
来自相机并转换为图像。
UWP应用中如何实现OCR的更多细节请参考this sample。场景 2 提供了如何从相机捕获图像并提取文本。
关于 UWP 应用程序中 MediaCapture
的更多详细信息,请参考 this tutorial。
文字转语音功能请参考this article and this sample.
如果您想要比 Windows.Media.Ocr
命名空间更多的附加功能,我建议您使用 Microsoft Cognitive Services。查看近乎实时地分析视频部分了解更多详情。
我已经实现了实时摄像头并使用 Android 文本识别,当我触摸边界框叠加层时,文本到语音可以正常工作,但在通用 windows 中,应用程序无法获得任何文档任何人都可以帮助如何在实时相机 OCR 中实施?
API 来自 Windows.Media.Ocr
namespace can extract text and text layout information from images. It’s designed to handle various types of images. For camera, you could capture images from the camera for recognition. You could get VideoFrame
来自相机并转换为图像。
UWP应用中如何实现OCR的更多细节请参考this sample。场景 2 提供了如何从相机捕获图像并提取文本。
关于 UWP 应用程序中 MediaCapture
的更多详细信息,请参考 this tutorial。
文字转语音功能请参考this article and this sample.
如果您想要比 Windows.Media.Ocr
命名空间更多的附加功能,我建议您使用 Microsoft Cognitive Services。查看近乎实时地分析视频部分了解更多详情。