来自 Flash 内容的文本

Text from flash content

我目前正在构建一个宠物项目只是为了消磨时间(并学习一些东西)。

所以手头的问题是:我想从动态加载的 Flash 内容中捕获文本(几乎是一种类似拼字游戏的游戏,将字母放在 10X10 阵列上,您可以从中选择)。请求的功能是在编程语言上重新创建此数组。

由于这将完全用于学术目的,window 位置、焦点、权限等无关紧要(在完全受控的环境中,我只会 运行 所以无需考虑部署)。使用的语言也无关紧要(只要通过捕获让我们说当前屏幕即时完成,包括图像分析在内的任何答案都将被认为是正确的)

也欢迎任何指向正确方向的指示,即使它们不构成完整的答案。

示例图片在这里

注意字符是希腊语,只需要中间的大字母(我应该能够提取所有文本,这是一个额外的好处,但如果不能提取也不是问题)

编辑:一个理想的解决方案是关于 OCR(光学字符识别)。不指定语言是为了避免限制答案,因为任何语言都是可以接受的,但是由于处理速度,我的主要选择是 c/c++。

也就是说,任何切中要害的答案(将此闪存 'array' 变成编程语言的 10X10 数组)及其背后的任何方法都是可以接受的答案。当然,对于如此复杂的问题,我并不期望得到一个完全有效的答案,足够强大的指针就足够了。

使用 actionscript 3,您可以将该游戏 swf 加载到另一个 swf 中,该 swf 会截取屏幕截图并将其保存到磁盘,但这意味着使用两种不同的语言将过程分成两个步骤:

  1. 通过as3截图
  2. 通过c++处理数据

使用 C++ 和 system() 调用截屏可能更简单。 (随意使用 Windows 特定的 c++ API 来截取屏幕截图,它使它更容易,但可能值得保持代码的可移植性。

然后您的 C++ 程序可以访问屏幕并使用 OpenCV/Tesseract

对其进行 OCR 处理