带有国家名称的 Tesseract 数据语言代码

Tesseract data language codes with country name

Tesseract 更新了他们的 iOS 库和训练数据。训练数据带有语言代码。我怎么知道这是哪种语言以及它属于哪个国家?我为此搜索了所有 Google。有些代码是可以理解的,但不是全部。即

  1. asm.traindata
  2. aze.traindata
  3. bel.traindata
  4. ben.traindata
  5. bod.traindata ....

这些文件名是 ISO 639-2/T 或 ISO 639-2/B 语言代码。 IN THIS WIKI ARTICLE 您可以找到整个 table 种语言及其代码,因此找出这些文件属于哪种语言应该很容易。