在 Perl 6 中按代码点拆分

Question

如何拆分代码点而不是字素集群？

样本：

"స్వాగతం".comb()
--> output (స్ వా గ తం)

如何获得以下内容？

 (స ్ వ ా గ త ం)

Answer 1

首先转换为分解的代码点 (.NFD)，然后再次转换回字素 (.chr):

dd "స్వాగతం".NFD>>.chr  # ("స", "\x[c4d]", "వ", "ా", "గ", "త", "ం")

我不确定为什么 «్ 在这里呈现为 "\x[c4d]"。也许这指向一个错误。

Split on codepoints in Perl 6