在 Perl 6 中按代码点拆分

Split on codepoints in Perl 6

如何拆分代码点而不是字素集群?

样本:

"స్వాగతం".comb()
--> output (స్ వా గ తం)

如何获得以下内容?

 (స ్ వ ా గ త ం)

首先转换为分解的代码点 (.NFD),然后再次转换回字素 (.chr):

dd "స్వాగతం".NFD>>.chr  # ("స", "\x[c4d]", "వ", "ా", "గ", "త", "ం")

我不确定为什么 «్ 在这里呈现为 "\x[c4d]"。也许这指向一个错误。