在 Perl 6 中按代码点拆分
Split on codepoints in Perl 6
如何拆分代码点而不是字素集群?
样本:
"స్వాగతం".comb()
--> output (స్ వా గ తం)
如何获得以下内容?
(స ్ వ ా గ త ం)
首先转换为分解的代码点 (.NFD
),然后再次转换回字素 (.chr
):
dd "స్వాగతం".NFD>>.chr # ("స", "\x[c4d]", "వ", "ా", "గ", "త", "ం")
我不确定为什么 «్
在这里呈现为 "\x[c4d]"
。也许这指向一个错误。
如何拆分代码点而不是字素集群?
样本:
"స్వాగతం".comb()
--> output (స్ వా గ తం)
如何获得以下内容?
(స ్ వ ా గ త ం)
首先转换为分解的代码点 (.NFD
),然后再次转换回字素 (.chr
):
dd "స్వాగతం".NFD>>.chr # ("స", "\x[c4d]", "వ", "ా", "గ", "త", "ం")
我不确定为什么 «్
在这里呈现为 "\x[c4d]"
。也许这指向一个错误。