使用 space 作为分隔符连接内容语言未知的单词是否安全

Is it safe to use space as delimiter to concatenate words where language of the content is unknown

我必须对输入执行 NLP(尤其是语言检测)。输入有多个字段:

{ field1: "", field2: "" ... }

我想合并所有字段并进行NLP。但是,我不确定使用 "SPACE" 作为分隔符来连接内容是否安全。

简而言之。是的。如果您清理输入,只剩下来自不同语言的字母和其他字符,那么 space 听起来像是一个合乎逻辑的答案。