在 R 中删除表情符号

Removing emojis in R

我正在尝试从 R 中的客户评论数据中删除表情符号。 表情符号以这种格式出现 .

例如,评论在数据集中是这样显示的:“这令人兴奋!”我想删除

我试过 gsub 和 iconv 但没有用。

非常感谢您提供的任何帮助。

这在一定程度上取决于您的字符串的外观。

对于您的情况,使用普通正则表达式可能有效。将表情符号替换为 space 可能比仅将其删除更可取,否则您可能会面临将两个词合并为一个词的风险。

stringr::str_replace_all(string = "It's mind-blowing! <U+0001F603>",
                         pattern = '<U.*>',
                         replacement = " ")

您可能想要添加 stringr::str_squish() 以删除多余的 spaces。