在 R 中删除表情符号
Removing emojis in R
我正在尝试从 R 中的客户评论数据中删除表情符号。
表情符号以这种格式出现 .
例如,评论在数据集中是这样显示的:“这令人兴奋!”我想删除 。
我试过 gsub 和 iconv 但没有用。
非常感谢您提供的任何帮助。
这在一定程度上取决于您的字符串的外观。
对于您的情况,使用普通正则表达式可能有效。将表情符号替换为 space 可能比仅将其删除更可取,否则您可能会面临将两个词合并为一个词的风险。
stringr::str_replace_all(string = "It's mind-blowing! <U+0001F603>",
pattern = '<U.*>',
replacement = " ")
您可能想要添加 stringr::str_squish()
以删除多余的 spaces。
我正在尝试从 R 中的客户评论数据中删除表情符号。 表情符号以这种格式出现 .
例如,评论在数据集中是这样显示的:“这令人兴奋!”我想删除 。
我试过 gsub 和 iconv 但没有用。
非常感谢您提供的任何帮助。
这在一定程度上取决于您的字符串的外观。
对于您的情况,使用普通正则表达式可能有效。将表情符号替换为 space 可能比仅将其删除更可取,否则您可能会面临将两个词合并为一个词的风险。
stringr::str_replace_all(string = "It's mind-blowing! <U+0001F603>",
pattern = '<U.*>',
replacement = " ")
您可能想要添加 stringr::str_squish()
以删除多余的 spaces。