如何在 bash 中使用正则表达式从字符串中删除标点符号
How to remove punctuation from a string with exceptions using regex in bash
使用命令 echo "Jiro. Inagaki' & Soul, Media_Breeze." | tr -d '[:punct:]'
打印字符串“Jiro Inagaki Soul MediaBreeze”。
但是,我想找到一个正则表达式,它将删除除下划线和 & 符号之外的所有标点符号,即我想要“Jiro Inagaki & Soul Media_Breeze”。
根据底部列出的来源中字符 class 减法的建议,我尝试将 [:punct:]
替换为以下内容:
[\p{P}\-[&_]]
[[:punct:]-[&_]]
(?![\&_])\p{P}
(?![\&_])[:punct:]
[[:punct:]-[&_]]
[[:punct:]&&[&_]]
[[:punct:]&&[^&_]]
...但到目前为止我还没有得到任何工作。任何帮助将不胜感激!
来源:
- Regex: Match any punctuation character except . and _
- https://www.rexegg.com/regex-quickstart.html
您可以指定要删除的标点符号,例如
>echo "Jiro. Inagaki' & Soul, Media_Breeze." | tr -d "[.,/\-\=\+\{\[\]\}\!\@\#$\%\^\*\'\\(\)]"
Jiro Inagaki & Soul Media_Breeze
或者,
>echo "Jiro. Inagaki' & Soul, Media_Breeze." | tr -dc '[:alnum:][ &_]'
Jiro Inagaki & Soul Media_Breeze
使用命令 echo "Jiro. Inagaki' & Soul, Media_Breeze." | tr -d '[:punct:]'
打印字符串“Jiro Inagaki Soul MediaBreeze”。
但是,我想找到一个正则表达式,它将删除除下划线和 & 符号之外的所有标点符号,即我想要“Jiro Inagaki & Soul Media_Breeze”。
根据底部列出的来源中字符 class 减法的建议,我尝试将 [:punct:]
替换为以下内容:
[\p{P}\-[&_]]
[[:punct:]-[&_]]
(?![\&_])\p{P}
(?![\&_])[:punct:]
[[:punct:]-[&_]]
[[:punct:]&&[&_]]
[[:punct:]&&[^&_]]
...但到目前为止我还没有得到任何工作。任何帮助将不胜感激!
来源:
- Regex: Match any punctuation character except . and _
- https://www.rexegg.com/regex-quickstart.html
您可以指定要删除的标点符号,例如
>echo "Jiro. Inagaki' & Soul, Media_Breeze." | tr -d "[.,/\-\=\+\{\[\]\}\!\@\#$\%\^\*\'\\(\)]"
Jiro Inagaki & Soul Media_Breeze
或者,
>echo "Jiro. Inagaki' & Soul, Media_Breeze." | tr -dc '[:alnum:][ &_]'
Jiro Inagaki & Soul Media_Breeze