在 ubuntu 终端中按短语剪切文件
Cut file by phrase in ubuntu terminal
我使用 wget 实用程序下载了一些网站页面,但是 html 页面包含太多不需要的信息。我希望文件之前只包含文本
</article>
标签。我怀疑可以使用 grep 命令来完成,但是我需要哪些参数?以及如何将这样的命令应用于目录中的所有文件?
这是脚本
for i in *.htm; do (cat $i | grep -i "</article>" -B 9999) > $i; done;
我使用 wget 实用程序下载了一些网站页面,但是 html 页面包含太多不需要的信息。我希望文件之前只包含文本
</article>
标签。我怀疑可以使用 grep 命令来完成,但是我需要哪些参数?以及如何将这样的命令应用于目录中的所有文件?
这是脚本
for i in *.htm; do (cat $i | grep -i "</article>" -B 9999) > $i; done;