如何从 "lynx --dump -listonly" 中删除编号
How to remove numbering from "lynx --dump -listonly"
$ lynx --dump -listonly index.html
示例结果:
References
Visible links
1. http://lynx.invisible-island.net/
2. http://lynx.invisible-island.net/lynx.html
3. http://lynx.invisible-island.net/current/index.html
我想要做的是删除 1. 2. 和 3. "References" 和 "Visible Links" 包含的文本。
想要的结果:
http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html
http://lynx.invisible-island.net/current/index.html
尝试:
lynx --dump -listonly index.html | sed -r 's/^[0-9]+\. //'
我有这个输入,每行顶部有空格:
1. http://lynx.invisible-island.net/
2. http://lynx.invisible-island.net/lynx.html
然后,通过抑制第 1 行到第 3 行:
lynx --dump -listonly http://lynx.invisible-island.net/ | sed -E 's/^ ?+[0-9]+\. //; 1,3d'
输出
http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html
您可以使用 Lynx
的 -nonumbers 选项
lynx --dump -nonumbers -listonly http://lynx.invisible-island.net/
$ lynx --dump -listonly index.html
示例结果:
References
Visible links
1. http://lynx.invisible-island.net/
2. http://lynx.invisible-island.net/lynx.html
3. http://lynx.invisible-island.net/current/index.html
我想要做的是删除 1. 2. 和 3. "References" 和 "Visible Links" 包含的文本。
想要的结果:
http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html
http://lynx.invisible-island.net/current/index.html
尝试:
lynx --dump -listonly index.html | sed -r 's/^[0-9]+\. //'
我有这个输入,每行顶部有空格:
1. http://lynx.invisible-island.net/
2. http://lynx.invisible-island.net/lynx.html
然后,通过抑制第 1 行到第 3 行:
lynx --dump -listonly http://lynx.invisible-island.net/ | sed -E 's/^ ?+[0-9]+\. //; 1,3d'
输出
http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html
您可以使用 Lynx
的 -nonumbers 选项lynx --dump -nonumbers -listonly http://lynx.invisible-island.net/