如何从选项卡中获取图标(而不是从网站内容中获取)

how to grab icon from the tab (not from the website content)

当您打开大多数网站时,选项卡的左侧会出现一个小图标(右侧是名称)。例如网站:http://www.prairieventures.net/ 你可以看到小图标 这里:https://i.stack.imgur.com/OQoSn.png.有没有自动抓取的方法?

我知道如何使用漂亮的汤,也尝试过 api 像 favicon 和 clearbit 但是对于这个特定的网站(和许多其他网站)它 returns 错误的图片(带字段的大图片)作为与我之后的选项卡上的小图标相反。 Clearbit 更加厚颜无耻,将大图像缩小,使其看起来像一个图标。检查元素从 Web 内容中抓取内容,但由于我想要的通常不存在(因为它在选项卡上),我不知道如何抓取它。有人可以给我任何帮助吗?理想情况下 python 但很高兴开阔我的视野。

我认为您的意思是网站图标,它是浏览器选项卡中网页标题旁边显示的 16x16 像素的小图像。在许多网站上,您只需在网址末尾附加 favicon.ico 即可访问它,例如:

http://www.prairieventures.net/favicon.ico

如果您需要抓取它,您可以在页面html中查找以下行:

<link rel="Shortcut Icon" href="http://www.prairieventures.net/wp-content/themes/pv/images/favicon.ico" type="image/x-icon" />

这还会显示图像文件在网站上的位置。

有关使用 beautiful soup 和 python 抓取网站图标的讨论,请参阅:

How to get favicon by using beautiful soup and python

我没有足够的声誉来回复您的评论,所以在这里发帖。

我认为你没有理解我的回答。当我说“favicon”时,我不是指 favicon api,favicon 是您要抓取的小图像的名称,请参阅:

https://en.wikipedia.org/wiki/Favicon

如果你想获取图片的完整路径,你可以搜索我在之前回复中提到的那一行,并提取 href 标签的内容。

如果您需要进一步的帮助,您需要提供更多关于您正在尝试做什么的详细信息。