在抓取图像 src 上获取 base64 字符串

Getting base64 string on scraping image src

我正在从网站上抓取图片 src、标题、价格等,但它使用 base64 字符串代替图片 src。当我将所有这些抓取的数据附加到 uri 时,它显示错误的长 uri。如何减缓这个问题?

如果您将 base64 字符串作为 img 源,这听起来好像图像是内联编码的。

data: URIs are a very useful way to embed small items of data into a URL—rather than link to an external resource, the URL contains the actual encoded data.

An HTML fragment embedding a picture of small red dot:

<img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUA
AAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO
9TXL0Y4OHwAAAABJRU5ErkJggg==" alt="Red dot" />

在上面的示例中,如果您要对字符串进行 base64 解码(减去 data:image/png,base64, 部分),您将获得 PNG 图像的数据,您可以将其作为文件写入磁盘。