在抓取图像 src 上获取 base64 字符串
Getting base64 string on scraping image src
我正在从网站上抓取图片 src、标题、价格等,但它使用 base64 字符串代替图片 src。当我将所有这些抓取的数据附加到 uri 时,它显示错误的长 uri。如何减缓这个问题?
如果您将 base64 字符串作为 img 源,这听起来好像图像是内联编码的。
data: URIs are a very useful way to embed small items of data into a
URL—rather than link to an external resource, the URL contains the
actual encoded data.
An HTML fragment embedding a picture of small red dot:
<img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUA
AAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO
9TXL0Y4OHwAAAABJRU5ErkJggg==" alt="Red dot" />
在上面的示例中,如果您要对字符串进行 base64 解码(减去 data:image/png,base64,
部分),您将获得 PNG 图像的数据,您可以将其作为文件写入磁盘。
我正在从网站上抓取图片 src、标题、价格等,但它使用 base64 字符串代替图片 src。当我将所有这些抓取的数据附加到 uri 时,它显示错误的长 uri。如何减缓这个问题?
如果您将 base64 字符串作为 img 源,这听起来好像图像是内联编码的。
data: URIs are a very useful way to embed small items of data into a URL—rather than link to an external resource, the URL contains the actual encoded data.
An HTML fragment embedding a picture of small red dot:
<img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUA AAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO 9TXL0Y4OHwAAAABJRU5ErkJggg==" alt="Red dot" />
在上面的示例中,如果您要对字符串进行 base64 解码(减去 data:image/png,base64,
部分),您将获得 PNG 图像的数据,您可以将其作为文件写入磁盘。