如何从亚马逊 "Look Inside the Book" 功能中提取高分辨率 png 图像？

Question

我一直在 Firefox 上使用调试器工具 Inspect 元素手动收集 google 本书和亚马逊的图书预览，在带有图像过滤器的“网络”选项卡下。这很乏味，所以如果可以的话我想自动化。

我找到了一个用 C 语言编写的方便工具 (getxbook)，它具有三个实用程序：一个用于 google，另一个用于亚马逊，第三个用于 barnes and noble。只有 google 实用程序似乎有效。

我正在尝试理解对亚马逊图片的请求 URL，以便我可以在 Node.js 中实现自动化。

这里是 URL 的高分辨率图书图片：

https://d1b14unh5d6w7g.cloudfront.net/1405193557.01.S00R.JUMBOXXX.jpg?Expires=1596719655&Signature=N69M9pndwI5lhb35vd2XNBC/DAxYpGKIqG+gvhHrY7icH3DxB+DZ8oOZT/pqLJbRiJeHVkBiOTWOqA7wpNctg4fa/MwnvLiZ8jBIOKEJsJ1jhT9Lma4KGCaUapyji3oqz0p/qf42OuGISoKeXjoCX9d9ghbKU1QiIPq6evaLypc=&Key-Pair-Id=APKAIUO27P366FGALUMQ

从 this page 可以看出，Amazon 正在使用 CloudFront 签名的 URLs 来保护交易。

首先是我理解的片段：

1405193557 是 ISBN10
S00R 为页码（本例为第 14 页），下一个为 S00S（第 15 页），依此类推
JUMBOXXX 提供高分辨率 (800x1205) [XXXXXXXX 提供低分辨率 (600x903)]
Key-Pair-Id: 所有页面都一样
过期：以秒为单位的时间增量
签名：172个字符，总是以'='结尾，好像是base64编码

我需要理解的部分还有：

签名：在加载的某个时刻，库 (sitb-library-js.js) 从服务器获取所有图像 url，并预先生成签名

我想要的是一种插入代码的方法，该代码在填充后打印 jumboImageUrls[] 列表。我不知道如何推进这个 - greasemonkey？

任何想法或经验表示赞赏。

Answer 1

A post 被制作成 https://www.amazon.ca/gp/search-inside/service-data 。响应包含带有签名的图像 URL 列表。

如何从亚马逊 "Look Inside the Book" 功能中提取高分辨率 png 图像？

How to extract hi-res png images from Amazon "Look Inside the Book" feature?

javascript

amazon