如何从亚马逊 "Look Inside the Book" 功能中提取高分辨率 png 图像?
How to extract hi-res png images from Amazon "Look Inside the Book" feature?
我一直在 Firefox 上使用调试器工具 Inspect 元素手动收集 google 本书和亚马逊的图书预览,在带有图像过滤器的“网络”选项卡下。这很乏味,所以如果可以的话我想自动化。
我找到了一个用 C 语言编写的方便工具 (getxbook),它具有三个实用程序:一个用于 google,另一个用于亚马逊,第三个用于 barnes and noble。只有 google 实用程序似乎有效。
我正在尝试理解对亚马逊图片的请求 URL,以便我可以在 Node.js 中实现自动化。
这里是 URL 的高分辨率图书图片:
https://d1b14unh5d6w7g.cloudfront.net/1405193557.01.S00R.JUMBOXXX.jpg?Expires=1596719655&Signature=N69M9pndwI5lhb35vd2XNBC/DAxYpGKIqG+gvhHrY7icH3DxB+DZ8oOZT/pqLJbRiJeHVkBiOTWOqA7wpNctg4fa/MwnvLiZ8jBIOKEJsJ1jhT9Lma4KGCaUapyji3oqz0p/qf42OuGISoKeXjoCX9d9ghbKU1QiIPq6evaLypc=&Key-Pair-Id=APKAIUO27P366FGALUMQ
从 this page 可以看出,Amazon 正在使用 CloudFront 签名的 URLs 来保护交易。
首先是我理解的片段:
- 1405193557 是 ISBN10
- S00R 为页码(本例为第 14 页),下一个为 S00S(第 15 页),依此类推
- JUMBOXXX 提供高分辨率 (800x1205) [XXXXXXXX 提供低分辨率 (600x903)]
- Key-Pair-Id: 所有页面都一样
- 过期:以秒为单位的时间增量
- 签名:172个字符,总是以'='结尾,好像是base64编码
我需要理解的部分还有:
- 签名:在加载的某个时刻,库 (sitb-library-js.js) 从服务器获取所有图像 url,并预先生成签名
我想要的是一种插入代码的方法,该代码在填充后打印 jumboImageUrls[] 列表。我不知道如何推进这个 - greasemonkey?
任何想法或经验表示赞赏。
A post 被制作成 https://www.amazon.ca/gp/search-inside/service-data 。响应包含带有签名的图像 URL 列表。
我一直在 Firefox 上使用调试器工具 Inspect 元素手动收集 google 本书和亚马逊的图书预览,在带有图像过滤器的“网络”选项卡下。这很乏味,所以如果可以的话我想自动化。
我找到了一个用 C 语言编写的方便工具 (getxbook),它具有三个实用程序:一个用于 google,另一个用于亚马逊,第三个用于 barnes and noble。只有 google 实用程序似乎有效。
我正在尝试理解对亚马逊图片的请求 URL,以便我可以在 Node.js 中实现自动化。
这里是 URL 的高分辨率图书图片:
https://d1b14unh5d6w7g.cloudfront.net/1405193557.01.S00R.JUMBOXXX.jpg?Expires=1596719655&Signature=N69M9pndwI5lhb35vd2XNBC/DAxYpGKIqG+gvhHrY7icH3DxB+DZ8oOZT/pqLJbRiJeHVkBiOTWOqA7wpNctg4fa/MwnvLiZ8jBIOKEJsJ1jhT9Lma4KGCaUapyji3oqz0p/qf42OuGISoKeXjoCX9d9ghbKU1QiIPq6evaLypc=&Key-Pair-Id=APKAIUO27P366FGALUMQ
从 this page 可以看出,Amazon 正在使用 CloudFront 签名的 URLs 来保护交易。
首先是我理解的片段:
- 1405193557 是 ISBN10
- S00R 为页码(本例为第 14 页),下一个为 S00S(第 15 页),依此类推
- JUMBOXXX 提供高分辨率 (800x1205) [XXXXXXXX 提供低分辨率 (600x903)]
- Key-Pair-Id: 所有页面都一样
- 过期:以秒为单位的时间增量
- 签名:172个字符,总是以'='结尾,好像是base64编码
我需要理解的部分还有:
- 签名:在加载的某个时刻,库 (sitb-library-js.js) 从服务器获取所有图像 url,并预先生成签名
我想要的是一种插入代码的方法,该代码在填充后打印 jumboImageUrls[] 列表。我不知道如何推进这个 - greasemonkey?
任何想法或经验表示赞赏。
A post 被制作成 https://www.amazon.ca/gp/search-inside/service-data 。响应包含带有签名的图像 URL 列表。