如何使用 Google Cloud Functions 和 puppeteer 在 Google Cloud Bucket 中保存屏幕截图?
How to save a screenshot in a Google Cloud Bucket using Google Cloud Functions and puppeteer?
我直接上题:
我正在尝试使用 Google Cloud Functions 保存人偶截图。
当我查看屏幕截图时,我只看到一个小方块。
当使用 Base64 编码时,我只得到纯白色 space 作为图像。
我错过了什么吗?我必须使用像“busboy”这样的额外包吗?
代码如下:
/**
* Responds to any HTTP request.
*
* @param {!express:Request} req HTTP request context.
* @param {!express:Response} res HTTP response context.
*/
const moment = require('moment');
const puppeteer = require('puppeteer');
const { Storage } = require('@google-cloud/storage');
const storage = new Storage();
exports.helloWorld = async (req, res) => {
const PUPPETEER_OPTIONS = {
headless: true,
slowMo: 500,
args: [
'--disable-dev-shm-usage',
'--disable-setuid-sandbox',
'--no-first-run',
'--no-sandbox',
],
};
const bucketName = "imageBucket";
const timeNow = new moment();
console.log(timeNow);
const browser = await puppeteer.launch(PUPPETEER_OPTIONS);
const page = await browser.newPage();
await page.goto(
'https://www.example.com'
);
await page.setRequestInterception(true);
page.on('request', (interceptedRequest) => {
if (
interceptedRequest.url().startsWith('https://www.google-analytics.com/')
) {
const resource = interceptedRequest.url().toString();
console.log(resource + ' blocked from loading.');
interceptedRequest.abort();
} else {
interceptedRequest.continue();
}
});
try {
const searchTest = await page.$eval(
'SELECTOR',
(element) => {
return element.innerHTML;
}
);
await page.click('COOKIE ACCEPT SELECTOR');
if (searchTest) {
const screenshot = await page.screenshot({
path: `/screenshot.png`,
});
const bucket = storage.bucket(bucketName);
const file = bucket.file('puppeteer_screenshots/screenshot_XXXXX.png');
await file.save(screenshot, {
metadata: { contentType: 'image/png' },
});
await browser.close();
res.status(200).end()
} else {
await browser.close();
console.log('not found');
res.end();
}
} catch (error) {
console.log(error);
res.status(404).end();
}
}
Puppeteer 需要无头 Chorium 安装才能工作。您无法使用 Cloud Function 自定义运行时环境。
为此,我建议您使用 Cloud Run,您可以在其中自定义您的容器,从而自定义您的运行时环境。
从函数迁移到云非常容易运行。创建一个网络服务器(如 express)并将 hello_world 函数添加到“/”路径。就这样!!对于 dockerfile,您在文档的入门部分有一个示例。
我直接上题:
我正在尝试使用 Google Cloud Functions 保存人偶截图。
当我查看屏幕截图时,我只看到一个小方块。 当使用 Base64 编码时,我只得到纯白色 space 作为图像。
我错过了什么吗?我必须使用像“busboy”这样的额外包吗?
代码如下:
/**
* Responds to any HTTP request.
*
* @param {!express:Request} req HTTP request context.
* @param {!express:Response} res HTTP response context.
*/
const moment = require('moment');
const puppeteer = require('puppeteer');
const { Storage } = require('@google-cloud/storage');
const storage = new Storage();
exports.helloWorld = async (req, res) => {
const PUPPETEER_OPTIONS = {
headless: true,
slowMo: 500,
args: [
'--disable-dev-shm-usage',
'--disable-setuid-sandbox',
'--no-first-run',
'--no-sandbox',
],
};
const bucketName = "imageBucket";
const timeNow = new moment();
console.log(timeNow);
const browser = await puppeteer.launch(PUPPETEER_OPTIONS);
const page = await browser.newPage();
await page.goto(
'https://www.example.com'
);
await page.setRequestInterception(true);
page.on('request', (interceptedRequest) => {
if (
interceptedRequest.url().startsWith('https://www.google-analytics.com/')
) {
const resource = interceptedRequest.url().toString();
console.log(resource + ' blocked from loading.');
interceptedRequest.abort();
} else {
interceptedRequest.continue();
}
});
try {
const searchTest = await page.$eval(
'SELECTOR',
(element) => {
return element.innerHTML;
}
);
await page.click('COOKIE ACCEPT SELECTOR');
if (searchTest) {
const screenshot = await page.screenshot({
path: `/screenshot.png`,
});
const bucket = storage.bucket(bucketName);
const file = bucket.file('puppeteer_screenshots/screenshot_XXXXX.png');
await file.save(screenshot, {
metadata: { contentType: 'image/png' },
});
await browser.close();
res.status(200).end()
} else {
await browser.close();
console.log('not found');
res.end();
}
} catch (error) {
console.log(error);
res.status(404).end();
}
}
Puppeteer 需要无头 Chorium 安装才能工作。您无法使用 Cloud Function 自定义运行时环境。
为此,我建议您使用 Cloud Run,您可以在其中自定义您的容器,从而自定义您的运行时环境。
从函数迁移到云非常容易运行。创建一个网络服务器(如 express)并将 hello_world 函数添加到“/”路径。就这样!!对于 dockerfile,您在文档的入门部分有一个示例。