如何使用 Google Cloud Functions 和 puppeteer 在 Google Cloud Bucket 中保存屏幕截图?

How to save a screenshot in a Google Cloud Bucket using Google Cloud Functions and puppeteer?

我直接上题:

我正在尝试使用 Google Cloud Functions 保存人偶截图。

当我查看屏幕截图时,我只看到一个小方块。 当使用 Base64 编码时,我只得到纯白色 space 作为图像。

我错过了什么吗?我必须使用像“busboy”这样的额外包吗?

代码如下:

/**
 * Responds to any HTTP request.
 *
 * @param {!express:Request} req HTTP request context.
 * @param {!express:Response} res HTTP response context.
 */

const moment = require('moment');
const puppeteer = require('puppeteer');
const { Storage } = require('@google-cloud/storage');
const storage = new Storage();



exports.helloWorld = async (req, res) => {
  const PUPPETEER_OPTIONS = {
    headless: true,
    slowMo: 500,
    args: [
      '--disable-dev-shm-usage',
      '--disable-setuid-sandbox',
      '--no-first-run',
      '--no-sandbox',
    ],
  };

  const bucketName = "imageBucket";
  const timeNow = new moment();
  console.log(timeNow);
  const browser = await puppeteer.launch(PUPPETEER_OPTIONS);
  const page = await browser.newPage();
  await page.goto(
    'https://www.example.com'
  );

  await page.setRequestInterception(true);
  page.on('request', (interceptedRequest) => {
    if (
      interceptedRequest.url().startsWith('https://www.google-analytics.com/')
    ) {
      const resource = interceptedRequest.url().toString();
      console.log(resource + ' blocked from loading.');
      interceptedRequest.abort();
    } else {
      interceptedRequest.continue();
    }
  });

  try {
    const searchTest = await page.$eval(
      'SELECTOR',
      (element) => {
        return element.innerHTML;
      }
    );

    await page.click('COOKIE ACCEPT SELECTOR');

    if (searchTest) {
    const screenshot = await page.screenshot({
        path: `/screenshot.png`,
    });
    const bucket = storage.bucket(bucketName);
    const file = bucket.file('puppeteer_screenshots/screenshot_XXXXX.png');
        await file.save(screenshot, {
        metadata: { contentType: 'image/png' },
    });
    await browser.close();
    res.status(200).end()

    } else {
      await browser.close();
      console.log('not found');
      res.end();
    }
  } catch (error) {

    console.log(error);

    res.status(404).end();
  }
}

Puppeteer 需要无头 Chorium 安装才能工作。您无法使用 Cloud Function 自定义运行时环境。

为此,我建议您使用 Cloud Run,您可以在其中自定义您的容器,从而自定义您的运行时环境。

从函数迁移到云非常容易运行。创建一个网络服务器(如 express)并将 hello_world 函数添加到“/”路径。就这样!!对于 dockerfile,您在文档的入门部分有一个示例。