以编程方式控制 Chromium 实例的最可靠方法是什么?
What's the most reliable way to programmatically control a Chromium instance?
我正在研究以编程方式控制 Chrome/Chromium 实例的可靠方法,以利用其在 Node.js/C#/Java 应用程序中呈现网页的功能。总之,我想做的事情如下:
- Open/close 浏览器 window.
- 最小化、最大化浏览器window。
- 导航到某个 URL。
- 设置 cookie。
更清楚地说:我需要一个有头脑的浏览器来向最终用户显示网页。它可以嵌入到我的应用程序中,也可以是独立的浏览器(例如,单独运送的 Chromium 实例)。
我无法在 Chrome/Chromium 中找到有关我可以在 Node.js/C#/Java 环境中使用的任何 public API 的信息。可用于 Chrome 扩展的那些不适用于我的项目,因为我想从外部控制浏览器,例如 Selenium WebDriver。到目前为止,我发现以下方法可以按照我需要的方式控制浏览器:
- 使用 Puppeteer/WebDriver API。
- 使用 chrome-远程接口 NodeJS 库。
- 依赖 Chrome 嵌入式框架功能。
- 依靠Electron.js能力。
- 构建我自己的库,以某种方式包含 Chromium 模块作为依赖项(例如类似于 Electron 团队实现的)。
从最终利用 Chrome Devtools 协议的所有提到的库的角度来看,前两个选项是相似的。 CDP 成为 retired/deprecated 的风险对我们的项目来说是相当大的。另一个问题是 CDP 的目的是调试和测试自动化,而不是应用程序开发。此外,在用户机器上打开 Chrome 中的调试端口似乎很容易受到攻击。
CEF 和 Electron 路径让我担心,因为它依赖于嵌入式 Chromium 更新节奏。尽管 Electron 团队的目标是与 Chromium 的每个其他版本一起更新,但由于无法在发布带有安全补丁的新版本后立即更新 Chromium 版本,因此仍然存在安全问题。此外,如果我需要真正的浏览器体验(确实如此),我不会开箱即用,我将不得不自己实现浏览器功能,如按钮、选项卡地址栏等。
选项 #5 在实施中似乎极其复杂,因为它似乎需要团队在 Chromium 内部、C++ 开发和 C++ 构建工具方面的能力。
我在选项列表中遗漏了什么?我在假设中遗漏了什么吗?任何提示,想法,建议将不胜感激!
您的一些选项与控制浏览器(#1、#2)有关,而其他选项与嵌入浏览器(#3、#4)有关。这是两个不同的用例,您需要什么取决于您的目标。
控制浏览器
如果你想控制浏览器执行任务,甚至可能在后台执行而最终用户不会注意到,你应该选择选项 1 (puppeteer) 或 2 (chrome-remote-interface)。
我建议使用 puppeteer,因为这是由 Google Chrome 开发人员开发的库,它为您的用例提供了许多功能(打开浏览器 windows、导航、设置 cookie)。
我认为没有任何理由担心 Chrome DevTools 协议 很快就会被放弃。 Chrome DevTools 完全依赖这个协议。此外,Firefox(Mozilla 错误跟踪器:#1316741,#1523097) and Edge are already partly supporting the protocol making it even more unlikely to be abandoned in the future. (more information)
嵌入浏览器
如果您需要嵌入浏览器,这意味着您正试图在您的应用程序中显示浏览器,您应该关注选项 3(Chrome 嵌入式框架)或 4(Electron)。
Chrome 嵌入式框架 是一种更 low-level 的方法,可将单独的浏览器放入您的应用程序中。但是我不能在这里详细介绍,因为我自己从来没有使用过这个。
Electron另一方面是浏览器,这意味着整个应用程序是作为Web应用程序开发的。您可以将另一个浏览器 window (webview) 嵌入到您的浏览器中,您基本上可以控制它(类似于 puppeteer 可以做的)。
直接使用 Chromium 代码(选项 5)
虽然 Chromium 项目分为多个组件,但听起来您需要一个完整的浏览器。我曾经自己编译过 Chromium 源代码,这实际上需要几个小时。请记住,他的代码包含大约 3500 万行代码 (source)。即使您弄清楚要使用代码的哪些部分,与放弃 DevTools 协议相比,代码的某些 low-level 部分发生更改并破坏您的实现更为现实。所以,我绝对建议不要遵循这个想法。
备选方案
根据您的用例,您还可以查看 DOM 模拟库,例如 jsdom or cheerio。这些库的功能非常有限,您可能必须自己实现浏览器的某些部分,例如下载文档,读取和设置headers处理cookies等
总而言之,如果您想控制浏览器主要在后台执行任务,我建议您选择 puppeteer。如果您需要浏览器 window 作为应用程序的一部分,请选择 Electron。
我正在研究以编程方式控制 Chrome/Chromium 实例的可靠方法,以利用其在 Node.js/C#/Java 应用程序中呈现网页的功能。总之,我想做的事情如下:
- Open/close 浏览器 window.
- 最小化、最大化浏览器window。
- 导航到某个 URL。
- 设置 cookie。
更清楚地说:我需要一个有头脑的浏览器来向最终用户显示网页。它可以嵌入到我的应用程序中,也可以是独立的浏览器(例如,单独运送的 Chromium 实例)。
我无法在 Chrome/Chromium 中找到有关我可以在 Node.js/C#/Java 环境中使用的任何 public API 的信息。可用于 Chrome 扩展的那些不适用于我的项目,因为我想从外部控制浏览器,例如 Selenium WebDriver。到目前为止,我发现以下方法可以按照我需要的方式控制浏览器:
- 使用 Puppeteer/WebDriver API。
- 使用 chrome-远程接口 NodeJS 库。
- 依赖 Chrome 嵌入式框架功能。
- 依靠Electron.js能力。
- 构建我自己的库,以某种方式包含 Chromium 模块作为依赖项(例如类似于 Electron 团队实现的)。
从最终利用 Chrome Devtools 协议的所有提到的库的角度来看,前两个选项是相似的。 CDP 成为 retired/deprecated 的风险对我们的项目来说是相当大的。另一个问题是 CDP 的目的是调试和测试自动化,而不是应用程序开发。此外,在用户机器上打开 Chrome 中的调试端口似乎很容易受到攻击。
CEF 和 Electron 路径让我担心,因为它依赖于嵌入式 Chromium 更新节奏。尽管 Electron 团队的目标是与 Chromium 的每个其他版本一起更新,但由于无法在发布带有安全补丁的新版本后立即更新 Chromium 版本,因此仍然存在安全问题。此外,如果我需要真正的浏览器体验(确实如此),我不会开箱即用,我将不得不自己实现浏览器功能,如按钮、选项卡地址栏等。
选项 #5 在实施中似乎极其复杂,因为它似乎需要团队在 Chromium 内部、C++ 开发和 C++ 构建工具方面的能力。
我在选项列表中遗漏了什么?我在假设中遗漏了什么吗?任何提示,想法,建议将不胜感激!
您的一些选项与控制浏览器(#1、#2)有关,而其他选项与嵌入浏览器(#3、#4)有关。这是两个不同的用例,您需要什么取决于您的目标。
控制浏览器
如果你想控制浏览器执行任务,甚至可能在后台执行而最终用户不会注意到,你应该选择选项 1 (puppeteer) 或 2 (chrome-remote-interface)。
我建议使用 puppeteer,因为这是由 Google Chrome 开发人员开发的库,它为您的用例提供了许多功能(打开浏览器 windows、导航、设置 cookie)。
我认为没有任何理由担心 Chrome DevTools 协议 很快就会被放弃。 Chrome DevTools 完全依赖这个协议。此外,Firefox(Mozilla 错误跟踪器:#1316741,#1523097) and Edge are already partly supporting the protocol making it even more unlikely to be abandoned in the future. (more information)
嵌入浏览器
如果您需要嵌入浏览器,这意味着您正试图在您的应用程序中显示浏览器,您应该关注选项 3(Chrome 嵌入式框架)或 4(Electron)。
Chrome 嵌入式框架 是一种更 low-level 的方法,可将单独的浏览器放入您的应用程序中。但是我不能在这里详细介绍,因为我自己从来没有使用过这个。
Electron另一方面是浏览器,这意味着整个应用程序是作为Web应用程序开发的。您可以将另一个浏览器 window (webview) 嵌入到您的浏览器中,您基本上可以控制它(类似于 puppeteer 可以做的)。
直接使用 Chromium 代码(选项 5)
虽然 Chromium 项目分为多个组件,但听起来您需要一个完整的浏览器。我曾经自己编译过 Chromium 源代码,这实际上需要几个小时。请记住,他的代码包含大约 3500 万行代码 (source)。即使您弄清楚要使用代码的哪些部分,与放弃 DevTools 协议相比,代码的某些 low-level 部分发生更改并破坏您的实现更为现实。所以,我绝对建议不要遵循这个想法。
备选方案
根据您的用例,您还可以查看 DOM 模拟库,例如 jsdom or cheerio。这些库的功能非常有限,您可能必须自己实现浏览器的某些部分,例如下载文档,读取和设置headers处理cookies等
总而言之,如果您想控制浏览器主要在后台执行任务,我建议您选择 puppeteer。如果您需要浏览器 window 作为应用程序的一部分,请选择 Electron。