file_get_contents 没有返回整个站点

Question

我一直在尝试使用 file_get_contents 检索网站 (https://www.programsgulf.com/) 的内容。不幸的是，生成的输出缺少许多元素（图像、格式、样式等...），并且基本上看起来与我要检索的原始页面完全不同。

以前从未发生过任何其他 URLs 我尝试使用相同的方法检索，但由于某种原因，这个特定的 URL (https://www.programsgulf.com/) 拒绝工作正确。

我使用的代码是：

<?php
$homepage = file_get_contents('https://www.programsgulf.com/');
echo $homepage;
?>

我错过了什么吗？将不胜感激有关如何使其正常工作的所有建议。谢谢大家的时间和考虑。

Answer 1

您不能只附和某人的 html 并期望它起作用。由于 same-origin policy violation unless the server has (mis)configured CORS 规则，无法加载资产（如脚本、图像或样式表）。这是每个现代浏览器中的保护层，您无法克服。

如果您真的希望它起作用，您必须在服务器端下载每个资产，将它们存储在本地并将代码中的链接替换为您的本地副本。这正是 web scraping/在线代理软件的工作原理。

file_get_contents not returning entire site