file_get_contents 没有返回整个站点
file_get_contents not returning entire site
我一直在尝试使用 file_get_contents 检索网站 (https://www.programsgulf.com/) 的内容。不幸的是,生成的输出缺少许多元素(图像、格式、样式等...),并且基本上看起来与我要检索的原始页面完全不同。
以前从未发生过任何其他 URLs 我尝试使用相同的方法检索,但由于某种原因,这个特定的 URL (https://www.programsgulf.com/) 拒绝工作正确。
我使用的代码是:
<?php
$homepage = file_get_contents('https://www.programsgulf.com/');
echo $homepage;
?>
我错过了什么吗?将不胜感激有关如何使其正常工作的所有建议。谢谢大家的时间和考虑。
您不能只附和某人的 html 并期望它起作用。由于 same-origin policy violation unless the server has (mis)configured CORS 规则,无法加载资产(如脚本、图像或样式表)。这是每个现代浏览器中的保护层,您无法克服。
如果您真的希望它起作用,您必须在服务器端下载每个资产,将它们存储在本地并将代码中的链接替换为您的本地副本。这正是 web scraping/在线代理软件的工作原理。
我一直在尝试使用 file_get_contents 检索网站 (https://www.programsgulf.com/) 的内容。不幸的是,生成的输出缺少许多元素(图像、格式、样式等...),并且基本上看起来与我要检索的原始页面完全不同。
以前从未发生过任何其他 URLs 我尝试使用相同的方法检索,但由于某种原因,这个特定的 URL (https://www.programsgulf.com/) 拒绝工作正确。
我使用的代码是:
<?php
$homepage = file_get_contents('https://www.programsgulf.com/');
echo $homepage;
?>
我错过了什么吗?将不胜感激有关如何使其正常工作的所有建议。谢谢大家的时间和考虑。
您不能只附和某人的 html 并期望它起作用。由于 same-origin policy violation unless the server has (mis)configured CORS 规则,无法加载资产(如脚本、图像或样式表)。这是每个现代浏览器中的保护层,您无法克服。
如果您真的希望它起作用,您必须在服务器端下载每个资产,将它们存储在本地并将代码中的链接替换为您的本地副本。这正是 web scraping/在线代理软件的工作原理。