从另一个网站获取 ajax 个生成的内容

Get ajax generated content from another website

我有几个(媒体)网站首页的自动存档,用 php 编写。具体来说,我每天两次在 <body> 标签中复制 html,我有他们所有 css 和 js 文件的副本,所以我可以从过去的。现在,我遇到了其中一个网站的问题,因为它们通过 ajax 调用加载了主要的滑块内容(最重要的新闻)。我希望在解析数据之前执行此 ajax 调用,而不仅仅是空白 div。通过环顾四周,我发现他们使用了一个名为 lof-jslidernews2 的 wordpress 插件,但我找不到特定的 ajax 调用来查看 url 并发出 curl 请求.有什么想法可以实现吗?

网站:http://fokus.mk/

我的代码(由于 DomDocument 的一些问题和无效 html,必须像这样手动解析):

// ...
if($html = file_get_contents ($row['page_url'])) {
    $content = strstr($html, '<body');
    $content = str_before($content, '</body>') . '</body>';
    $filename = date('YmdHis') . $row['page_name'];
    if($success = file_put_contents ('app/webroot/files/' . $filename, $content)) {
    // ....

** 我的项目没有任何违法行为,我没有盗用内容,只是冻结首页以供以后比较。这个我咨询过律师。 :)

我不知道为什么,但真正解决我问题的人删除了他的答案。所以,这里是:

他建议使用模拟器,特别​​是 Mink。它很容易安装(使用作曲家)并且在第一次尝试时就完成了工作。很棒的图书馆。

Mink is an open source browser controller/emulator for web applications, written in PHP 5.3.