PHP 简单 HTML DOM 解析一些页面问题

Question

我有一个代码可以读取表单中的所有输入。

该代码在我的演示页面和其他页面中有效，但在某些页面中无效。对于示例问题：

脸书：

$url = 'https://www.facebook.com';

$html = file_get_html($url);
$post = $html->find('form[id=reg]'); //id for the register facebook page

print_r($post);

打印一个空数组。

函数示例：

$url = 'http://www.monografias.com/usuario/registro';

$html = file_get_html($url);

$post = $html->find('form[name=myform]');
print_r($post);

打印表单内容

Answer 1

simple_html_dom.php 包含一行限制它将解析的最大文件大小：

define('MAX_FILE_SIZE', 600000);

对于大于此大小的文件，file_get_html() 将只是 return false。

Answer 2

Facebook 不会直接给你注册表单，只会回复基本的 html，其余的会用 javascript 创建。自己看看

$url = 'https://www.facebook.com';
$html = file_get_html($url);
echo htmlspecialchars($html);

他们发送给您的 html 中没有带有 "reg" ID 的表格。

PHP 简单 HTML DOM 解析一些页面问题

PHP Simple HTML DOM Parser some pages issue

php

simple-html-dom