PHP 简单 HTML DOM 解析一些页面问题

PHP Simple HTML DOM Parser some pages issue

我有一个代码可以读取表单中的所有输入。

该代码在我的演示页面和其他页面中有效,但在某些页面中无效。 对于示例问题:

脸书:

$url = 'https://www.facebook.com';

$html = file_get_html($url);
$post = $html->find('form[id=reg]'); //id for the register facebook page

print_r($post);

打印一个空数组。

函数示例:

$url = 'http://www.monografias.com/usuario/registro';

$html = file_get_html($url);

$post = $html->find('form[name=myform]');
print_r($post);

打印表单内容

simple_html_dom.php 包含一行限制它将解析的最大文件大小:

define('MAX_FILE_SIZE', 600000);

对于大于此大小的文件,file_get_html() 将只是 return false

Facebook 不会直接给你注册表单,只会回复基本的 html,其余的会用 javascript 创建。自己看看

$url = 'https://www.facebook.com';
$html = file_get_html($url);
echo htmlspecialchars($html);

他们发送给您的 html 中没有带有 "reg" ID 的表格。