PHP - 获取 html 页面结构

PHP - get html page structure

我正在寻找使用PHP.[=12 获取HTML 页面结构 的方法=]

我想要实现的是能够检查页面结构是否已更改(不是 内容)。

例如,我希望能够知道何时从内容经常变化的页面添加(或删除)新功能。如果添加或删除了某个功能,结构也会发生变化。

这样做的好方法是什么?使用 DOMDocument、Xpath 或您能想到的任何其他方法?

我尝试过使用 DOMDocument 但这是一项非常困难的任务吗...

想法?

我建议使用 selenium/jquery 和 xpath 来计算 div 或 body-html 中的元素数量,并检查数量是否发生变化。

我能想到的最简单的方法是使用文档的 file_get_contents() 并将其存储在数据库中,然后有一个 cron 每天检查或任何适合您的时间间隔并重新检索内容再次检查存储在数据库中的数据,看它们是否匹配。