PHP:: 更干净的 preg_match_all 结果

PHP:: Cleaner preg_match_all results

我正在尝试从外部 html 页面获取值。

现在这对我来说很神奇:

preg_match_all('/id="localWeather">(.*?)<\/div>/',$returnedPage,$returnValues,PREG_SET_ORDER);

但是在这一行之后我需要循环结果并清理它。

为什么?因为我只需要这个 (.*?) 并且出于某种原因它 return 还添加了额外的 </div> 结束标记所以我需要循环它并在之后清理数组。

我的问题是如何强制 return 只有这个:(.*?) ?

去掉PREG_SET_ORDER。示例:

<?php

$returnedPage = '<div id="localWeather">test</div><div id="localWeather">test2</div>';

preg_match_all('/id="localWeather">(.*?)<\/div>/',$returnedPage,$returnValues);

print_r($returnValues);

输出:

Array
(
    [0] => Array
        (
            [0] => id="localWeather">test</div>
            [1] => id="localWeather">test2</div>
        )

    [1] => Array
        (
            [0] => test
            [1] => test2
        )

)

所以在这种情况下,$returnValues[1] 是一个匹配数组,仅包含 div 之间的内容(而不是结束 div),而 $returnValues[0] 是与您的正则表达式匹配的整个字符串部分的数组。

此外,不建议使用正则表达式来解析 HTML。我会看看 PHP 的 DOMDocument class,它更强大。