使用 PHP 从网页获取 json 数据

Getting json data from a webpage using PHP

我正在尝试从 here (example url) 获取响应,首先,我认为我应该使用 file_get_contents()

当我尝试这样做时,出现以下错误:

Warning: file_get_contents(https://steamcommunity.com/market/pricehistory/?country=US&currency=1&appid=730&market_hash_name=SG%20553%20|%20Damascus%20Steel%20(Factory%20New)): failed to open stream: HTTP request failed! HTTP/1.0 400 Bad Request

我知道这是因为它正在将 & 转换为 &。我已经尝试了很多方法来解决这个问题,但是他们都失败了,在快速 google 之后我得出的结论是 file_get_contents() 自动将 & 转换为 &

我的下一步是尝试 curl。我首先尝试了以下代码:

// Get cURL resource
$curl = curl_init();
// Set some options - we are passing in a useragent too here
curl_setopt_array($curl, array(
   CURLOPT_RETURNTRANSFER => 1,
   CURLOPT_URL => 'http://steamcommunity.com/market/pricehistory/?country=US&currency=1&appid=730&market_hash_name='.$hash,
   CURLOPT_USERAGENT => 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/532.2 (KHTML, like Gecko) ChromePlus/4.0.222.3 Chrome/4.0.222.3 Safari/532.2'
));
// Send the request & save response to $resp
$resp = curl_exec($curl);
// Close request to clear up some resources
curl_close($curl);

但这返回了 ‹ŠŽÿÿ)»L 作为响应。我想知道这是否与 json 编码有关,所以我尝试将其放入 json_decode() 但它没有用。

接下来,我尝试了:

// Get cURL resource
$curl = curl_init();
// Set some options - we are passing in a useragent too here
curl_setopt_array($curl, array(
    CURLOPT_RETURNTRANSFER => 1,
    CURLOPT_URL => 'http://steamcommunity.com/market/pricehistory/',
    CURLOPT_USERAGENT => 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/532.2 (KHTML, like Gecko) ChromePlus/4.0.222.3 Chrome/4.0.222.3 Safari/532.2',
    CURLOPT_POST => 1,
    CURLOPT_POSTFIELDS => array(
        country => "US",
        currency => 1,
        appid => 730,
        market_hash_name => "SG%20553%20|%20Damascus%20Steel%20(Factory%20New)"
    )
));
// Send the request & save response to $resp
$resp = curl_exec($curl);
// Close request to clear up some resources
curl_close($curl);

但又得到了回应‹ŠŽÿÿ)»L

这个响应是什么意思,我可以解析它吗?如果没有,我应该如何正确获取这些数据?此外,为什么 file_get_contents() 不起作用?

我很确定这会发生,因为您需要某种类型的访问令牌才能访问 Steam 网络 API。

参见 this answer SO。

从本质上讲,Steam 正在返回状态为“400 Bad Request”的错误。但是,通过这样做可以忽略此错误:

<?php
    $url = "https://steamcommunity.com/market/pricehistory/?country=US&currency=1&appid=730&market_hash_name=SG%20553%20%7C%20Damascus%20Steel%20(Factory%20New)";
    $context = stream_context_create(array(
      'http' => array(
          'ignore_errors'=>true,
          'method'=>'GET'
          // for more options check http://www.php.net/manual/en/context.http.php
        )
    ));
    $response = file_get_contents($url, false, $context);
    echo $response; // returns "[]"
?>

确保你在 SO 上查看 this answer

可能是您的响应是 gzip,请尝试使用 CURLOPT_ENCODING。

curl_setopt($curl ,CURLOPT_ENCODING, '')

如果您使用 https,请不要忘记禁用 CURLOPT_SSL_VERIFYPEER。

curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false)

有一件事,如果我用我的浏览器跟随你的 link 并打开我的调试控制台。 我看到您的请求有一个 400 状态代码(错误请求)。

我不能说你的 enpoint,但你可以通过使用 urlencode():

来解决你的 Bad Request 错误
$url = urlencode('https://steamcommunity.com/market/pricehistory/?country=US&currency=1&appid=730&market_hash_name=SG%20553%20%7C%20Damascus%20Steel%20(Factory%20New))'
file_get_contencts($url);