使用 Curl 下载 HTML 进行解析的问题

Question

我一直在尝试从 TikTok 下载一些信息来绘制一些信息，例如观看次数和点赞等等。

我检查了在 CMD 终端中使用 curl 会收到哪些信息，信息如下：

mycurl> curl -k https://www.tiktok.com/@liamferrari/video/6816604410496519429

我收到以下输出：

{"statusCode":200,"contentType":"application/json","content":""}

然而，当我在几乎任何其他网页上使用 curl 时，我都会收到完整的 HTML 代码，正如我所期望的那样。

我没有收到来自网页的 HTML 代码是否有明显的原因？当我打开 Web 控制台时，我能够看到我尝试使用 curl 访问的 HTML 信息。

如果有人能提供任何见解，那就太好了。

此致

后卫

Answer 1

看来 TikTok 需要指定用户代理（此处使用 Firefox），

curl -A "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:59.0) Gecko/20100101 Firefox/59.0" -k https://www.tiktok.com/@liamferrari/video/681660441049651

请注意，他们最有可能对此进行过滤以减少抓取，这样做可能违反他们的最终用户许可协议。

Issue using Curl to download HTML for parsing