使用 Curl 下载 HTML 进行解析的问题

Issue using Curl to download HTML for parsing

我一直在尝试从 TikTok 下载一些信息来绘制一些信息,例如观看次数和点赞等等。

我检查了在 CMD 终端中使用 curl 会收到哪些信息,信息如下:

mycurl> curl -k https://www.tiktok.com/@liamferrari/video/6816604410496519429

我收到以下输出:

{"statusCode":200,"contentType":"application/json","content":""}

然而,当我在几乎任何其他网页上使用 curl 时,我都会收到完整的 HTML 代码,正如我所期望的那样。

我没有收到来自网页的 HTML 代码是否有明显的原因?当我打开 Web 控制台时,我能够看到我尝试使用 curl 访问的 HTML 信息。

如果有人能提供任何见解,那就太好了。

此致

后卫

看来 TikTok 需要指定用户代理(此处使用 Firefox),

curl -A "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:59.0) Gecko/20100101 Firefox/59.0" -k https://www.tiktok.com/@liamferrari/video/681660441049651

请注意,他们最有可能对此进行过滤以减少抓取,这样做可能违反他们的最终用户许可协议。