使用 Curl 下载 HTML 进行解析的问题
Issue using Curl to download HTML for parsing
我一直在尝试从 TikTok 下载一些信息来绘制一些信息,例如观看次数和点赞等等。
我检查了在 CMD 终端中使用 curl 会收到哪些信息,信息如下:
mycurl> curl -k https://www.tiktok.com/@liamferrari/video/6816604410496519429
我收到以下输出:
{"statusCode":200,"contentType":"application/json","content":""}
然而,当我在几乎任何其他网页上使用 curl 时,我都会收到完整的 HTML 代码,正如我所期望的那样。
我没有收到来自网页的 HTML 代码是否有明显的原因?当我打开 Web 控制台时,我能够看到我尝试使用 curl 访问的 HTML 信息。
如果有人能提供任何见解,那就太好了。
此致
后卫
看来 TikTok 需要指定用户代理(此处使用 Firefox),
curl -A "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:59.0) Gecko/20100101 Firefox/59.0" -k https://www.tiktok.com/@liamferrari/video/681660441049651
请注意,他们最有可能对此进行过滤以减少抓取,这样做可能违反他们的最终用户许可协议。
我一直在尝试从 TikTok 下载一些信息来绘制一些信息,例如观看次数和点赞等等。
我检查了在 CMD 终端中使用 curl 会收到哪些信息,信息如下:
mycurl> curl -k https://www.tiktok.com/@liamferrari/video/6816604410496519429
我收到以下输出:
{"statusCode":200,"contentType":"application/json","content":""}
然而,当我在几乎任何其他网页上使用 curl 时,我都会收到完整的 HTML 代码,正如我所期望的那样。
我没有收到来自网页的 HTML 代码是否有明显的原因?当我打开 Web 控制台时,我能够看到我尝试使用 curl 访问的 HTML 信息。
如果有人能提供任何见解,那就太好了。
此致
后卫
看来 TikTok 需要指定用户代理(此处使用 Firefox),
curl -A "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:59.0) Gecko/20100101 Firefox/59.0" -k https://www.tiktok.com/@liamferrari/video/681660441049651
请注意,他们最有可能对此进行过滤以减少抓取,这样做可能违反他们的最终用户许可协议。