尝试使用 apify web-scraper actor 抓取页面标题时出现错误 403

Error 403 when trying to scrape a pages title using apify web-scraper actor

我正在尝试使用 apify 获取网站标题,但是当我 运行 代码时出现错误 403,有人知道修复方法吗?

我的代码:

currentLink = "https://medium.com/vice/scientists-monitored-631-people-as-they-died-this-is-what-they-found-2de48ad9ed96";

const postUrl = "https://api.apify.com/v2/actor-tasks/LdLPzP6nopWgexrqX/run-sync-get-dataset-items?token=" + token;

var values = {
    contentType: "application/json",
    "startUrls": [{
        "url": currentLink,
    }]
};

$.ajax({
    url: postUrl,
    method: 'POST',
    dataType: 'json',
    data: JSON.stringify(values),
    success: function(response) {
        console.log(response.data); // Actor run object
        getItemsFromDataset(response.data.defaultDatasetId);
    }

});

这是我的错误: 加载资源失败:服务器响应状态为 403() 附上显示正确结果的 link。

您正在使用 run-sync-get-dataset-items 端点,即 returns 数据集(并且仅是数据集,即项目数组,而不是 运行 对象)。然后您尝试获取这些项目,假设您提供 defaultDatasetId,在本例中为 undefined。最后,你会得到一个错误。这也可以解释为什么您通过 link.

看到这些项目

不确定为什么是错误 403 而不是 404,但我没有看到 getItemsFromDataset() 的实现。请先检查以上内容好吗?