Typo3 9.5:使用前端登录抓取页面

Typo3 9.5: Crawl pages with front end login

我承担了基于Typo3 v9.5.23的内网工作。他们使用 indexed_search v9.5.23 和爬虫 v9.1.5 来抓取页面,但在数据库 table tx_crawler_queueresult_data 列中,我得到 {"content":"\"403 Access denied\""}每页。

要查看您必须以前端用户身份登录的页面。我需要做什么才能抓取这些页面?

我正在通过以下命令使用控制台:

vendor/bin/typo3 crawler:flushQueue all
vendor/bin/typo3 crawler:buildQueue 69 intranet --depth=2
vendor/bin/typo3 crawler:processQueue

crawler config 中找到一个字段 Crawl with FE user groups

由于任何 FE 登录都需要一个 FE 用户组,因此您应该 select 可能的抓取组。