Quora 的 HTML 没有显示 schema.org,但是 google 在 question/answer 部分显示了它们,如何?
Quora's HTML doesn't show schema.org, but google shows them in the question/answer section, how?
我正在制作一个抓取器来为支持 RDFa、Json LD 和 Microdata 的学生阅读问题/答案数据,但 Quora 让我感到困惑。 我需要了解它的阅读方式,以便我可以在我的 HTML 问答爬虫中阅读它以应对此类情况。
在 google 搜索中,我看到了 QA 块,但是如果我转到 URL https://www.quora.com/What-happens-when-sodium-chloride-and-water-is-heated-to-dry,我没有看到 JSON LD 的任何证据、RDFa 或微数据。 google阅读quora的问答信息怎么样?
我能想到的可能原因:
- 他们只向搜索引擎用户代理显示该数据。所以也许我应该在请求页面时将用户代理更改为爬虫。
- Google 自己想出来了。这意味着我需要创建一些 NLP 解决方案来获取信息。
- 将页面标识为问题/答案的关键字。
- Google 为像 quora 这样的大型 Q/A 网站做了一些特别的事情(但堆栈溢出有 schema.org,所以我认为这不是真的)。
PS:即使 google 也没有显示对其他格式的支持:https://developers.google.com/search/docs/advanced/structured-data/qapage
它只显示给搜索引擎用户代理,使用Googlebot
。
@nikrant25 显示模式确实存在:https://search.google.com/test/rich-results/result/r%2Fq-and-a?id=3aNOu3qg7TnhPNz-_xKuuQ。所以我决定用 Googlebot
作为 useragent 和 schema 显示出来。
我正在制作一个抓取器来为支持 RDFa、Json LD 和 Microdata 的学生阅读问题/答案数据,但 Quora 让我感到困惑。 我需要了解它的阅读方式,以便我可以在我的 HTML 问答爬虫中阅读它以应对此类情况。
在 google 搜索中,我看到了 QA 块,但是如果我转到 URL https://www.quora.com/What-happens-when-sodium-chloride-and-water-is-heated-to-dry,我没有看到 JSON LD 的任何证据、RDFa 或微数据。 google阅读quora的问答信息怎么样?
我能想到的可能原因:
- 他们只向搜索引擎用户代理显示该数据。所以也许我应该在请求页面时将用户代理更改为爬虫。
- Google 自己想出来了。这意味着我需要创建一些 NLP 解决方案来获取信息。
- 将页面标识为问题/答案的关键字。
- Google 为像 quora 这样的大型 Q/A 网站做了一些特别的事情(但堆栈溢出有 schema.org,所以我认为这不是真的)。
PS:即使 google 也没有显示对其他格式的支持:https://developers.google.com/search/docs/advanced/structured-data/qapage
它只显示给搜索引擎用户代理,使用Googlebot
。
@nikrant25 显示模式确实存在:https://search.google.com/test/rich-results/result/r%2Fq-and-a?id=3aNOu3qg7TnhPNz-_xKuuQ。所以我决定用 Googlebot
作为 useragent 和 schema 显示出来。