以图形形式表示维基百科

Represent Wikipedia in Graph form

我想以图表形式表示整个维基百科,就像每篇文章都是一个节点,如果一篇文章包含另一篇文章的 link,那么它们共享一条边。 由于点击次数过多,因此我需要在本地发出请求(在本地设置维基百科)。 你能指导我如何实现这一目标吗(告诉我有关库或工具的帮助)?

您可以从维基百科获取转储 here. 根据您的 'python' 标签,我假设您想使用 python 来抓取数据并生成图表。 我可以推荐以下模块:

  • 请求 - 用于检索网站
  • Beautifulsoup - 用于解析 html
  • scrapy - beautifulsoup
  • 的替代方案
  • pymongodb - 当然还有 mongodb。 Mongodb 是一个不错的选择,因为它是面向文档的
  • matplotlib - 用于可视化
  • graphviz - 也是可视化的好选择
  • networkx - 图表的可视化和操作