以图形形式表示维基百科
Represent Wikipedia in Graph form
我想以图表形式表示整个维基百科,就像每篇文章都是一个节点,如果一篇文章包含另一篇文章的 link,那么它们共享一条边。
由于点击次数过多,因此我需要在本地发出请求(在本地设置维基百科)。
你能指导我如何实现这一目标吗(告诉我有关库或工具的帮助)?
您可以从维基百科获取转储 here.
根据您的 'python' 标签,我假设您想使用 python 来抓取数据并生成图表。
我可以推荐以下模块:
- 请求 - 用于检索网站
- Beautifulsoup - 用于解析 html
- scrapy - beautifulsoup
的替代方案
- pymongodb - 当然还有 mongodb。 Mongodb 是一个不错的选择,因为它是面向文档的
- matplotlib - 用于可视化
- graphviz - 也是可视化的好选择
- networkx - 图表的可视化和操作
我想以图表形式表示整个维基百科,就像每篇文章都是一个节点,如果一篇文章包含另一篇文章的 link,那么它们共享一条边。 由于点击次数过多,因此我需要在本地发出请求(在本地设置维基百科)。 你能指导我如何实现这一目标吗(告诉我有关库或工具的帮助)?
您可以从维基百科获取转储 here. 根据您的 'python' 标签,我假设您想使用 python 来抓取数据并生成图表。 我可以推荐以下模块:
- 请求 - 用于检索网站
- Beautifulsoup - 用于解析 html
- scrapy - beautifulsoup 的替代方案
- pymongodb - 当然还有 mongodb。 Mongodb 是一个不错的选择,因为它是面向文档的
- matplotlib - 用于可视化
- graphviz - 也是可视化的好选择
- networkx - 图表的可视化和操作