有没有办法解析维基讨论页?
Is there a way to parse wiki talk page?
我想提取维基百科讨论页上编辑的评论以及编辑姓名和时间戳(例如,https://en.wikipedia.org/wiki/Talk:Coronavirus)。有什么有意义的方法可以做到这一点吗?是否可以在保留树结构的同时提取评论 - 即评论是否是对另一个评论的回应。
谢谢!
只是大约。有工具尝试这样做,例如 python-mwchatter,但通常它是自由形式的维基文本,因此没有从中提取结构的可靠方法。
我想提取维基百科讨论页上编辑的评论以及编辑姓名和时间戳(例如,https://en.wikipedia.org/wiki/Talk:Coronavirus)。有什么有意义的方法可以做到这一点吗?是否可以在保留树结构的同时提取评论 - 即评论是否是对另一个评论的回应。
谢谢!
只是大约。有工具尝试这样做,例如 python-mwchatter,但通常它是自由形式的维基文本,因此没有从中提取结构的可靠方法。