wiki pages-articles 转储文件的 xml 文件(标签)的结构是什么
what is the structure of the xml file (tags) of the wiki pages-articles dump file
我认为 wiki 转储 XML 文件标签会像
<page>
<title> </title>
<content> </content>
</page>
<page>
<title> </title>
<content> </content>
</page>
除了其他标签。
我设法找到了页面和标题标签,但我仍然找不到主要文章的位置,在 body 标签,或内容标签,或文章标签中,任何帮助
主要文章将在标签 <page>
内,然后 <revision>
并在其中搜索 <text>
我认为 wiki 转储 XML 文件标签会像
<page>
<title> </title>
<content> </content>
</page>
<page>
<title> </title>
<content> </content>
</page>
除了其他标签。 我设法找到了页面和标题标签,但我仍然找不到主要文章的位置,在 body 标签,或内容标签,或文章标签中,任何帮助
主要文章将在标签 <page>
内,然后 <revision>
并在其中搜索 <text>