NodeJS XML 文件解析

NodeJS XML file parsing

我想将来自 XML 文件的标记中包含的 URL 存储在一个数组中。 我不知道如何启动和提取链接。

我的 NodeJS 代码

const fs = require("fs");
const xml2js = require('xml2js');
const util = require('util');

const parser = new xml2js.Parser();

fs.readFile('example.xml', (err, data) => {
    parser.parseString(data, (err, result) => {
        console.log((util.inspect(result, false, null)));
    });
});

输入:XML 文件示例

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.mywebsite.fr/001.html</loc>
<lastmod>2020-10-24</lastmod>
<changefreq>daily</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://www.mywebsite.fr/002.html</loc>
<lastmod>2020-10-24</lastmod>
<changefreq>daily</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://www.mywebsite.fr/003.html</loc>
<lastmod>2020-10-24</lastmod>
<changefreq>daily</changefreq>
<priority>0.5</priority>
</url>
</urlset>

预期产出

result = 
[
  'https://www.mywebsite.fr/001.html',
  'https://www.mywebsite.fr/002.html',
  'https://www.mywebsite.fr/003.html'
]

使用问题中的示例 xml,尝试如下操作:

urls = `[your xml above]`
xpath = require('xpath')
 , dom = require('xmldom').DOMParser; 
let target = new dom().parseFromString(urls);
item = xpath.select('//*[local-name()="loc"]/text()', target);
result = [];
item.forEach(function(url) {
    result.push(url.nodeValue);
});
console.log(result);

输出:

[
  'https://www.mywebsite.fr/001.html',
  'https://www.mywebsite.fr/002.html',
  'https://www.mywebsite.fr/003.html'
]