XML::Simple 将 xml 转换为 perl 哈希警告 "non-unique value"
XML::Simple convert xml to perl hash warning "non-unique value"
我有一个格式正确的 XML,我正在尝试使用 perl 模块 XML::Simple 将其转换为散列。此文件中有一些部分无法正确解析。有什么方法(或解决方法)可以正确解析 xml 并获得所需的结果吗?
D:\tmp>perl parse_dns2.pl dns_problem_public.xml
Warning: <dns_entry> element has non-unique value in 'domain' key attribute:
0 at parse_dns2.pl line 9.
Warning: <dns_entry> element has non-unique value in 'domain' key attribute:
example.com at parse_dns2.pl line 9.
Warning: <dns_entry> element has non-unique value in 'domain' key attribute:
test.com at parse_dns2.pl line 9.
$VAR1 = {
'dns_timeout' => '20',
'local_dns' => {
'dns_entry' => {
'0' => {
'content' => '192.168.120.32'
},
'domain.example.com' => {
'content' => '172.16.113.13'
},
'example.com' => {
'content' => '172.16.113.13'
},
'test.com' => {
'content' => '172.17.0.113'
}
}
}
};
我的代码很简单:
#!/usr/bin/perl
use strict;
use warnings;
use diagnostics;
use XML::Simple;
use Data::Dumper;
my $ref = XMLin(
$ARGV[0],
ForceArray => ['dns_entry'],
KeyAttr => { 'dns_entry' => 'priority' },
KeyAttr => { 'dns_entry' => 'domain' },
ForceContent => 0
);
print Dumper $ref;
xml 文件(相关部分)包含我需要用作键的属性:
<?xml version="1.0" encoding="ISO-8859-1"?>
<!DOCTYPE config SYSTEM "config.dtd">
<dns>
<local_dns>
<dns_entry priority="0">192.168.120.31</dns_entry>
<dns_entry priority="0">192.168.120.32</dns_entry>
<dns_entry domain="example.com">172.16.103.20</dns_entry>
<dns_entry domain="example.com">172.16.113.13</dns_entry>
<dns_entry domain="test.com">172.17.0.111</dns_entry>
<dns_entry domain="test.com">172.17.0.113</dns_entry>
<dns_entry domain="domain.example.com">172.16.103.20</dns_entry>
<dns_entry domain="domain.example.com">172.16.113.13</dns_entry>
</local_dns>
<dns_timeout>20</dns_timeout>
</dns>
第一个问题XML::Simple不能接受具有相同属性(虽然不同值)的相似元素。第二个问题是我只能使用 one 属性作为同一 XML 块中的关键属性。
想要的结果:
$VAR1 = {
'local_dns' => {
'dns_entry' => {
'domain' => {
'domain.example.com' => {
'content' => [
'172.16.113.20',
'172.16.113.13'
]
},
'example.com' => {
'content' => [
'172.16.113.20',
'172.16.113.13'
]
},
'test.com' => {
'content' => [
'172.17.0.111',
'172.17.0.111'
]
}
},
'priority' => {
'0' => {
'content' => [
'192.168.120.31',
'192.168.120.32'
]
}
}
}
},
'dns_timeout' => '20'
};
节点不能有多个内容,因此需要进行一些转换。
您应该借此机会避免使用 XML 解析器中的 。自己的文档太难用了建议不要用。
这是一个 XML::LibXML 解决方案:
use XML::LibXML qw( );
my $doc = XML::LibXML->new->parse_file('dns.xml');
my %data;
{
$data{dns_timeout} = $doc->findvalue('/dns/dns_timeout/text()');
for my $dns_entry_node ($doc->findnodes('/dns/local_dns/dns_entry')) {
my $addr = $dns_entry_node->textContent();
if (defined( my $priority = $dns_entry_node->getAttribute('priority') )) {
push @{ $data{local_dns}{dns_entry}{priority}{$priority} }, $addr;
}
if (defined( my $domain = $dns_entry_node->getAttribute('domain') )) {
push @{ $data{local_dns}{dns_entry}{domain}{$domain} }, $addr;
}
}
}
我有一个格式正确的 XML,我正在尝试使用 perl 模块 XML::Simple 将其转换为散列。此文件中有一些部分无法正确解析。有什么方法(或解决方法)可以正确解析 xml 并获得所需的结果吗?
D:\tmp>perl parse_dns2.pl dns_problem_public.xml
Warning: <dns_entry> element has non-unique value in 'domain' key attribute:
0 at parse_dns2.pl line 9.
Warning: <dns_entry> element has non-unique value in 'domain' key attribute:
example.com at parse_dns2.pl line 9.
Warning: <dns_entry> element has non-unique value in 'domain' key attribute:
test.com at parse_dns2.pl line 9.
$VAR1 = {
'dns_timeout' => '20',
'local_dns' => {
'dns_entry' => {
'0' => {
'content' => '192.168.120.32'
},
'domain.example.com' => {
'content' => '172.16.113.13'
},
'example.com' => {
'content' => '172.16.113.13'
},
'test.com' => {
'content' => '172.17.0.113'
}
}
}
};
我的代码很简单:
#!/usr/bin/perl
use strict;
use warnings;
use diagnostics;
use XML::Simple;
use Data::Dumper;
my $ref = XMLin(
$ARGV[0],
ForceArray => ['dns_entry'],
KeyAttr => { 'dns_entry' => 'priority' },
KeyAttr => { 'dns_entry' => 'domain' },
ForceContent => 0
);
print Dumper $ref;
xml 文件(相关部分)包含我需要用作键的属性:
<?xml version="1.0" encoding="ISO-8859-1"?>
<!DOCTYPE config SYSTEM "config.dtd">
<dns>
<local_dns>
<dns_entry priority="0">192.168.120.31</dns_entry>
<dns_entry priority="0">192.168.120.32</dns_entry>
<dns_entry domain="example.com">172.16.103.20</dns_entry>
<dns_entry domain="example.com">172.16.113.13</dns_entry>
<dns_entry domain="test.com">172.17.0.111</dns_entry>
<dns_entry domain="test.com">172.17.0.113</dns_entry>
<dns_entry domain="domain.example.com">172.16.103.20</dns_entry>
<dns_entry domain="domain.example.com">172.16.113.13</dns_entry>
</local_dns>
<dns_timeout>20</dns_timeout>
</dns>
第一个问题XML::Simple不能接受具有相同属性(虽然不同值)的相似元素。第二个问题是我只能使用 one 属性作为同一 XML 块中的关键属性。
想要的结果:
$VAR1 = {
'local_dns' => {
'dns_entry' => {
'domain' => {
'domain.example.com' => {
'content' => [
'172.16.113.20',
'172.16.113.13'
]
},
'example.com' => {
'content' => [
'172.16.113.20',
'172.16.113.13'
]
},
'test.com' => {
'content' => [
'172.17.0.111',
'172.17.0.111'
]
}
},
'priority' => {
'0' => {
'content' => [
'192.168.120.31',
'192.168.120.32'
]
}
}
}
},
'dns_timeout' => '20'
};
节点不能有多个内容,因此需要进行一些转换。
您应该借此机会避免使用 XML 解析器中的
这是一个 XML::LibXML 解决方案:
use XML::LibXML qw( );
my $doc = XML::LibXML->new->parse_file('dns.xml');
my %data;
{
$data{dns_timeout} = $doc->findvalue('/dns/dns_timeout/text()');
for my $dns_entry_node ($doc->findnodes('/dns/local_dns/dns_entry')) {
my $addr = $dns_entry_node->textContent();
if (defined( my $priority = $dns_entry_node->getAttribute('priority') )) {
push @{ $data{local_dns}{dns_entry}{priority}{$priority} }, $addr;
}
if (defined( my $domain = $dns_entry_node->getAttribute('domain') )) {
push @{ $data{local_dns}{dns_entry}{domain}{$domain} }, $addr;
}
}
}