使用 Powershell 从多个 XML 文件中的元素获取数据以输出到另一个单个 XML 文件
Get data from elements within multiple XML files for output to another, single XML file using Powershell
首先我要承认我是一个 Powershell(和编码)菜鸟。我已经通过一些脚本跌跌撞撞,但我没有对任何接近能力的东西提出任何要求。我希望一些更有经验的人可以让我走上正轨。
我正在尝试从多个 XML 文件中提取特定的元素数据,这些文件将用于填充另一个 XML 文件。我从中提取数据的文件是发票,我想获取发票编号和时间戳并将这些值放入清单中。清单结构如下
<?xml version="1.0" encoding="utf-8"?>
<Manifest>
<Invoice>
<InvoiceID></InvoiceID>
<Timestamp></Timestamp>
</Invoice>
</Manifest>
我从中提取的 XMLs 位于将保存清单的目录的子目录中。为了简单起见,发票中的元素名称与清单中的相应元素相同。清单的文件夹结构是“C:\Projects\Powershell\Manifest\Manifest.xml
”,发票的文件夹结构是“C:\Projects\Powershell\Manifest\Invoices\*.xml
”。
使用以下代码,我可以从 的元素“InvoiceID
”和“Timestamp
”中获取数据,只有第一个 XML 在子目录“\Invoices
”中。但是,该代码确实为每个发票文件创建了一个条目;它只是用从第一个文件中获取的值填充每个元素。 (因此,例如,如果我在“\Invoices
”目录中有三个 Invoice XML 文件,我得到的结果是:<Invoice>
复杂元素的三个实例,每个实例都填充了 InvoiceID
和 Timestamp
在 first 文件中找到。所以它正在计算文件并输出相应数量的元素,它只是没有从任何文件中获取数据,而是首先。)
代码如下:
$files = Get-ChildItem "C:\Projects\Powershell\Manifest\Invoices\*.xml"
$xmlData = @"
<Invoice>
<InvoiceId>$InvID</InvoiceId>
<Timestamp>$Timestamp</Timestamp>
</Invoice>
"@
$Manifest = "C:\Projects\Powershell\Manifest\Manifest.xml"
ForEach ($file in $files) {
$xmldoc = [xml](Get-Content $file)
$InvID = $xmldoc.Manifest.Invoice.InvoiceID
$Timestamp = $xmldoc.Manifest.Invoice.Timestamp
ForEach ($xml in $xmldoc)
{
Add-Content $Manifest $xmlData
}}
一旦我弄清楚了这一部分,我就可以处理正确格式化输出文件的结束标记。
我知道我一定是循环不正确,但是在读完这篇文章直到我的大脑受伤之后,我终于求助于问这个问题。我 missing/messing 有什么明显的事情?
String interpolation (expansion) in "..."
and @"<newline>...<newline>"@
strings instantly, 其值引用的变量包含当时正在使用。
结果,same 字符串 - 其值在 before 循环中确定 - 在 foreach
循环的每次迭代中输出。
您的用例需要 a templating 方法,其中字符串插值 deferred,将被调用 on demand with the then-current variable values, using $ExecutionContext.InvokeCommand.ExpandString()
[1]:
# Define the *template* string as a *literal* - with *single* quotes.
$xmlData = @'
<Invoice>
<InvoiceId>$InvID</InvoiceId>
<Timestamp>$Timestamp</Timestamp>
</Invoice>
'@
# ...
# ForEach ($file in $files) { ...
# Perform interpolation *on demand* with $ExecutionContext.InvokeCommand.ExpandString()
Add-Content $Manifest -Value $ExecutionContext.InvokeCommand.ExpandString($xmlData)
# }
注:
也可以通过在 {...}
中明确描述变量名称来嵌入变量引用,例如 ${InvID}
,这在某些情况下可能是 必需的 用于消歧。
为了嵌入表达式/命令输出,使用$()
、subexpression operator,如下所示。
为了逐字嵌入 $
个实例,将它们转义为`$
.
一个简单的例子:
# Define a template string, *single-quoted*, with *literal contents*:
# - '$InvID' is simply literally part of the string, not a variable reference (yet).
# - Ditto for $((Get-Date).TimeOfDay)
$strTempl = 'Invoice ID $InvID extracted at $((Get-Date).TimeOfDay).'
# Echo the template string as-is - unexpanded - ...
$strTempl
# ... and expand it on demand
$InvID = 1
$ExecutionContext.InvokeCommand.ExpandString($strTempl)
# ... and again, after assigning a different value to $InvID
$InvID = 2
$ExecutionContext.InvokeCommand.ExpandString($strTempl)
上面的结果类似于:
Invoice ID $InvID extracted at $((Get-Date).TimeOfDay). # template literal
Invoice ID 1 extracted at 11:38:12.2719300. # first on-demand expansion
Invoice ID 2 extracted at 11:38:12.2766010. # second on-demand expnsion
[1] $ExecutionContext.InvokeCommand.ExpandString()
方法 的功能通过 Expand-String
cmdlet 是 this GitHub feature request.
的主题
首先我要承认我是一个 Powershell(和编码)菜鸟。我已经通过一些脚本跌跌撞撞,但我没有对任何接近能力的东西提出任何要求。我希望一些更有经验的人可以让我走上正轨。
我正在尝试从多个 XML 文件中提取特定的元素数据,这些文件将用于填充另一个 XML 文件。我从中提取数据的文件是发票,我想获取发票编号和时间戳并将这些值放入清单中。清单结构如下
<?xml version="1.0" encoding="utf-8"?>
<Manifest>
<Invoice>
<InvoiceID></InvoiceID>
<Timestamp></Timestamp>
</Invoice>
</Manifest>
我从中提取的 XMLs 位于将保存清单的目录的子目录中。为了简单起见,发票中的元素名称与清单中的相应元素相同。清单的文件夹结构是“C:\Projects\Powershell\Manifest\Manifest.xml
”,发票的文件夹结构是“C:\Projects\Powershell\Manifest\Invoices\*.xml
”。
使用以下代码,我可以从 的元素“InvoiceID
”和“Timestamp
”中获取数据,只有第一个 XML 在子目录“\Invoices
”中。但是,该代码确实为每个发票文件创建了一个条目;它只是用从第一个文件中获取的值填充每个元素。 (因此,例如,如果我在“\Invoices
”目录中有三个 Invoice XML 文件,我得到的结果是:<Invoice>
复杂元素的三个实例,每个实例都填充了 InvoiceID
和 Timestamp
在 first 文件中找到。所以它正在计算文件并输出相应数量的元素,它只是没有从任何文件中获取数据,而是首先。)
代码如下:
$files = Get-ChildItem "C:\Projects\Powershell\Manifest\Invoices\*.xml"
$xmlData = @"
<Invoice>
<InvoiceId>$InvID</InvoiceId>
<Timestamp>$Timestamp</Timestamp>
</Invoice>
"@
$Manifest = "C:\Projects\Powershell\Manifest\Manifest.xml"
ForEach ($file in $files) {
$xmldoc = [xml](Get-Content $file)
$InvID = $xmldoc.Manifest.Invoice.InvoiceID
$Timestamp = $xmldoc.Manifest.Invoice.Timestamp
ForEach ($xml in $xmldoc)
{
Add-Content $Manifest $xmlData
}}
一旦我弄清楚了这一部分,我就可以处理正确格式化输出文件的结束标记。
我知道我一定是循环不正确,但是在读完这篇文章直到我的大脑受伤之后,我终于求助于问这个问题。我 missing/messing 有什么明显的事情?
String interpolation (expansion) in "..."
and @"<newline>...<newline>"@
strings instantly, 其值引用的变量包含当时正在使用。
结果,same 字符串 - 其值在 before 循环中确定 - 在 foreach
循环的每次迭代中输出。
您的用例需要 a templating 方法,其中字符串插值 deferred,将被调用 on demand with the then-current variable values, using $ExecutionContext.InvokeCommand.ExpandString()
[1]:
# Define the *template* string as a *literal* - with *single* quotes.
$xmlData = @'
<Invoice>
<InvoiceId>$InvID</InvoiceId>
<Timestamp>$Timestamp</Timestamp>
</Invoice>
'@
# ...
# ForEach ($file in $files) { ...
# Perform interpolation *on demand* with $ExecutionContext.InvokeCommand.ExpandString()
Add-Content $Manifest -Value $ExecutionContext.InvokeCommand.ExpandString($xmlData)
# }
注:
也可以通过在
{...}
中明确描述变量名称来嵌入变量引用,例如${InvID}
,这在某些情况下可能是 必需的 用于消歧。为了嵌入表达式/命令输出,使用
$()
、subexpression operator,如下所示。为了逐字嵌入
$
个实例,将它们转义为`$
.
一个简单的例子:
# Define a template string, *single-quoted*, with *literal contents*:
# - '$InvID' is simply literally part of the string, not a variable reference (yet).
# - Ditto for $((Get-Date).TimeOfDay)
$strTempl = 'Invoice ID $InvID extracted at $((Get-Date).TimeOfDay).'
# Echo the template string as-is - unexpanded - ...
$strTempl
# ... and expand it on demand
$InvID = 1
$ExecutionContext.InvokeCommand.ExpandString($strTempl)
# ... and again, after assigning a different value to $InvID
$InvID = 2
$ExecutionContext.InvokeCommand.ExpandString($strTempl)
上面的结果类似于:
Invoice ID $InvID extracted at $((Get-Date).TimeOfDay). # template literal
Invoice ID 1 extracted at 11:38:12.2719300. # first on-demand expansion
Invoice ID 2 extracted at 11:38:12.2766010. # second on-demand expnsion
[1] $ExecutionContext.InvokeCommand.ExpandString()
方法 的功能通过 Expand-String
cmdlet 是 this GitHub feature request.