使用 Powershell 从多个 XML 文件中的元素获取数据以输出到另一个单个 XML 文件

Get data from elements within multiple XML files for output to another, single XML file using Powershell

首先我要承认我是一个 Powershell(和编码)菜鸟。我已经通过一些脚本跌跌撞撞,但我没有对任何接近能力的东西提出任何要求。我希望一些更有经验的人可以让我走上正轨。

我正在尝试从多个 XML 文件中提取特定的元素数据,这些文件将用于填充另一个 XML 文件。我从中提取数据的文件是发票,我想获取发票编号和时间戳并将这些值放入清单中。清单结构如下

<?xml version="1.0" encoding="utf-8"?>
<Manifest>
    <Invoice>
        <InvoiceID></InvoiceID>
        <Timestamp></Timestamp>
    </Invoice>
</Manifest>

我从中提取的 XMLs 位于将保存清单的目录的子目录中。为了简单起见,发票中的元素名称与清单中的相应元素相同。清单的文件夹结构是“C:\Projects\Powershell\Manifest\Manifest.xml”,发票的文件夹结构是“C:\Projects\Powershell\Manifest\Invoices\*.xml”。

使用以下代码,我可以从 的元素“InvoiceID”和“Timestamp”中获取数据,只有第一个 XML 在子目录“\Invoices”中。但是,该代码确实为每个发票文件创建了一个条目;它只是用从第一个文件中获取的值填充每个元素。 (因此,例如,如果我在“\Invoices”目录中有三个 Invoice XML 文件,我得到的结果是:<Invoice> 复杂元素的三个实例,每个实例都填充了 InvoiceIDTimestampfirst 文件中找到。所以它正在计算文件并输出相应数量的元素,它只是没有从任何文件中获取数据,而是首先。)

代码如下:

$files = Get-ChildItem "C:\Projects\Powershell\Manifest\Invoices\*.xml"

$xmlData = @"
    <Invoice>
        <InvoiceId>$InvID</InvoiceId>
        <Timestamp>$Timestamp</Timestamp>
    </Invoice>
"@
$Manifest = "C:\Projects\Powershell\Manifest\Manifest.xml"

ForEach ($file in $files) {
    $xmldoc = [xml](Get-Content $file)
    $InvID = $xmldoc.Manifest.Invoice.InvoiceID
    $Timestamp = $xmldoc.Manifest.Invoice.Timestamp
    ForEach ($xml in $xmldoc)
{
    Add-Content $Manifest $xmlData
}}

一旦我弄清楚了这一部分,我就可以处理正确格式化输出文件的结束标记。

我知道我一定是循环不正确,但是在读完这篇文章直到我的大脑受伤之后,我终于求助于问这个问题。我 missing/messing 有什么明显的事情?

String interpolation (expansion) in "..." and @"<newline>...<newline>"@ strings instantly, 其值引用的变量包含当时正在使用。
结果,same 字符串 - 其值在 before 循环中确定 - 在 foreach 循环的每次迭代中输出。

您的用例需要 a templating 方法,其中字符串插值 deferred,将被调用 on demand with the then-current variable values, using $ExecutionContext.InvokeCommand.ExpandString()[1]:

# Define the *template* string as a *literal* - with *single* quotes.
$xmlData = @'
    <Invoice>
        <InvoiceId>$InvID</InvoiceId>
        <Timestamp>$Timestamp</Timestamp>
    </Invoice>
'@

 # ...
 # ForEach ($file in $files) { ...
   # Perform interpolation *on demand* with $ExecutionContext.InvokeCommand.ExpandString()
   Add-Content $Manifest -Value $ExecutionContext.InvokeCommand.ExpandString($xmlData)
 # }

注:

  • 也可以通过在 {...} 中明确描述变量名称来嵌入变量引用,例如 ${InvID},这在某些情况下可能是 必需的 用于消歧。

  • 为了嵌入表达式/命令输出,使用$()subexpression operator,如下所示。

  • 为了逐字嵌入 $ 个实例,将它们转义为`$.


一个简单的例子:

# Define a template string, *single-quoted*, with *literal contents*:
#  - '$InvID' is simply literally part of the string, not a variable reference (yet).
#  - Ditto for $((Get-Date).TimeOfDay)
$strTempl = 'Invoice ID $InvID extracted at $((Get-Date).TimeOfDay).'

# Echo the template string as-is - unexpanded - ...
$strTempl

# ... and expand it on demand
$InvID = 1
$ExecutionContext.InvokeCommand.ExpandString($strTempl)

# ... and again, after assigning a different value to $InvID
$InvID = 2
$ExecutionContext.InvokeCommand.ExpandString($strTempl)

上面的结果类似于:

Invoice ID $InvID extracted at $((Get-Date).TimeOfDay).  # template literal
Invoice ID 1 extracted at 11:38:12.2719300.              # first on-demand expansion
Invoice ID 2 extracted at 11:38:12.2766010.              # second on-demand expnsion

[1] $ExecutionContext.InvokeCommand.ExpandString() 方法 的功能通过 Expand-String cmdletthis GitHub feature request.

的主题