在扩展中强制执行通配符约束

Enforcing wildcard constraints in expansion

我想收集所有匹配正则表达式 ^fs_node\d+\.xyz$ 的文件,但我不知道如何编写扩展以便 glob 使用约束。现在,

wildcard_constraints:
    nodeidx = "\d+",

rule all:
    input:
        expand("fs_node{i}.xyz",
               i=glob_wildcards("fs_node{nodeidx}.xyz").nodeidx)

生成的输出也与具有 irc 的文件匹配,我不想要:

    input: fs_node37_irc.xyz, fs_node41_irc.xyz, fs_node32.xyz, fs_node10.xyz, fs_node43.xyz, fs_node2.xyz, fs_node30_irc.xyz, fs_node16.xyz, fs_node45.xyz, fs_node23_irc.xyz, fs_node2_irc.xyz, fs_node44_irc.xyz, fs_node33_irc.xyz, fs_node35.xyz, fs_node1.xyz, fs_node28_irc.xyz, fs_node42.xyz, fs_node15_irc.xyz, fs_node12_irc.xyz, fs_node35_irc.xyz, fs_node42_irc.xyz, fs_node44.xyz, fs_node31.xyz, fs_node17_irc.xyz, fs_node8_irc.xyz, fs_node43_irc.xyz, fs_node15.xyz, fs_node5_irc.xyz, ...

如何在扩展中正确执行(全局)通配符约束?它是全球性的,因为它也在其他地方使用。

可能glob_wildcards不够灵活。我会明确列出所有文件,select 那些你想用一些正则表达式保留的文件,提取变量部分 nodeidx 并将其用作通配符。未测试:

import os
import re

listdir = os.listdir(os.getcwd())

nodeidx = []
for x in listdir:
    if re.match('^fs_node\d+\.xyz$', x):
        idx = re.sub('^fs_node', '', re.sub('\.xyz$', '', x))
        _ = int(idx) # sanity check
        nodeidx.append(idx)

wildcard_constraints:
    nodeidx = '|'.join([re.escape(x) for x in nodeidx])

rule all:
    input:
        expand("fs_node{nodeidx}.xyz", nodeidx= nodeidx)