在扩展中强制执行通配符约束
Enforcing wildcard constraints in expansion
我想收集所有匹配正则表达式 ^fs_node\d+\.xyz$
的文件,但我不知道如何编写扩展以便 glob 使用约束。现在,
wildcard_constraints:
nodeidx = "\d+",
rule all:
input:
expand("fs_node{i}.xyz",
i=glob_wildcards("fs_node{nodeidx}.xyz").nodeidx)
生成的输出也与具有 irc
的文件匹配,我不想要:
input: fs_node37_irc.xyz, fs_node41_irc.xyz, fs_node32.xyz, fs_node10.xyz, fs_node43.xyz, fs_node2.xyz, fs_node30_irc.xyz, fs_node16.xyz, fs_node45.xyz, fs_node23_irc.xyz, fs_node2_irc.xyz, fs_node44_irc.xyz, fs_node33_irc.xyz, fs_node35.xyz, fs_node1.xyz, fs_node28_irc.xyz, fs_node42.xyz, fs_node15_irc.xyz, fs_node12_irc.xyz, fs_node35_irc.xyz, fs_node42_irc.xyz, fs_node44.xyz, fs_node31.xyz, fs_node17_irc.xyz, fs_node8_irc.xyz, fs_node43_irc.xyz, fs_node15.xyz, fs_node5_irc.xyz, ...
如何在扩展中正确执行(全局)通配符约束?它是全球性的,因为它也在其他地方使用。
可能glob_wildcards
不够灵活。我会明确列出所有文件,select 那些你想用一些正则表达式保留的文件,提取变量部分 nodeidx
并将其用作通配符。未测试:
import os
import re
listdir = os.listdir(os.getcwd())
nodeidx = []
for x in listdir:
if re.match('^fs_node\d+\.xyz$', x):
idx = re.sub('^fs_node', '', re.sub('\.xyz$', '', x))
_ = int(idx) # sanity check
nodeidx.append(idx)
wildcard_constraints:
nodeidx = '|'.join([re.escape(x) for x in nodeidx])
rule all:
input:
expand("fs_node{nodeidx}.xyz", nodeidx= nodeidx)
我想收集所有匹配正则表达式 ^fs_node\d+\.xyz$
的文件,但我不知道如何编写扩展以便 glob 使用约束。现在,
wildcard_constraints:
nodeidx = "\d+",
rule all:
input:
expand("fs_node{i}.xyz",
i=glob_wildcards("fs_node{nodeidx}.xyz").nodeidx)
生成的输出也与具有 irc
的文件匹配,我不想要:
input: fs_node37_irc.xyz, fs_node41_irc.xyz, fs_node32.xyz, fs_node10.xyz, fs_node43.xyz, fs_node2.xyz, fs_node30_irc.xyz, fs_node16.xyz, fs_node45.xyz, fs_node23_irc.xyz, fs_node2_irc.xyz, fs_node44_irc.xyz, fs_node33_irc.xyz, fs_node35.xyz, fs_node1.xyz, fs_node28_irc.xyz, fs_node42.xyz, fs_node15_irc.xyz, fs_node12_irc.xyz, fs_node35_irc.xyz, fs_node42_irc.xyz, fs_node44.xyz, fs_node31.xyz, fs_node17_irc.xyz, fs_node8_irc.xyz, fs_node43_irc.xyz, fs_node15.xyz, fs_node5_irc.xyz, ...
如何在扩展中正确执行(全局)通配符约束?它是全球性的,因为它也在其他地方使用。
可能glob_wildcards
不够灵活。我会明确列出所有文件,select 那些你想用一些正则表达式保留的文件,提取变量部分 nodeidx
并将其用作通配符。未测试:
import os
import re
listdir = os.listdir(os.getcwd())
nodeidx = []
for x in listdir:
if re.match('^fs_node\d+\.xyz$', x):
idx = re.sub('^fs_node', '', re.sub('\.xyz$', '', x))
_ = int(idx) # sanity check
nodeidx.append(idx)
wildcard_constraints:
nodeidx = '|'.join([re.escape(x) for x in nodeidx])
rule all:
input:
expand("fs_node{nodeidx}.xyz", nodeidx= nodeidx)