Python 区分大小写的字符串模板
Python String Templating with Case Sensitivity
这是我用来在 Autodesk Maya 中命名节点的命名脚本。然而,这个特定的脚本没有使用任何特定于 Maya 的内容。
我刚才问过我将如何做这样的事情,在哪里可以使用变量约定,然后出现了模板。
所以如果我有这样的约定:
'${prefix}_${name}_${side}_${type}'
我可以传递这些参数:
bind_thigh_left_joint
然后运行他们通过缩写字典(以及用户缩写字典),与场景文件中的相关节点进行检查以确保没有重复,最后得到:bn_thigh_L_jnt
但是我想要这样,如果其中一个键的第一个大写字母,它将使替代大写。
例如,如果 {$prefix}
改为 {$Prefix}
thigh 将变为 Thigh,或者如果 {$prefix}
变为 {$PREFIX}
thigh 将变为 THIGH。然而,如果它是 {$PREfix}
thigh 仍然只是 Thigh。
除了我无法检测按键的个别情况外,我可以很容易地做到这一点。例如,如果字符串是 '${Prefix}_${name}_${SIDE}_${type}'
我如何找到大小写前缀,如果我知道,我将如何将其用于此模板?
请注意,此代码与我拥有的代码不完全一样,我省略了很多其他更具体的 Maya 内容,这只是处理替换本身。
from string import Template
import collections
def convert(prefix, name, side, obj_type):
user_conv = '${Prefix}_${name}_${SIDE}_${type}'
# Assigns keys to strings to be used by the user dictionary.
subs = {'prefix': prefix, 'name': name, 'side': side, 'type': obj_type}
# Converts all of user convention to lowercase, and substitutes the names from subs.
new_name = Template(user_conv.lower())
new_name = new_name.safe_substitute(**subs)
# Strips leading and trailing underscores, and replaces double underscores with a single
new_name = new_name.strip('_')
new_name = new_name.replace('__', '_')
return new_name
print convert('bind', 'thigh', 'left', 'joint')
>> bind_thigh_left_joint
编辑:
还想去掉多个下划线
所以如果我有类似的东西:
'${prefix}___${name}__${side}_____${type}'
我希望它出来
>> bind_thigh_left_joint
没有
>> bind___thigh__left____joint
还有最后一件事,我想既然用户会输入这个,那么不添加括号和美元符号会更方便。有没有可能做这样的事情?
import re
user_conv = 'PREFIX_name_Side_TYPE01'
# do all filtering, removing of underscores and special characters
templates = ['prefix', 'name', 'side', 'type']
for template in templates:
if template in user_conv.lower():
# add bracket and dollar sign around match
>> '${PREFIX}_{name}_{Side}_${TYPE}01'
为您要支持的每个大写创建重复替换。使用 dict.items()
或 dict.iteritems()
循环遍历原始 subs
字典中的 key/value 对。 'KEY': 'VALUE'
和 'Key': 'Value'
对很容易用 .upper()
和 .title()
创建。
如果支持 'KEy': 'Value'
对您来说真的很重要,可以通过遍历键的索引、拆分、大写第一部分并重新组合来完成。例如,如果 key
是 'Hello'
,
key[:2].upper() + key[2:]
将是 'HEllo'
。
然后,照常使用safe_substitute
即可。
在这里,我们可以利用 OOP 的力量让模板做我们想做的事。我们可以继续扩展 string.Template
class(如 docs 中所建议)。
让我们先导入一些相关的methods/classes:
from string import Template, uppercase, _multimap
import collections
然后我们定义一个辅助方法来处理传递给 safe_substitute()
或 substitute()
方法的参数。 (此方法的内容取自 Python 的 string
模块源):
def get_mapping_from_args(*args, **kws):
if len(args) > 1:
raise TypeError('Too many positional arguments')
if not args:
mapping = kws
elif kws:
mapping = _multimap(kws, args[0])
else:
mapping = args[0]
return mapping
然后我们继续定义我们的扩展模板 class。让我们称之为 class CustomRenameTemplate
。我们编写了一个名为 do_template_based_capitalization()
的辅助方法,它基本上根据您提供的模板模式进行大写。我们确保覆盖 substitute()
和 safe_substitute()
方法来使用它。
class CustomRenameTemplate(Template):
def __init__(self, *args, **kws):
super(CustomRenameTemplate, self).__init__(*args, **kws)
self.orig_template = self.template
self.template = self.template.lower()
def do_template_based_capitalization(self, mapping):
matches = self.pattern.findall(self.orig_template)
for match in matches:
keyword = match[self.pattern.groupindex['braced']-1]
if keyword[0] in uppercase: # First letter is CAPITALIZED
if keyword == keyword.upper(): # Condition for full capitalization
mapping[keyword.lower()] = mapping[keyword.lower()].upper()
else: # Condition for only first letter capitalization
mapping[keyword.lower()] = mapping[keyword.lower()].capitalize()
def safe_substitute(self, *args, **kws):
mapping = get_mapping_from_args(*args, **kws)
self.do_template_based_capitalization(mapping)
return super(CustomRenameTemplate, self).safe_substitute(mapping)
def substitute(self, *args, **kws):
mapping = get_mapping_from_args(*args, **kws)
self.do_template_based_capitalization(mapping)
return super(CustomRenameTemplate, self).substitute(mapping)
我们现在可以使用这个 class。我们继续对您的 convert()
方法做一些细微的修改,以将这个新的 class 付诸实践:
def convert(prefix, name, side, obj_type, user_conv='${Prefix}_${name}_${SIDE}_${type}'):
# Let us parameterize user_conv instead of hardcoding it.
# That makes for better testing, modularity and all that good stuff.
# user_conv = '${Prefix}_${name}_${SIDE}_${type}'
# Assigns keys to strings to be used by the user dictionary.
subs = {'prefix': prefix, 'name': name, 'side': side, 'type': obj_type}
# Converts all of user convention to lowercase, and substitutes the names from subs.
new_name = CustomRenameTemplate(user_conv) # Send the actual template, instead of it's lower()
new_name = new_name.substitute(**subs)
# Strips leading and trailing underscores, and replaces double underscores with a single
new_name = new_name.strip('_')
new_name = new_name.replace('__', '_')
return new_name
这是实际操作:
>>>print convert('bind', 'thigh', 'left', 'joint')
Bind_thigh_LEFT_joint
>>>print convert('bind', 'thigh', 'left', 'joint', user_conv='${prefix}_${name}_${side}_${type}')
bind_thigh_left_joint
>>>print convert('bind', 'thigh', 'left', 'joint', user_conv='${prefix}_${NAme}_${side}_${TYPE}')
bind_Thigh_left_JOINT
更新#1:
如果要处理用户约定中多次出现的下划线_
和可能的特殊字符,只需在convert()
的return
语句之前添加以下行方法:
new_name = re.sub('[^A-Za-z0-9_]+', '', new_name) # This will strip every character NOT ( NOT is denoted by the leading ^) enclosed in the []
new_name = re.sub('_+', '_', new_name) # This will replace one or more occurrences of _ with a single _
注:
剥离特殊字符时需要考虑的重要事项是 Maya egs 使用的特殊字符。对于命名空间表示 :
和层次结构表示 |
。我将由您决定是选择剥离这些,还是用另一个角色替换它们,或者一开始就不接收它们。 return 对象名称的大多数 Maya 命令都有标志来控制名称 returned 的冗长程度(即例如,WITH 命名空间、完整 DAG 路径或其中的 none) .
更新#2:
对于你问题的扩展部分,你问过的地方:
Also the last thing, I figured since a user would be inputting this,
it would be more convenient not to be adding brackets and dollar
signs. Would it be possible to do something like this?
是的。事实上,为了进一步推广,如果您假设模板字符串仅由字母而不是字母数字组成,您可以再次使用 re
从 user_conv
中提取它们并将它们填充到 ${}
像这样:
user_conv = 'PREFIX_name_Side_TYPE01'
user_conv = re.sub('[A-Za-z]+', '${\g<0>}', user_conv)
>>> print user_conv
>>> ${PREFIX}_${name}_${Side}_${TYPE}01
我们在这里使用了 backreferences 的强大功能,即 \g<group_number>
。查看 docs here 以获取有关正则表达式中反向引用的更多信息。
这是我用来在 Autodesk Maya 中命名节点的命名脚本。然而,这个特定的脚本没有使用任何特定于 Maya 的内容。
我刚才问过我将如何做这样的事情,在哪里可以使用变量约定,然后出现了模板。
所以如果我有这样的约定:
'${prefix}_${name}_${side}_${type}'
我可以传递这些参数:
bind_thigh_left_joint
然后运行他们通过缩写字典(以及用户缩写字典),与场景文件中的相关节点进行检查以确保没有重复,最后得到:bn_thigh_L_jnt
但是我想要这样,如果其中一个键的第一个大写字母,它将使替代大写。
例如,如果 {$prefix}
改为 {$Prefix}
thigh 将变为 Thigh,或者如果 {$prefix}
变为 {$PREFIX}
thigh 将变为 THIGH。然而,如果它是 {$PREfix}
thigh 仍然只是 Thigh。
除了我无法检测按键的个别情况外,我可以很容易地做到这一点。例如,如果字符串是 '${Prefix}_${name}_${SIDE}_${type}'
我如何找到大小写前缀,如果我知道,我将如何将其用于此模板?
请注意,此代码与我拥有的代码不完全一样,我省略了很多其他更具体的 Maya 内容,这只是处理替换本身。
from string import Template
import collections
def convert(prefix, name, side, obj_type):
user_conv = '${Prefix}_${name}_${SIDE}_${type}'
# Assigns keys to strings to be used by the user dictionary.
subs = {'prefix': prefix, 'name': name, 'side': side, 'type': obj_type}
# Converts all of user convention to lowercase, and substitutes the names from subs.
new_name = Template(user_conv.lower())
new_name = new_name.safe_substitute(**subs)
# Strips leading and trailing underscores, and replaces double underscores with a single
new_name = new_name.strip('_')
new_name = new_name.replace('__', '_')
return new_name
print convert('bind', 'thigh', 'left', 'joint')
>> bind_thigh_left_joint
编辑: 还想去掉多个下划线
所以如果我有类似的东西:
'${prefix}___${name}__${side}_____${type}'
我希望它出来
>> bind_thigh_left_joint
没有
>> bind___thigh__left____joint
还有最后一件事,我想既然用户会输入这个,那么不添加括号和美元符号会更方便。有没有可能做这样的事情?
import re
user_conv = 'PREFIX_name_Side_TYPE01'
# do all filtering, removing of underscores and special characters
templates = ['prefix', 'name', 'side', 'type']
for template in templates:
if template in user_conv.lower():
# add bracket and dollar sign around match
>> '${PREFIX}_{name}_{Side}_${TYPE}01'
为您要支持的每个大写创建重复替换。使用 dict.items()
或 dict.iteritems()
循环遍历原始 subs
字典中的 key/value 对。 'KEY': 'VALUE'
和 'Key': 'Value'
对很容易用 .upper()
和 .title()
创建。
如果支持 'KEy': 'Value'
对您来说真的很重要,可以通过遍历键的索引、拆分、大写第一部分并重新组合来完成。例如,如果 key
是 'Hello'
,
key[:2].upper() + key[2:]
将是 'HEllo'
。
然后,照常使用safe_substitute
即可。
在这里,我们可以利用 OOP 的力量让模板做我们想做的事。我们可以继续扩展 string.Template
class(如 docs 中所建议)。
让我们先导入一些相关的methods/classes:
from string import Template, uppercase, _multimap
import collections
然后我们定义一个辅助方法来处理传递给 safe_substitute()
或 substitute()
方法的参数。 (此方法的内容取自 Python 的 string
模块源):
def get_mapping_from_args(*args, **kws):
if len(args) > 1:
raise TypeError('Too many positional arguments')
if not args:
mapping = kws
elif kws:
mapping = _multimap(kws, args[0])
else:
mapping = args[0]
return mapping
然后我们继续定义我们的扩展模板 class。让我们称之为 class CustomRenameTemplate
。我们编写了一个名为 do_template_based_capitalization()
的辅助方法,它基本上根据您提供的模板模式进行大写。我们确保覆盖 substitute()
和 safe_substitute()
方法来使用它。
class CustomRenameTemplate(Template):
def __init__(self, *args, **kws):
super(CustomRenameTemplate, self).__init__(*args, **kws)
self.orig_template = self.template
self.template = self.template.lower()
def do_template_based_capitalization(self, mapping):
matches = self.pattern.findall(self.orig_template)
for match in matches:
keyword = match[self.pattern.groupindex['braced']-1]
if keyword[0] in uppercase: # First letter is CAPITALIZED
if keyword == keyword.upper(): # Condition for full capitalization
mapping[keyword.lower()] = mapping[keyword.lower()].upper()
else: # Condition for only first letter capitalization
mapping[keyword.lower()] = mapping[keyword.lower()].capitalize()
def safe_substitute(self, *args, **kws):
mapping = get_mapping_from_args(*args, **kws)
self.do_template_based_capitalization(mapping)
return super(CustomRenameTemplate, self).safe_substitute(mapping)
def substitute(self, *args, **kws):
mapping = get_mapping_from_args(*args, **kws)
self.do_template_based_capitalization(mapping)
return super(CustomRenameTemplate, self).substitute(mapping)
我们现在可以使用这个 class。我们继续对您的 convert()
方法做一些细微的修改,以将这个新的 class 付诸实践:
def convert(prefix, name, side, obj_type, user_conv='${Prefix}_${name}_${SIDE}_${type}'):
# Let us parameterize user_conv instead of hardcoding it.
# That makes for better testing, modularity and all that good stuff.
# user_conv = '${Prefix}_${name}_${SIDE}_${type}'
# Assigns keys to strings to be used by the user dictionary.
subs = {'prefix': prefix, 'name': name, 'side': side, 'type': obj_type}
# Converts all of user convention to lowercase, and substitutes the names from subs.
new_name = CustomRenameTemplate(user_conv) # Send the actual template, instead of it's lower()
new_name = new_name.substitute(**subs)
# Strips leading and trailing underscores, and replaces double underscores with a single
new_name = new_name.strip('_')
new_name = new_name.replace('__', '_')
return new_name
这是实际操作:
>>>print convert('bind', 'thigh', 'left', 'joint')
Bind_thigh_LEFT_joint
>>>print convert('bind', 'thigh', 'left', 'joint', user_conv='${prefix}_${name}_${side}_${type}')
bind_thigh_left_joint
>>>print convert('bind', 'thigh', 'left', 'joint', user_conv='${prefix}_${NAme}_${side}_${TYPE}')
bind_Thigh_left_JOINT
更新#1:
如果要处理用户约定中多次出现的下划线_
和可能的特殊字符,只需在convert()
的return
语句之前添加以下行方法:
new_name = re.sub('[^A-Za-z0-9_]+', '', new_name) # This will strip every character NOT ( NOT is denoted by the leading ^) enclosed in the []
new_name = re.sub('_+', '_', new_name) # This will replace one or more occurrences of _ with a single _
注:
剥离特殊字符时需要考虑的重要事项是 Maya egs 使用的特殊字符。对于命名空间表示 :
和层次结构表示 |
。我将由您决定是选择剥离这些,还是用另一个角色替换它们,或者一开始就不接收它们。 return 对象名称的大多数 Maya 命令都有标志来控制名称 returned 的冗长程度(即例如,WITH 命名空间、完整 DAG 路径或其中的 none) .
更新#2:
对于你问题的扩展部分,你问过的地方:
Also the last thing, I figured since a user would be inputting this, it would be more convenient not to be adding brackets and dollar signs. Would it be possible to do something like this?
是的。事实上,为了进一步推广,如果您假设模板字符串仅由字母而不是字母数字组成,您可以再次使用 re
从 user_conv
中提取它们并将它们填充到 ${}
像这样:
user_conv = 'PREFIX_name_Side_TYPE01'
user_conv = re.sub('[A-Za-z]+', '${\g<0>}', user_conv)
>>> print user_conv
>>> ${PREFIX}_${name}_${Side}_${TYPE}01
我们在这里使用了 backreferences 的强大功能,即 \g<group_number>
。查看 docs here 以获取有关正则表达式中反向引用的更多信息。