Python 区分大小写的字符串模板

Python String Templating with Case Sensitivity

这是我用来在 Autodesk Maya 中命名节点的命名脚本。然而,这个特定的脚本没有使用任何特定于 Maya 的内容。

我刚才问过我将如何做这样的事情,在哪里可以使用变量约定,然后出现了模板。

所以如果我有这样的约定:

'${prefix}_${name}_${side}_${type}'

我可以传递这些参数:

bind_thigh_left_joint

然后运行他们通过缩写字典(以及用户缩写字典),与场景文件中的相关节点进行检查以确保没有重复,最后得到:bn_thigh_L_jnt

但是我想要这样,如果其中一个键的第一个大写字母,它将使替代大写。

例如,如果 {$prefix} 改为 {$Prefix} thigh 将变为 Thigh,或者如果 {$prefix} 变为 {$PREFIX} thigh 将变为 THIGH。然而,如果它是 {$PREfix} thigh 仍然只是 Thigh。

除了我无法检测按键的个别情况外,我可以很容易地做到这一点。例如,如果字符串是 '${Prefix}_${name}_${SIDE}_${type}' 我如何找到大小写前缀,如果我知道,我将如何将其用于此模板?

请注意,此代码与我拥有的代码不完全一样,我省略了很多其他更具体的 Maya 内容,这只是处理替换本身。

from string import Template
import collections

def convert(prefix, name, side, obj_type):
    user_conv = '${Prefix}_${name}_${SIDE}_${type}'
    # Assigns keys to strings to be used by the user dictionary.
    subs = {'prefix': prefix, 'name': name, 'side': side, 'type': obj_type}

    # Converts all of user convention to lowercase, and substitutes the names from subs.
    new_name = Template(user_conv.lower())
    new_name = new_name.safe_substitute(**subs)
    # Strips leading and trailing underscores, and replaces double underscores with a single
    new_name = new_name.strip('_')
    new_name = new_name.replace('__', '_')

    return new_name

print convert('bind', 'thigh', 'left', 'joint')
>> bind_thigh_left_joint

编辑: 还想去掉多个下划线

所以如果我有类似的东西:

'${prefix}___${name}__${side}_____${type}'

我希望它出来

>> bind_thigh_left_joint

没有

>> bind___thigh__left____joint

还有最后一件事,我想既然用户会输入这个,那么不添加括号和美元符号会更方便。有没有可能做这样的事情?

import re
user_conv = 'PREFIX_name_Side_TYPE01'
# do all filtering, removing of underscores and special characters
templates = ['prefix', 'name', 'side', 'type']
for template in templates:
    if template in user_conv.lower():
        # add bracket and dollar sign around match

>> '${PREFIX}_{name}_{Side}_${TYPE}01'

为您要支持的每个大写创建重复替换。使用 dict.items()dict.iteritems() 循环遍历原始 subs 字典中的 key/value 对。 'KEY': 'VALUE''Key': 'Value' 对很容易用 .upper().title() 创建。

如果支持 'KEy': 'Value' 对您来说真的很重要,可以通过遍历键的索引、拆分、大写第一部分并重新组合来完成。例如,如果 key'Hello'

key[:2].upper() + key[2:]

将是 'HEllo'

然后,照常使用safe_substitute即可。

在这里,我们可以利用 OOP 的力量让模板做我们想做的事。我们可以继续扩展 string.Template class(如 docs 中所建议)。

让我们先导入一些相关的methods/classes:

from string import Template, uppercase, _multimap
import collections

然后我们定义一个辅助方法来处理传递给 safe_substitute()substitute() 方法的参数。 (此方法的内容取自 Python 的 string 模块源):

def get_mapping_from_args(*args, **kws):
    if len(args) > 1:
        raise TypeError('Too many positional arguments')
    if not args:
        mapping = kws
    elif kws:
        mapping = _multimap(kws, args[0])
    else:
        mapping = args[0]             
    return mapping

然后我们继续定义我们的扩展模板 class。让我们称之为 class CustomRenameTemplate。我们编写了一个名为 do_template_based_capitalization() 的辅助方法,它基本上根据您提供的模板模式进行大写。我们确保覆盖 substitute()safe_substitute() 方法来使用它。

class CustomRenameTemplate(Template):    
    def __init__(self, *args, **kws):        
        super(CustomRenameTemplate, self).__init__(*args, **kws)
        self.orig_template = self.template
        self.template = self.template.lower()    

    def do_template_based_capitalization(self, mapping):
        matches = self.pattern.findall(self.orig_template)
        for match in matches:
            keyword = match[self.pattern.groupindex['braced']-1]
            if keyword[0] in uppercase:  # First letter is CAPITALIZED
                if keyword == keyword.upper():  # Condition for full capitalization
                    mapping[keyword.lower()] = mapping[keyword.lower()].upper()
                else:  # Condition for only first letter capitalization
                    mapping[keyword.lower()] = mapping[keyword.lower()].capitalize()   

    def safe_substitute(self, *args, **kws):
        mapping = get_mapping_from_args(*args, **kws)
        self.do_template_based_capitalization(mapping)
        return super(CustomRenameTemplate, self).safe_substitute(mapping)

    def substitute(self, *args, **kws):
        mapping = get_mapping_from_args(*args, **kws)
        self.do_template_based_capitalization(mapping)
        return super(CustomRenameTemplate, self).substitute(mapping)

我们现在可以使用这个 class。我们继续对您的 convert() 方法做一些细微的修改,以将这个新的 class 付诸实践:

def convert(prefix, name, side, obj_type, user_conv='${Prefix}_${name}_${SIDE}_${type}'):
    # Let us parameterize user_conv instead of hardcoding it.
    # That makes for better testing, modularity and all that good stuff.
    # user_conv = '${Prefix}_${name}_${SIDE}_${type}'
    # Assigns keys to strings to be used by the user dictionary.
    subs = {'prefix': prefix, 'name': name, 'side': side, 'type': obj_type}

    # Converts all of user convention to lowercase, and substitutes the names from subs.
    new_name = CustomRenameTemplate(user_conv)  # Send the actual template, instead of it's lower()
    new_name = new_name.substitute(**subs)

    # Strips leading and trailing underscores, and replaces double underscores with a single
    new_name = new_name.strip('_')
    new_name = new_name.replace('__', '_')

    return new_name

这是实际操作:

>>>print convert('bind', 'thigh', 'left', 'joint')
Bind_thigh_LEFT_joint

>>>print convert('bind', 'thigh', 'left', 'joint', user_conv='${prefix}_${name}_${side}_${type}')
bind_thigh_left_joint

>>>print convert('bind', 'thigh', 'left', 'joint', user_conv='${prefix}_${NAme}_${side}_${TYPE}')
bind_Thigh_left_JOINT

更新#1:

如果要处理用户约定中多次出现的下划线_和可能的特殊字符,只需在convert()return语句之前添加以下行方法:

new_name = re.sub('[^A-Za-z0-9_]+', '', new_name)  # This will strip every character NOT ( NOT is denoted by the leading ^) enclosed in the []
new_name = re.sub('_+', '_', new_name)  # This will replace one or more occurrences of _ with a single _

注: 剥离特殊字符时需要考虑的重要事项是 Maya egs 使用的特殊字符。对于命名空间表示 : 和层次结构表示 |。我将由您决定是选择剥离这些,还是用另一个角色替换它们,或者一开始就不接收它们。 return 对象名称的大多数 Maya 命令都有标志来控制名称 returned 的冗长程度(即例如,WITH 命名空间、完整 DAG 路径或其中的 none) .

更新#2:

对于你问题的扩展部分,你问过的地方:

Also the last thing, I figured since a user would be inputting this, it would be more convenient not to be adding brackets and dollar signs. Would it be possible to do something like this?

是的。事实上,为了进一步推广,如果您假设模板字符串仅由字母而不是字母数字组成,您可以再次使用 reuser_conv 中提取它们并将它们填充到 ${} 像这样:

user_conv = 'PREFIX_name_Side_TYPE01'
user_conv = re.sub('[A-Za-z]+', '${\g<0>}', user_conv)

>>> print user_conv
>>> ${PREFIX}_${name}_${Side}_${TYPE}01

我们在这里使用了 backreferences 的强大功能,即 \g<group_number>。查看 docs here 以获取有关正则表达式中反向引用的更多信息。