解析可选的范围列表

Question

我的脚本需要采用一个选项，后跟一个页面列表，指定为以逗号分隔的范围列表，并处理扩展的页面列表。所以，例如，

script.py -a 2,4-6,9,10-13

应该得到列表

[2, 4, 5, 6, 9, 10, 11, 12, 13]

一起工作。目前我正在这样做：

import argparse

def getList(argument):
    ranges = list(argument.split(","))
    newRange = []
    for theRange in ranges:
        subRange = list(map(int, theRange.split("-")))
        if (len(subRange) > 1):
            newRange.extend(range(subRange[0], subRange[1] + 1))
        else:
            newRange.extend(subRange)
    newRange.sort()
    return newRange

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("-a", "--pages", type=getList, dest="pages", default=[], help="pages to process")
    args = parser.parse_args()

它有效，但我对这个 Python 比较陌生，想知道是否有更好的方法来做到这一点？

编辑：我不明白为什么它被标记为重复问题。 None 被标记为重复的问题的答案完全符合我上面描述的内容。这个想法是 而不是 来处理一个简单的列表 space- 或逗号分隔的参数，但更复杂的东西 - 一个必须扩展的范围列表。

Answer 1

这是一种解决方案。它不一定是最好的。特别是，可能有一个涉及链式迭代器而不是嵌套迭代器的性能更高的版本。

鉴于：

>>> range='2,4-6,9,10-13'

你可以这样做：

>>> result = [range(int(y[0]), int(y[1])+1) 
... for y in [(x.split('-') + [x])[:2]
... for x in r.split(',')]]

哪个让你：

>>> result
[[2], [4, 5, 6], [9], [10, 11, 12, 13]]

如果我们解包这些推导式，最里面的推导式会迭代：

>>> range.split(',')
['2', '4-6', '9', '10-13']

第二个是：

>>> result = range.split(',')
>>> [(x.split('-') + [x])[:2] for x in result]
[['2', '2'], ['4', '6'], ['9', '9'], ['10', '13']]

表达式 (x.split('-') + [x])[:2] 确保我们有一个包含两项的列表，即使是单个数字，这样我们就可以将其传递给 range 函数。

最后，我们迭代该结果：

>>> [range(int(y[0]), int(y[1])+1) for y in <the result from the rpevious operation]

这很明显。给定列表 [2, 2]，我们调用 range(2, 3) 得到 [2]。应用于之前操作的所有结果，这让我们得到了我们之前看到的结果：

[[2], [4, 5, 6], [9], [10, 11, 12, 13]]

现在你的问题是 "how do I flatten a list"，其中一个解决方案（来自 here）是：

>>> import itertools
>>> list(itertools.chain.from_iterable(result))
[2, 4, 5, 6, 9, 10, 11, 12, 13]

解析可选的范围列表

Parsing an optional list of ranges

python

argparse