python 读取文件,抓取符合条件的行

python read file, grapping lines with conditions

假设我有一个文件 my_file,我想要其中的某些行,例如其中每一行输出都是一个列表元素。我试图了解如何控制和使用 Python 文件 i/o 操作。

文件:

cat > my_file <<EOF
[Ignore_these] 
abc
234
[Wow]
123
321
def
[Take_rest]
ghi
jkl
EOF

说,在 [Wow] 行之后,我想合并整数行​​(可以是任意数量的行,这里我得到“123321”)并忽略其余部分,直到我遇到 [Take_rest] 来自我想要剩余的行('ghi' 和 'jkl')- [Take_rest] 始终是最后一部分。所以最终的输出是data = list('123321', 'ghi', 'jkl')。 我尝试了类似以下的操作,但无法理解 readline()next()(等)的工作原理。

def is_int(s):
    try:
        int(s)
        return True
    except ValueError:
        return False


with open('my_file', 'r') as f:
    data = []
    while True:
        line = f.readline()
        if '[Wow]' in line:
            wow = ''
            while is_int(next(f)):
                wow = ''.join([wow, line])
            data.append(wow)
        if '[Take_rest]' in line:
            data.append(next(f))

        if not line:
            break

不要使事情复杂化 - 使用以下方法:

with open('input.txt') as f:
    data = ['']
    wow_flag = False
    for line in f:
        line = line.strip()
        if line.startswith('[Wow]'):   # detect `Wow` section start
            wow_flag = True
        elif line.startswith('[Take_rest]'):  # taking all the rest
            data.extend(list(line.strip() for line in f))
        if wow_flag and line.isdigit():   # capturing digits under `Wow` section
            data[-1] += line

print(data)

输出:

['123321', 'ghi', 'jkl']