Python numpy.genfromtxt

Python numpy.genfromtxt

有谁知道,我如何可以跳过我尝试使用 numpy.genfromtxt 读取的文本文件中的括号 我的数据文件格式为

1.466 ((5.68 3.3 45.7)(4.5 6.7 9.5))

np.genfromtxt 可以接受迭代器:

import numpy as np
import re

with open('data', 'r') as f:
    lines = (line.replace('(',' ').replace(')',' ') for line in f)
    arr = np.genfromtxt(lines)
print(arr)

产量

[  1.466   5.68    3.3    45.7     4.5     6.7     9.5  ]

或者,您可以使用(在 Python2 中)str.translate 或(在 Python3 中)bytes.translate 方法,这会更快一些:

import numpy as np
import re

try:
    # Python2
    import string
    table = string.maketrans('()','  ')
except AttributeError:
    # Python3
    table = bytes.maketrans(b'()',b'  ')

with open('data', 'rb') as f:
    lines = (line.translate(table) for line in f)
    arr = np.genfromtxt(lines)
print(arr)