写入检查所有 pandas DataFrame 列值是否满足特定值?
Writing check that all pandas DataFrame column values meet a certain values?
我正在为软件包开具支票。 pandas DataFrame 中的元素满足特定条件;如果他们不这样做,我将提出一个写在 Python 中的 ValueError
异常。
这是一个例子pandas DataFrame:
import pandas as pd
import numpy as np
dict1 = {'file': ['filename2', 'filename2', 'filename3', 'filename4',
'filename4', 'filename3'], 'amount': [3, 4, 5, 1, 2, 1],
'front': [21889611, 36357723, 196312, 11, 42, 1992],
'back':[21973805, 36403870, 277500, 19, 120, 3210],
'type':['A', 'A', 'A', 'B', 'B', 'C']}
df1 = pd.DataFrame(dict1)
print(df1)
file amount front back type
0 filename2 3 21889611 21973805 A
1 filename2 4 36357723 36403870 A
2 filename3 5 196312 277500 A
3 filename4 1 11 19 B
4 filename4 2 42 120 B
5 filename3 1 1992 3210 C
我见过的检查某些值的最有效方法是使用 sets
,例如如果列 type
包含不是 A
、B
或 C
的元素,则抛出错误:
if not set(['A', 'B', 'C']).issubset(df1['type']):
raise ValueError('Pandas DataFrame contains improper values in "type" column')
问题:
我如何最有效地检查条件?例如我想检查 amount
列是否包含大于 0 的整数。如果此列中有任何零、负整数或非整数,请提出 ValueError()
。
您可以只对列进行过滤,获取返回的数据帧的长度并在您的 if 语句中使用它:
len(df1[df1['amount'] > 0])
我正在为软件包开具支票。 pandas DataFrame 中的元素满足特定条件;如果他们不这样做,我将提出一个写在 Python 中的 ValueError
异常。
这是一个例子pandas DataFrame:
import pandas as pd
import numpy as np
dict1 = {'file': ['filename2', 'filename2', 'filename3', 'filename4',
'filename4', 'filename3'], 'amount': [3, 4, 5, 1, 2, 1],
'front': [21889611, 36357723, 196312, 11, 42, 1992],
'back':[21973805, 36403870, 277500, 19, 120, 3210],
'type':['A', 'A', 'A', 'B', 'B', 'C']}
df1 = pd.DataFrame(dict1)
print(df1)
file amount front back type
0 filename2 3 21889611 21973805 A
1 filename2 4 36357723 36403870 A
2 filename3 5 196312 277500 A
3 filename4 1 11 19 B
4 filename4 2 42 120 B
5 filename3 1 1992 3210 C
我见过的检查某些值的最有效方法是使用 sets
,例如如果列 type
包含不是 A
、B
或 C
的元素,则抛出错误:
if not set(['A', 'B', 'C']).issubset(df1['type']):
raise ValueError('Pandas DataFrame contains improper values in "type" column')
问题:
我如何最有效地检查条件?例如我想检查 amount
列是否包含大于 0 的整数。如果此列中有任何零、负整数或非整数,请提出 ValueError()
。
您可以只对列进行过滤,获取返回的数据帧的长度并在您的 if 语句中使用它:
len(df1[df1['amount'] > 0])