pandas dataframe 多行查询
pandas dataframe multiline query
假设我有一个数据框
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
如果我现在尝试使用 query
方法查询它:
这个有效:
df.query('''a > 3 and b < 9''')
这会引发错误:
df.query(
'''
a > 3 and
b < 9
'''
)
我尝试了多种多行字符串的变体,但结果总是出现以下错误:
~/ven/lib/python3.6/site-packages/pandas/core/computation/eval.py in eval(expr, parser, engine, truediv, local_dict, global_dict, resolvers, level, target, inplace)
306 if multi_line and target is None:
307 raise ValueError(
--> 308 "multi-line expressions are only valid in the "
309 "context of data, use DataFrame.eval"
310 )
ValueError: multi-line expressions are only valid in the context of data, use DataFrame.eval
有谁知道如何让它工作?
问题是,实际上我有一个很长的查询要做,而且必须在一行中全部写出来会很不方便。
我知道我可以改用布尔索引,但我的问题只是关于如何使用 query
方法的多行。
谢谢
使用 multi-line 字符反斜杠 ( \
)
例如:
df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
print(df.query(
'''
a > 3 and \
b < 9
'''
))
可以去掉换行符\n
允许多行查询
query_multiline = '''
a > 3 and
b < 9
'''
query_multiline = query_multiline.replace('\n', '')
df.query(query_multiline)
假设我有一个数据框
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
如果我现在尝试使用 query
方法查询它:
这个有效:
df.query('''a > 3 and b < 9''')
这会引发错误:
df.query(
'''
a > 3 and
b < 9
'''
)
我尝试了多种多行字符串的变体,但结果总是出现以下错误:
~/ven/lib/python3.6/site-packages/pandas/core/computation/eval.py in eval(expr, parser, engine, truediv, local_dict, global_dict, resolvers, level, target, inplace)
306 if multi_line and target is None:
307 raise ValueError(
--> 308 "multi-line expressions are only valid in the "
309 "context of data, use DataFrame.eval"
310 )
ValueError: multi-line expressions are only valid in the context of data, use DataFrame.eval
有谁知道如何让它工作?
问题是,实际上我有一个很长的查询要做,而且必须在一行中全部写出来会很不方便。
我知道我可以改用布尔索引,但我的问题只是关于如何使用 query
方法的多行。
谢谢
使用 multi-line 字符反斜杠 ( \
)
例如:
df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
print(df.query(
'''
a > 3 and \
b < 9
'''
))
可以去掉换行符\n
允许多行查询
query_multiline = '''
a > 3 and
b < 9
'''
query_multiline = query_multiline.replace('\n', '')
df.query(query_multiline)