使用 pandas 列表使用 postgresql 查询过滤数据
Use pandas list to filter data using postgresql query
我已经提到了这些帖子 1, 2。我不确定我是否错误地使用了这些帖子中的建议。
基本上,我想在 postgresql 查询中使用我的 pandas 列表(在 Jupyter notebook 中编写)
id_list = [1,2,3,4]
我想在下面的查询中使用我的 id_list
。我尝试了以下 2 个选项
选项-1
df_q = pd.read_sql('select * from tablea where subject_id in {id_list}', con=conn)
选项-2
cur.execute("select * from tablea where subject_id in %s", id_list)
这里的专家能帮我解决如何在查询中直接使用 python 变量吗?
如果你想在 python 中的字符串中使用变量,你只需要在字符串的开头添加 f
这样的
df_q = pd.read_sql(f'select * from tablea where subject_id in {id_list}', con=conn)
这将被翻译成
'select * from tablea where subject_id in [1, 3, 4]'
处理 IN
子句的正确方法是单独构建占位符子句,然后使用参数替换将列表元素绑定到查询:
sql = "select * from tablea where subject_id in ({})"
# Create a string like "%s, %s, %s" with one "%s" per list element
placeholders = ', '.join(['%s'] * len(id_list))
sql = sql.format(placeholders)
# Use parameter substitution to bind values to the query
cur.execute(sql, id_list)
使用字符串格式化或连接(包括 f 字符串)可能会在值被错误转义时导致错误,或者在最坏的情况下使您的数据库暴露于 SQL 注入攻击。
我已经提到了这些帖子 1, 2。我不确定我是否错误地使用了这些帖子中的建议。
基本上,我想在 postgresql 查询中使用我的 pandas 列表(在 Jupyter notebook 中编写)
id_list = [1,2,3,4]
我想在下面的查询中使用我的 id_list
。我尝试了以下 2 个选项
选项-1
df_q = pd.read_sql('select * from tablea where subject_id in {id_list}', con=conn)
选项-2
cur.execute("select * from tablea where subject_id in %s", id_list)
这里的专家能帮我解决如何在查询中直接使用 python 变量吗?
如果你想在 python 中的字符串中使用变量,你只需要在字符串的开头添加 f
这样的
df_q = pd.read_sql(f'select * from tablea where subject_id in {id_list}', con=conn)
这将被翻译成
'select * from tablea where subject_id in [1, 3, 4]'
处理 IN
子句的正确方法是单独构建占位符子句,然后使用参数替换将列表元素绑定到查询:
sql = "select * from tablea where subject_id in ({})"
# Create a string like "%s, %s, %s" with one "%s" per list element
placeholders = ', '.join(['%s'] * len(id_list))
sql = sql.format(placeholders)
# Use parameter substitution to bind values to the query
cur.execute(sql, id_list)
使用字符串格式化或连接(包括 f 字符串)可能会在值被错误转义时导致错误,或者在最坏的情况下使您的数据库暴露于 SQL 注入攻击。