使用 pandas 列表使用 postgresql 查询过滤数据

Use pandas list to filter data using postgresql query

我已经提到了这些帖子 1, 2。我不确定我是否错误地使用了这些帖子中的建议。

基本上,我想在 postgresql 查询中使用我的 pandas 列表(在 Jupyter notebook 中编写)

id_list = [1,2,3,4]

我想在下面的查询中使用我的 id_list。我尝试了以下 2 个选项

选项-1

df_q = pd.read_sql('select * from tablea where subject_id in {id_list}', con=conn)

选项-2

cur.execute("select * from tablea where subject_id in %s", id_list)

这里的专家能帮我解决如何在查询中直接使用 python 变量吗?

如果你想在 python 中的字符串中使用变量,你只需要在字符串的开头添加 f 这样的

df_q = pd.read_sql(f'select * from tablea where subject_id in {id_list}', con=conn)

这将被翻译成 'select * from tablea where subject_id in [1, 3, 4]'

处理 IN 子句的正确方法是单独构建占位符子句,然后使用参数替换将列表元素绑定到查询:

sql = "select * from tablea where subject_id in ({})"
# Create a string like "%s, %s, %s" with one "%s" per list element
placeholders = ', '.join(['%s'] * len(id_list))
sql = sql.format(placeholders)
# Use parameter substitution to bind values to the query
cur.execute(sql, id_list)

使用字符串格式化或连接(包括 f 字符串)可能会在值被错误转义时导致错误,或者在最坏的情况下使您的数据库暴露于 SQL 注入攻击。