在 python 中使用字典将参数传递给 postgresql 语句

Using a dictionary to pass parameters to postgresql statement in python

我定义了一个字典,其中包含几个参数及其值,最终将用于构建 SQL 查询

query_params = collections.OrderedDict(
        {'table_name':'publilc.churn_data',
         'date_from':'201712',
         'date_to':'201805',
         'class_target':'NPA'
      })

参数将在以下查询中使用:

sql_data_sample = str("""select * from %s # get value of table_name
                                    where dt = %s    #get value of date_from
                                    and target in ('ACTIVE')

                        ----------------------------------------------------
                        union all
                        ----------------------------------------------------
                        (select * from %s #get value of table_name
                                 where dt = %s #get value of date_to
                                 and target in (%s));""") #get value of class_target
                                    %("'"+.join(str(list(query_params.values())[0])) + "'" + 
                                    "'"+.join(list(query_params.values())[1]) + "'" + 
                                    "'"+.join(list(query_params.values())[2]) + "'" +
                                    "'"+.join(list(query_params.values())[3]) + "'" )

然而,这给我一个缩进错误,如下所示:

get_ipython().run_line_magic('("\'"+.join(list(query_params.values())[0])', '+ "\'"')
    ^
IndentationError: unexpected indent

查询最终应如下所示:

select *from public.churn_data
        where dt = '201712'
        and target in ('ACTIVE')

----------------------------------------------------
union all
----------------------------------------------------
 (select * from public.churn_data 
            where dt = '201805'
            and target in ('NPA'));

由于 public,我无法找出错误的来源 is.Is。在 table_name? 有人可以帮我解决这个问题吗?

您可以使用以下代码来消除缩进错误

sql_data_sample = str("""
select * from %s
where dt = %s
and target in ('ACTIVE')
----------------------------------------------------
union all
----------------------------------------------------
(select * from %s
where dt = %s
and target in (%s));""" %(
    "'" + str(list(query_params.values())[0]) + "'" +
    "'" + list(query_params.values())[1] + "'" +
    "'" + list(query_params.values())[2] + "'" +
    "'" + list(query_params.values())[3] + "'"
))

但你需要再传递一个参数,因为你使用了 %s 5 次,但参数只有 4 个

请使用the docs

中所述的参数化查询

既然你已经有了一个字典,你可以这样做:

sql_data_sample = """select * from %(table_name)s
           where dt = %(date_from)s
           and target in ('ACTIVE')
           ----------------------------------------------------
           union all
           ----------------------------------------------------
           (select * from %(table_name)s
           where dt = %(date_to)s
           and target in (%(class_target)s));"""

cur.execute(sql_data_sample, query_params)

我还没有测试过是否可以使用命令字典,但我认为应该可以。如果没有,您可以在将有序字典作为参数映射传递之前将其设为常规字典。

EDIT 除非你以后需要你的参数成为 OrderedDict,否则请使用常规字典。据我所知,您只选择了 OrderedDict 来保留 list(query_params.values())[0].

的值顺序

EDIT2 Table 名称和字段名称不能使用绑定传递。 Antoine Dusséaux 在 this answer 中指出,自 2.7 版以来,psycopg2 提供了一种或多或少安全的方法。

from psycopg2 import sql

sql_data_sample = """select * from {0}
           where dt = %(date_from)s
           and target in ('ACTIVE')
           ----------------------------------------------------
           union all
           ----------------------------------------------------
           (select * from {0}
           where dt = %(date_to)s
           and target in (%(class_target)s));"""

cur.execute(sql.SQL(sql_data_sample)
                .format(sql.Identifier(query_params['table_name'])), 
            query_params)

您可能必须从您的字典中删除 table_name,我不确定 psycopg2 如何对参数字典中的其他项目做出反应,我现在无法对其进行测试。

需要指出的是,这仍然存在 SQL 注入的风险,除非绝对必要,否则应避免。通常,table 和字段名称是查询字符串中相当固定的部分。

这是相关的 documentation for the sqlmodule