使用 to_sql 将数据附加到 pandas 中已经存在的 table

append the data to already existing table in pandas using to_sql

我有以下数据框

ipdb> csv_data
  country    sale        date  trans_factor
0   India  403171  12/01/2012             1
1  Bhutan  394096  12/01/2012             2
2   Nepal   super  12/01/2012             3
3  madhya  355883  12/01/2012             4
4   sudan     man  12/01/2012             5

截至目前,我正在使用以下代码在 table 中插入数据,如果 table 已经存在,则删除它并创建新的 table

csv_file_path = data_mapping_record.csv_file_path
original_csv_header = pandas.read_csv(csv_file_path).columns.tolist()
csv_data = pandas.read_csv(csv_file_path, skiprows=[0], names=original_csv_header, infer_datetime_format=True)
table_name = data_mapping_record.csv_file_path.split('/')[-1].split('.')[0]
engine = create_engine(
    'postgresql://username:password@localhost:5432/pandas_data')

# Delete table if already exits
engine.execute("""DROP TABLE IF EXISTS "%s" """ % (table_name))

# Write the pandas dataframe to database using sqlalchemy and pands.to_sql
csv_data_frame.to_sql(table_name, engine, chunksize=1000)

但我需要的是,不删除 table,如果 table 已经存在,只需将数据附加到已经存在的数据,pandas to_sql 方法 ?

IIUC 你可以简单地使用 if_exists='append' 参数:

csv_data_frame.to_sql(table_name, engine, if_exists='append', chunksize=1000)

来自 docs:

if_exists : {‘fail’, ‘replace’, ‘append’}, default ‘fail’

fail: If table exists, do nothing.

replace: If table exists, drop it, recreate it, and insert data.

append: If table exists, insert data. Create if does not exist.