如何使用 pandas 对 csv 文件中的相同国家/地区求和
How to sum same countries in a csv file using pandas
我有一个 csv 文件,其中包含“计数”和“国家/地区”列。有很多 Count 和 Country 列,但这是我将在下面编写的示例。
Country Count Country Count
Japan 654 Japan 566
US 90 US 90
我想要结果:
Country Total Count
Japan 1220
US 180
如何在 pandas 中添加代码:
import pandas as pd
df = pd.read_csv('/Users/giyan/Desktop/monthly report/geoip/finalsumgeoip.csv')
df['Total Count'] = df.filter(like='Count').sum(axis=1).astype(int)
df = df[['Country','Total Count']]
df.to_csv('podapoda.txt', sep='\t', encoding='utf-8')
您可以为此使用 loc 方法。你可以用这个替换你的过滤器行:
df['Total count'] = df.loc[df['A'] =df['C'],['B','D']].sum(axis=1)
我有一个 csv 文件,其中包含“计数”和“国家/地区”列。有很多 Count 和 Country 列,但这是我将在下面编写的示例。
Country Count Country Count
Japan 654 Japan 566
US 90 US 90
我想要结果:
Country Total Count
Japan 1220
US 180
如何在 pandas 中添加代码:
import pandas as pd
df = pd.read_csv('/Users/giyan/Desktop/monthly report/geoip/finalsumgeoip.csv')
df['Total Count'] = df.filter(like='Count').sum(axis=1).astype(int)
df = df[['Country','Total Count']]
df.to_csv('podapoda.txt', sep='\t', encoding='utf-8')
您可以为此使用 loc 方法。你可以用这个替换你的过滤器行:
df['Total count'] = df.loc[df['A'] =df['C'],['B','D']].sum(axis=1)