如何合并 pandas 中的两个数据框?
How to merge two data frames in pandas?
我有两个 pandas 数据帧
Unnamed: 0 sentiment numberagreed tweetid tweet
0 0 2 6 219584 Apple processa a Samsung no Japão - Notícias -...
1 1 1 3 399249 É O JACKI CHAN !!! RT @user ESSE É DOS MEUS!!!...
2 2 3 3 387155 Eras o samsung galaxy tab e muito lerdo para t...
3 3 3 3 205458 Dizem que a coisa mais triste que o homem enfr...
4 4 3 3 2054404 RAIVA vou ter que ir com meu nike dinovo pra e...
tweetid sent
219584 0.494428
399249 0.789241
387155 0.351972
205458 0.396907
2054404 0.000000
它们的长度不一样,第二个数据框中有一些缺失值
我想根据 tweetid
合并两个数据框并删除缺失值
使用pd.merge
pd.merge(left=df1, right=df2, on='tweetid', how='inner')
因为你拿了inner
,不重叠的部分会被扔掉。 on='tweetid'
将其合并到 tweetid
。
您的文件开头的某处可能有一个额外的字符。您是从 csv 文件中读取数据吗? Post 您如何读取数据的源代码。
或在两个数据框上命名您的列。
df_tweets.columns = ("tweetid", "sent")
我有两个 pandas 数据帧
Unnamed: 0 sentiment numberagreed tweetid tweet
0 0 2 6 219584 Apple processa a Samsung no Japão - Notícias -...
1 1 1 3 399249 É O JACKI CHAN !!! RT @user ESSE É DOS MEUS!!!...
2 2 3 3 387155 Eras o samsung galaxy tab e muito lerdo para t...
3 3 3 3 205458 Dizem que a coisa mais triste que o homem enfr...
4 4 3 3 2054404 RAIVA vou ter que ir com meu nike dinovo pra e...
tweetid sent
219584 0.494428
399249 0.789241
387155 0.351972
205458 0.396907
2054404 0.000000
它们的长度不一样,第二个数据框中有一些缺失值
我想根据 tweetid
合并两个数据框并删除缺失值
使用pd.merge
pd.merge(left=df1, right=df2, on='tweetid', how='inner')
因为你拿了inner
,不重叠的部分会被扔掉。 on='tweetid'
将其合并到 tweetid
。
您的文件开头的某处可能有一个额外的字符。您是从 csv 文件中读取数据吗? Post 您如何读取数据的源代码。
或在两个数据框上命名您的列。
df_tweets.columns = ("tweetid", "sent")