pandas 分配新的列名作为字符串
pandas assign with new column name as string
我最近发现 pandas "assign" method 我觉得它非常优雅。
我的问题是新列的名称被指定为关键字,因此其中不能有空格或破折号。
df = DataFrame({'A': range(1, 11), 'B': np.random.randn(10)})
df.assign(ln_A = lambda x: np.log(x.A))
A B ln_A
0 1 0.426905 0.000000
1 2 -0.780949 0.693147
2 3 -0.418711 1.098612
3 4 -0.269708 1.386294
4 5 -0.274002 1.609438
5 6 -0.500792 1.791759
6 7 1.649697 1.945910
7 8 -1.495604 2.079442
8 9 0.549296 2.197225
9 10 -0.758542 2.302585
但是如果我想将新列命名为 "ln(A)" 怎么办?
例如。
df.assign(ln(A) = lambda x: np.log(x.A))
df.assign("ln(A)" = lambda x: np.log(x.A))
File "<ipython-input-7-de0da86dce68>", line 1
df.assign(ln(A) = lambda x: np.log(x.A))
SyntaxError: keyword can't be an expression
我知道我可以在 .assign 调用后立即重命名该列,但我想了解有关此方法及其语法的更多信息。
assign
需要一堆关键字参数。反过来,它会为列分配关键字的名称。这很方便,但您不能将表达式作为关键字传递。 @EdChum 在评论中用 link
阐明了这一点
使用 insert
代替就地转换
df.insert(2, 'ln(A)', np.log(df.A))
df
如果你不想就地使用concat
pd.concat([df, np.log(df.A).rename('log(A)')], axis=1)
您可以将关键字参数作为字典传递给 assign
,如下所示:
kwargs = {"ln(A)" : lambda x: np.log(x.A)}
df.assign(**kwargs)
A B ln(A)
0 1 0.500033 0.000000
1 2 -0.392229 0.693147
2 3 0.385512 1.098612
3 4 -0.029816 1.386294
4 5 -2.386748 1.609438
5 6 -1.828487 1.791759
6 7 0.096117 1.945910
7 8 -2.867469 2.079442
8 9 -0.731787 2.197225
9 10 -0.686110 2.302585
我最近发现 pandas "assign" method 我觉得它非常优雅。 我的问题是新列的名称被指定为关键字,因此其中不能有空格或破折号。
df = DataFrame({'A': range(1, 11), 'B': np.random.randn(10)})
df.assign(ln_A = lambda x: np.log(x.A))
A B ln_A
0 1 0.426905 0.000000
1 2 -0.780949 0.693147
2 3 -0.418711 1.098612
3 4 -0.269708 1.386294
4 5 -0.274002 1.609438
5 6 -0.500792 1.791759
6 7 1.649697 1.945910
7 8 -1.495604 2.079442
8 9 0.549296 2.197225
9 10 -0.758542 2.302585
但是如果我想将新列命名为 "ln(A)" 怎么办? 例如。
df.assign(ln(A) = lambda x: np.log(x.A))
df.assign("ln(A)" = lambda x: np.log(x.A))
File "<ipython-input-7-de0da86dce68>", line 1
df.assign(ln(A) = lambda x: np.log(x.A))
SyntaxError: keyword can't be an expression
我知道我可以在 .assign 调用后立即重命名该列,但我想了解有关此方法及其语法的更多信息。
assign
需要一堆关键字参数。反过来,它会为列分配关键字的名称。这很方便,但您不能将表达式作为关键字传递。 @EdChum 在评论中用 link
使用 insert
代替就地转换
df.insert(2, 'ln(A)', np.log(df.A))
df
如果你不想就地使用concat
pd.concat([df, np.log(df.A).rename('log(A)')], axis=1)
您可以将关键字参数作为字典传递给 assign
,如下所示:
kwargs = {"ln(A)" : lambda x: np.log(x.A)}
df.assign(**kwargs)
A B ln(A)
0 1 0.500033 0.000000
1 2 -0.392229 0.693147
2 3 0.385512 1.098612
3 4 -0.029816 1.386294
4 5 -2.386748 1.609438
5 6 -1.828487 1.791759
6 7 0.096117 1.945910
7 8 -2.867469 2.079442
8 9 -0.731787 2.197225
9 10 -0.686110 2.302585