根据列表中的值提取列值
Extracting columns values based on values in a list
我需要根据我在列表中提取的另一列的值从数据框中的一列中提取值。
import pandas as pd
data = [[1, 'john', 'kelly'], [2, 'john', 'raj'], [2, 'john', 'leonard'], [3, 'penny', 'stuart'], [3, 'penny', 'halley'], [3, 'penny', 'amy'], [4, 'sheldon', 'will'], [4, 'sheldon', 'richard']]
school = pd.DataFrame(data, columns=['teacher_id', 'teacher_name', 'student_name'])
print(school)
这是我的数据框。
teacher_id teacher_name student_name
0 1 john kelly
1 2 john raj
2 2 john leonard
3 3 penny stuart
4 3 penny halley
5 3 penny amy
6 4 sheldon will
7 4 sheldon richard
我从这个数据框中提取了出现次数最多的 teacher_id。
school.teacher_id.value_counts().head()
> 3 3
2 2
4 2
1 1
现在使用上面的值(teacher_id)我怎样才能得到老师的名字?
而不是使用:-
school.teacher_id.value_counts().head()
使用这个:-
school[['teacher_id','teacher_name']].value_counts().head()
或
你可以使用groupby()
方法:-
school.groupby('teacher_id')['teacher_name'].value_counts().head()
我需要根据我在列表中提取的另一列的值从数据框中的一列中提取值。
import pandas as pd
data = [[1, 'john', 'kelly'], [2, 'john', 'raj'], [2, 'john', 'leonard'], [3, 'penny', 'stuart'], [3, 'penny', 'halley'], [3, 'penny', 'amy'], [4, 'sheldon', 'will'], [4, 'sheldon', 'richard']]
school = pd.DataFrame(data, columns=['teacher_id', 'teacher_name', 'student_name'])
print(school)
这是我的数据框。
teacher_id teacher_name student_name
0 1 john kelly
1 2 john raj
2 2 john leonard
3 3 penny stuart
4 3 penny halley
5 3 penny amy
6 4 sheldon will
7 4 sheldon richard
我从这个数据框中提取了出现次数最多的 teacher_id。
school.teacher_id.value_counts().head()
> 3 3
2 2
4 2
1 1
现在使用上面的值(teacher_id)我怎样才能得到老师的名字?
而不是使用:-
school.teacher_id.value_counts().head()
使用这个:-
school[['teacher_id','teacher_name']].value_counts().head()
或
你可以使用groupby()
方法:-
school.groupby('teacher_id')['teacher_name'].value_counts().head()