带有字母数组的 DataFrame
DataFrame with array of Letters
data['Ln']
Out[46]:
0 [C, C, C, C, C, C, G, I, O, P, P, P, R, R, R, ...
1 [C, C, C, C, C, C, G, I, O, P, P, P, R, R, R, ...
2 [C, C, C, C, C, C, G, I, O, P, P, R, R, R, R, ...
3 [C, C, C, C, C, C, G, I, O, P, P, R, R, R, R, ...
4 [C, C, C, C, C, C, G, I, O, P, P, P, R, R, R, ...
...
43244 [G, I, O, P, P, P, R, R, R, R]
43245 [G, I, O, P, P, P, R, R, R, R]
43246 [G, I, O, P, P, R, R, R]
43247 [G, I, O, P, P, R, R, R]
43248 [G, I, O, P, R, R]
Name: Ln, Length: 43249, dtype: object
我如何构造一个 for 循环来遍历每一行,以及使用 sklearn.preprocessing.LebelEncoding 或 ord() 遍历每个字母?
例如,我希望每一行中的每个 'C' 都是相同的数字,以及 G、I 等
创建字典然后映射它
alphabet_dict = {'C': 0, 'G': 1, }
data['Ln'].map(lambda x: [alphabet_dict.get(i) for i in x])
0 [0, 0, 0, 0, 0]
1 [1, 1, 1, 1, 1]
data['Ln']
Out[46]:
0 [C, C, C, C, C, C, G, I, O, P, P, P, R, R, R, ...
1 [C, C, C, C, C, C, G, I, O, P, P, P, R, R, R, ...
2 [C, C, C, C, C, C, G, I, O, P, P, R, R, R, R, ...
3 [C, C, C, C, C, C, G, I, O, P, P, R, R, R, R, ...
4 [C, C, C, C, C, C, G, I, O, P, P, P, R, R, R, ...
...
43244 [G, I, O, P, P, P, R, R, R, R]
43245 [G, I, O, P, P, P, R, R, R, R]
43246 [G, I, O, P, P, R, R, R]
43247 [G, I, O, P, P, R, R, R]
43248 [G, I, O, P, R, R]
Name: Ln, Length: 43249, dtype: object
我如何构造一个 for 循环来遍历每一行,以及使用 sklearn.preprocessing.LebelEncoding 或 ord() 遍历每个字母?
例如,我希望每一行中的每个 'C' 都是相同的数字,以及 G、I 等
创建字典然后映射它
alphabet_dict = {'C': 0, 'G': 1, }
data['Ln'].map(lambda x: [alphabet_dict.get(i) for i in x])
0 [0, 0, 0, 0, 0]
1 [1, 1, 1, 1, 1]