从 pandas 数据框中另一列中的值创建变量

Create variables from values in another column in a pandas dataframe

我有一个看似相当简单的问题,但无法解决这些问题。

我有一个 pandas 推文数据框。用户的位置以各种方式注册在名为“Location”的变量中:

当位置记录得很好时,我经常得到:

{'country_code': 'tr', 'state': 'Central Anatolia Region', 'county': 'Çankaya', 'city': 'Ankara'}

('country_code': 'tr', 'state': 'Black Sea Region', 'city': 'Trabzon'}

但有时,我得到的只是:

{'country_code': 'tr'}

('country_code': 'tr', 'state': 'Batman'}

通常,什么也没有,所有注册的都是这样的:

{}

我想编写一个脚本,可以在我的 pandas 数据框中为这些单独的值创建新变量。换句话说,如果为特定行注册了 country_code,那么我希望将有问题的值记录在名为 country_code 的变量中。对于州、县和市,依此类推。如果什么都没有,它可以简单地为所有有问题的缺失变量(县、州、市)输入空白或 NA。

最终结果应该是我的数据框中有四个新变量:国家代码、州、县和城市,基于在“Location”变量中注册的值,注册了一些东西(或什么都没有)对于这些值。

有人可以帮忙吗?

非常感谢!

我能够通过直接使用原始 JSON 文件来解决问题。我所做的只是通过使用类似于其他人建议 here 的 for 和 if 循环,将位置数据存储到我正在寻找的不同类别中。我这样做而不是尝试使用 pandas 特定函数将变量“Location”中注册的数据存储到我数据集中的不同变量中。