更改 Python 中的数据集
Change Dataset in Python
我有这样的数据集
index data data_list label
A i love pyhton. ['i love python.', [1,0]
pyhton very useful. 'python very useful.']
B i like tea. tea ['i like tea.','tea [0,1]
make me happy. make me happy.']
我想像下面这样安排数据集
index data data_list label
A i love pyhton. i love python. 1
pyhton very useful.
A i love pyhton. python very useful. 0
pyhton very useful.
B i like tea. tea i like tea. 0
make me happy.
B i like tea. tea tea make me happy. 1
make me happy.
但是,我不知道如何解决这个问题。任何人都可以帮忙吗?谢谢你的时间。
你可以试试pandas.DataFrame.explode
。文档 here.
你想要的是一个叫做 explode function.Which 的东西,基本上是扩展、可交互并创建一个按元素行分组的基本索引。只需执行以下代码行。
df.explode(['data_list','label'])
我有这样的数据集
index data data_list label
A i love pyhton. ['i love python.', [1,0]
pyhton very useful. 'python very useful.']
B i like tea. tea ['i like tea.','tea [0,1]
make me happy. make me happy.']
我想像下面这样安排数据集
index data data_list label
A i love pyhton. i love python. 1
pyhton very useful.
A i love pyhton. python very useful. 0
pyhton very useful.
B i like tea. tea i like tea. 0
make me happy.
B i like tea. tea tea make me happy. 1
make me happy.
但是,我不知道如何解决这个问题。任何人都可以帮忙吗?谢谢你的时间。
你可以试试pandas.DataFrame.explode
。文档 here.
你想要的是一个叫做 explode function.Which 的东西,基本上是扩展、可交互并创建一个按元素行分组的基本索引。只需执行以下代码行。
df.explode(['data_list','label'])