创建一个以字典中的列表作为值的 DataFrame
Creating a DataFrame with lists within dictionary as value
我正在从一个网站上抓取数据,该网站有多个主要类别,其中有多个次要类别。我完成了抓取部分,但我不确定如何以正确的方式存储数据,以便在将数据转换为 DataFrame 对象时正确显示数据。
这是我所拥有的数据的细分:
主要类别列表 -> 子类别列表 -> 与该子类别对应的链接列表
categories = ['Cat1', 'Cat2', ...]
subcat = ['Subcat1', 'Subcat2', ...] etc
这是抓取数据时的最终输出。我的问题是,我怎样才能建立一个数据框,让它最终变成这样:
Category1 Category2
Subcat1 Link1 Subcat1 Link1
Subcat2 Link2 Subcat2 Link2
我想过将数据存储在一个字典列表中,并在每个字典中存储一个子类别列表,但它显示不正确。
我认为实现此目的的最佳方法是使用多个索引。请参考https://pandas.pydata.org/docs/user_guide/advanced.html#hierarchical-indexing-multiindex
我正在从一个网站上抓取数据,该网站有多个主要类别,其中有多个次要类别。我完成了抓取部分,但我不确定如何以正确的方式存储数据,以便在将数据转换为 DataFrame 对象时正确显示数据。
这是我所拥有的数据的细分:
主要类别列表 -> 子类别列表 -> 与该子类别对应的链接列表
categories = ['Cat1', 'Cat2', ...]
subcat = ['Subcat1', 'Subcat2', ...] etc
这是抓取数据时的最终输出。我的问题是,我怎样才能建立一个数据框,让它最终变成这样:
Category1 Category2
Subcat1 Link1 Subcat1 Link1
Subcat2 Link2 Subcat2 Link2
我想过将数据存储在一个字典列表中,并在每个字典中存储一个子类别列表,但它显示不正确。
我认为实现此目的的最佳方法是使用多个索引。请参考https://pandas.pydata.org/docs/user_guide/advanced.html#hierarchical-indexing-multiindex