海洋 load_dataset

Seaborn load_dataset

我正在尝试根据 example

使用 Seaborn 制作分组箱线图

我可以让上面的例子工作,但是行:

tips = sns.load_dataset("tips")

完全没有解释。我找到了 tips.csv 文件,但我似乎找不到关于 load_dataset 具体功能的足够文档。我试图创建自己的 csv 并加载它,但无济于事。我还重命名了提示文件,它仍然有效...

我的问题是:

load_dataset实际上在哪里寻找文件?我真的可以将它用于我自己的箱线图吗?

编辑:我设法使用自己的 DataFrame 制作了自己的箱线图,但我仍然想知道 load_dataset 是否用于神秘教程示例之外的其他用途。

load_datasethttps://github.com/mwaskom/seaborn-data 上查找在线 csv 文件。这是文档字符串:

Load a dataset from the online repository (requires internet).

Parameters


name : str Name of the dataset (name.csv on https://github.com/mwaskom/seaborn-data). You can obtain list of available datasets using :func:get_dataset_names

kws : dict, optional Passed to pandas.read_csv

如果您想修改该在线数据集或引入您自己的数据,您可能必须使用 pandasload_dataset 实际上 returns 一个 pandas DataFrame 对象,你可以用 type(tips).

确认

如果您已经在名为 tips2.csv 的 csv 文件中创建了自己的数据,并将其保存在与脚本相同的位置,请使用此文件(在安装 pandas 之后)加载它在:

import pandas as pd

tips2 = pd.read_csv('tips2.csv')

只是添加到“selwyth”的回答中。

import pandas as pd
Data=pd.read_csv('Path\to\csv\')
Data.head(10)

成功完成这些步骤后。 现在绘图实际上是这样工作的。

假设您想绘制条形图。

sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.

这实际上适用于 seaborn 中的每个绘图。

此外,我们将没有资格在 Seaborn 上添加我们自己的数据集 Git。

下载所有要用于 example from here.

的 csv 文件(压缩)

将 zip 文件解压到本地目录,然后从同一目录启动 jupyter notebook。 运行 jupyter notebook 中的以下命令:

import pandas as pd
tips = pd.read_csv('seaborn-data-master/tips.csv')

您现在可以使用示例了!

您需要连接互联网,因为 csv 文件不在您的本地计算机上,因此您的计算机需要在线才能下载数据集