pandas 分析中的高相关性是什么意思?
What is the meaning of HIGH CORRELATION in pandas profiling?
我正尝试在 titanic 日期集上使用 pandas profiling
。
在概述部分下,有一些标题为“HIGH CORRELATION
”
的功能
- 我知道相关性是什么意思,但是标题没有说明哪个特征与这个特征相关?
- 那么 pandas 分析文档中的“
HIGH CORRELATION
”是什么意思?
如果您单击 Warnings
选项卡,它会告诉您这些特征与其他哪些特征相关,正如在 example. Can see the same thing in the example 中看到的那样与实际的泰坦尼克号数据。
您还可以设置阈值来确定考虑的内容 HIGH CORRELATION
。例如(使用pandas_profiling
的当前最新版本3.1.0
),
profile = ProfileReport(df,
missing_diagrams=None,
interactions=None,
correlations={"pearson": {"calculate": True, "threshold": 0.8},
"spearman": {"calculate": False},
"kendall": {"calculate": False},
"phi_k": {"calculate": False},
"cramers": {"calculate": False}},
explorative=True)
profile
我正尝试在 titanic 日期集上使用 pandas profiling
。
在概述部分下,有一些标题为“HIGH CORRELATION
”
- 我知道相关性是什么意思,但是标题没有说明哪个特征与这个特征相关?
- 那么 pandas 分析文档中的“
HIGH CORRELATION
”是什么意思?
如果您单击 Warnings
选项卡,它会告诉您这些特征与其他哪些特征相关,正如在 example. Can see the same thing in the example 中看到的那样与实际的泰坦尼克号数据。
您还可以设置阈值来确定考虑的内容 HIGH CORRELATION
。例如(使用pandas_profiling
的当前最新版本3.1.0
),
profile = ProfileReport(df,
missing_diagrams=None,
interactions=None,
correlations={"pearson": {"calculate": True, "threshold": 0.8},
"spearman": {"calculate": False},
"kendall": {"calculate": False},
"phi_k": {"calculate": False},
"cramers": {"calculate": False}},
explorative=True)
profile