pandas 分析中的高相关性是什么意思?

What is the meaning of HIGH CORRELATION in pandas profiling?

我正尝试在 titanic 日期集上使用 pandas profiling。 在概述部分下,有一些标题为“HIGH CORRELATION

的功能

如果您单击 Warnings 选项卡,它会告诉您这些特征与其他哪些特征相关,正如在 example. Can see the same thing in the example 中看到的那样与实际的泰坦尼克号数据。

您还可以设置阈值来确定考虑的内容 HIGH CORRELATION。例如(使用pandas_profiling的当前最新版本3.1.0),

profile = ProfileReport(df, 
                        missing_diagrams=None, 
                        interactions=None,
                        correlations={"pearson": {"calculate": True, "threshold": 0.8},
                                      "spearman": {"calculate": False},
                                      "kendall": {"calculate": False},
                                      "phi_k": {"calculate": False},
                                      "cramers": {"calculate": False}},
                        explorative=True)
profile