安斯库姆四重奏 (Anscombe's quartet)
简介
安斯库姆四重奏(Anscombe's quartet)是由统计学家弗朗西斯·安斯库姆(Francis Anscombe)提出的一组四个数据集,用来说明统计分析中数据可视化的重要性。

图1 线性关系图2 曲线关系图3 极端异常值图4 完全不相干。

这四个数据集都包含11个数据点,每个数据点都由两个变量组成,分别为X和Y。它们的统计学特征,如平均数、方差、相关系数等,都是相同的。但是,当将这四个数据集可视化后,可以发现它们的分布情况大不相同。

安斯库姆四重奏说明了,统计分析中,数据可视化是非常重要的,它不仅可以帮助我们更直观地理解数据,还可以帮助我们更准确地提取数据的结构特征。

安斯库姆四重奏提示线性回归前统计图辅助观察判断额重要性,这是几乎所有统计分析/数据分析都适用的。