本文目录
「卡方分布」是什么
卡方分布(英语:chi-square distribution, χ²-distribution,或写作χ²分布)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。
卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。
卡方分布在共同使用卡方检验用于拟合优度的观测分布为理论之一,独立的分类的两个标准定性数据,并在用于人口区间估计标准偏差a的来自样本标准差的正态分布。许多其他统计检验也使用这种分布,例如Friedman 的按秩方差分析。-卡方分布
由卡方分布延伸出来皮尔逊卡方检验常用于:
1、样本某性质的比例分布与总体理论分布的拟合优度(例如某行政机关男女比是否符合该机关所在城镇的男女比);
2、同一总体的两个随机变量是否独立(例如人的身高与交通违规的关联性);
3、二或多个总体同一属性的同素性检验(意大利面店和寿司店的营业额有没有差距)。(详见皮尔逊卡方检验)
计算方法
p-value = 1- p_CDF.
χ2越大,p-value越小,则可信度越高。通常用p=0.05作为阈值,即95%的可信度。
因此,由于适当自由度(df)的累积分布函数(CDF)给出了获得比该点更不极端的值的概率,因此从 1 中减去 CDF 值给出p值。低于所选显着性水平的低p值表示统计显着性,即有足够的证据拒绝零假设。显着性水平 0.05 通常用作显着和不显着结果之间的分界点。-卡方分布
什么是“卡方分布”
若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布。
卡方分布到底是什么
若n个相互独立的随机变量ξ1,ξ2,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和∑ξi∧2构成一新的随机变量,其分布规律称为χ2(n)分布(chi-square distribution),其中参数 n 称为自由度,自由度不同就是另一个χ2分布,正如正态分布中均值或方差不同就是另一个正态分布一样。χ2分布的密度函数比较复杂这里就不给出了,同学们也不用去记了。卡方分布是由正态分布构造而成的一个新的分布,这也正反映了前面所说的正态分布的重要性。
-卡方分布