你一定被假设检验绕晕过,总是死磕P值小于0.05就能拒绝原假设,却完全不知道背后的逻辑;面对数据类型傻傻分不清是该用T检验还是卡方检验;做回归分析只盯着R²看,却把失拟项和弯曲项检验抛到脑后。 这篇文章把假设检验的核心知识一网打尽,从P值判断的底层逻辑到方法选择的大矩阵,直接让你上手就能用。 先记住这张表,就能搞定所有P值解读: 当总体只有一组数据时:如果是均值的比较,δ已知就用单样本Z检验,δ未知就用单样本T检验;如果是方差或比例的问题,直接用单方差检验或单比率检验;要是关心中位数,用符号检验或Wilcoxon符号秩检验。 当有两组数据时:均值差异比较可以用双样本T检验(独立样本)或配对T检验(配对样本);方差检验在正态分布下用F检验,任意分布用Levene检验;比例问题用双比率检验;中位数比较用Mann-Whitney检验。 当面对三组及以上数据时:比较均值差异用方差分析(ANOVA),要是方差不齐就用Welchs检验;方差齐性检验在正态分布下用Bartlett检验,任意分布用Levene检验;比例比较用交叉分组表或卡方检验;中位数比较用Kruskal-Wallis检验或Mood中位数检验。 三步就能搞定方法选择:第一步看总体数量是单/双/多;第二步看检验类型是均值/方差/比例/位数;第三步看数据分布是正态还是任意分布。 必须避开这些大坑:误区一是不做正态性检验就直接用T检验,正确做法是先用Anderson-Darling检验,P<0.05说明不服从正态分布,这时候就用Mann-Whitney检验;误区二是回归分析只看R²,必须检查效应项、失拟项和弯曲项的P值;误区三是多组比较时用多次T检验,应该用ANOVA再配合事后检验比如Tukey法。 看个实战案例:原来产品合格率是85%,新工艺改进后抽取100件合格率变成90%,这个提升显著吗?这是单总体比率问题,用单比率检验。结果P<0.05就说明新工艺真的提高了合格率。 再看另一个案例:从A、B、C三家供应商各抽30件产品测量尺寸,比较方差是否有差异?这是多总体方差问题,假设数据正态就用Bartlett检验。如果P<0.05就说明三家的尺寸稳定性不同,接着再用事后检验找出谁家最稳定。