3.2 单因素方差分析
3.2.1 单因素方差分析一般方法
以下进一步讨论单因素方差分析的原理和一般统计方法。
设有m个样本,它们来自具有共同方差σ2的m个正态总体。如果原假设H0:μ1=μ2=…=μm=μ成立,则m个总体既具有共同的方差σ2,又有共同的均值。因此,从m个完全相同的总体中各抽取一个样本,就相当于从同一总体中抽取m个样本。在原假设H0成立的条件下,总方差估计值、试验因素和试验误差方差估计值具有相同的期望值σ2。由此,计算试验数据总变差平方和、试验因素变差平方和和试验误差平方和,根据各自的自由度,统计总方差估计值、试验因素方差估计值和试验误差方差估计值,采用F检验法判断试验因素方差与试验误差方差是否存在显著性差异。由于原假设为m个总体的均值μ1、μ2、…、μm都相同,方差分析的实质就是检验多个总体的均值是否一致。
通过对以上实例的分析,方差分析的统计程序可简单表示为:
①提出原假设H0和备择假设H1,
H0:μ1=μ2=…=μm
H1:各总体均值不全部相等
②由样本值计算各项变差平方和及其自由度,计算各项方差估计值;
③选择显著性水平α,由F分布表查出相应自由度下的临界值,显著性水平α的取值由试验和评价要求决定;
④计算统计量F值;
⑤将F值与比较,若,接受原假设,表示试验因素没有显著影响。当,拒绝原假设H0,接受备择假设H1,表示试验因素有显著影响;
⑥通常,如果,表示试验因素的影响是显著的,在“显著性”栏标记*,如果,表示试验因素的影响是高度显著的,标记**。
为清晰显示方差分析过程,可将试验数据、方差分析统计参数分别列表表示,如表3-1~表3-4所示。
单因素方差分析有等重复测量次数和不等重复测量次数两种试验情况。
3.2.2 各水平等重复次数的单因素方差分析
设一个单因素试验,因素A取m个不同水平,每个水平重复n次试验,所得试验结果如表3-3所示。
表3-3 单因素多水平的试验安排和结果
表中xij表示水平Ai在第j次试验中的测量结果,
(3-1)
(3-2)
和分别表示水平Ai测量结果的平均值和测量的总平均值。
计算测量结果总的变差方和:
由于
因此
不难发现,试验误差变差平方和:
(3-3)
因素A的变差平方和:
(3-4)
所以
(3-5)
另外,QT、QA和Qe还可表示为
令分别为各水平全部测量值的总和及第i水平时测量值总和,则
(3-6)
(3-7)
(3-8)
QT平方和与nm个数据有关,其自由度νT=nm-1,QA平方和与m个组(因素)有关,自由度νA=m-1,而Qe涉及m组nm个数据,其自由度νe=nm-m=m(n-1)。由此:
(3-9)
分别计算因素A的方差估计值和误差的方差估计值:
(3-10)
(3-11)
计算统计量FA,进行F检验:
(3-12)
按原假设,和都是σ2的无偏估计,所以两者的比值FA应接近于1。如果FA值比1大得很多,即因素A的方差估计值比试验误差方差估计值大得很多,说明样本值同原假设有显著差异,拒绝原假设。
对于给定显著性水平α,查F分布表,如果,拒绝原假设。
对以上统计的方差分析参数以表3-4表示。
表3-4 单因素方差分析表
第9章表9-1、表9-2列出了标准物质均匀性检验方差分析表实例。
3.2.3 各水平不等重复次数的单因素方差分析
在试验中,如果各水平的重复次数不同,分别为ni,则
(3-13)
则QA、Qe和QT可表示为:
(3-14)
(3-15)
(3-16)
试验设计有m个水平,每水平进行ni次,共N次试验。因此,QT平方和的自由度νT=N-1,QA平方和的自由度νA=m-1,Qe涉及m组N个数据,其自由度νe=N-m。
【例3-2】 采用ICP发射光谱法测定铁矿石中的铝,试样用碳酸钠/四硼酸钠熔融分解,酸浸取,定容于250mL容量瓶中,于ICP光谱仪测量铝308.22nm光谱强度。现考察样品中的铁量(30%~70%)对铝含量测定的影响,试验数据列于表3-5,所有测量结果均在含60%铁量的校准曲线上查取,试评价样品所含铁量对铝量测定的影响。
表3-5 铁量对ICP发射光谱法测定铝量影响的试验参数
本例是不等重复次数的单因素多水平试验,按式(3-14)~式(3-16)计算铁量影响的变差平方和、试验误差的变差平方和和总的试验变差平方和,以及相应的自由度,由此计算相应的方差估计值,将这些统计参数填入表3-6中,最后计算得方差分析统计量FA=2.15,FA小于F0.05(5,14)和F0.01(5,14)。
表3-6 铁量对ICP发射光谱法测定铝量影响的方差分析表
由此,样品中的铁量在30%~70%内变化,对铝量测定的影响不显著,在分析测试时可采用含同一铁量(如60%或其他的铁量)的校准曲线。本例试验数据的Excel表格计算见第13章图13-16。
不等重复次数的单因素多水平试验较等重复次数的单因素多水平试验的数据处理要麻烦。当总的试验次数N相同时,等重复次数试验的精度比不等重复次数试验要好。通常情况下的试验多设计为等重复测量次数。