0%

秩和检验

简介: 在总体分布任意的情形下,检验配对的试验数据所在总体的分布位置有无显著差异,往往可以利用符号检验的方法实现。但是符号检验只考虑差数的正负号,而不考虑差数的绝对值差异,会导致部分试验信息损失,结果较为粗略。为了避免符号检验方法的这一缺陷,Wilcoxon提出了一种改进方法,称为Wilcoxon秩和检验(rank sum test)。这种方法同时考虑了差异的方向和差异的大小,较之符号检验更为有效。而对于成组的试验数据所在总体的分布位置有无差异,也可以采用类似的方法进行检验。秩和检验(rank sum test)又称顺序和检验,它是一种非参数检验(nonparametric test)。非参数检验不依赖于总体分布的具体形式,应用时可以不考虑被研究对象为何种分布以及分布是否以知,因而实用性较强。

假设中的等价问题

设有两个连续型总体, 它们的概率密度函数分别为:f1(x),f2(x)f1(x),f2(x),已知f1(x)=f2(xa)f1(x)=f2(x-a),a为未知常数,要检验的各假设为:

H0:a=0,H1:a<0;H0:a=0,H1:a>0;H0:a=0,H1:a<>0H_0:a=0,H_1:a<0; H_0:a=0,H_1:a>0; H_0:a=0,H_1:a<>0

设两个总体的均值分别为μ1,μ2μ_1,μ_2,由于f1,f2f_1,f_2差了一个平移,所以μ2=μ1aμ_2=μ_1-a。此时上述各假设分别等价于:

H0:μ1=μ2,H1:μ1<μ2;H0:μ1=μ2,H1:μ1>μ2;H0:μ1=μ2,H1:μ1<>μ2H_0:μ_1 = μ_2,H_1:μ_1 < μ_2; H_0:μ_1 = μ_2,H_1:μ_1 > μ_2; H_0:μ_1 = μ_2,H_1:μ_1<>μ_2

秩的定义

设X为一总体,将容量为n的样本观察值的绝对值按自小到大的次序编号排列成x1<x2<...<xnx_1 < x_2 < ... < x_n,称xix_i的下标i为xix_i的秩,i = 1,2,…,n

例如: 某旅行团人员的行李重量数据如下:

重量(kg) 34 39 41 28 33

写出重量33的秩。

因为28<33<34<39<41,故33的秩为2。

特殊情况:

如果在排列大小时出现了相同大小的观察值, 则其秩的定义为足标的平均值。

例如: 抽得的样本观察值按次序排成0,1,1,1,2,3,3,

则3个1的秩均为(2+3+4)/3=3.两个3的秩均为(6+7)/2=6.5.

秩和的定义

现设1,2两总体分别抽取容量为n1,n2的样本,且设两样本独立。这里总假定 n1<>n2。

我们将这n1 + n2个观察值放在一起,按自小到大的次序排列,求出每个观察值的秩,然后将属于第1个总体的样本观察值的秩相加,其和记为R1,称为第1样本的秩和,其余观察值的秩的总和记作R2,称为第2样本的秩和。

显然,R1和R2是离散型随机变量,且有R1+R2=( (n1+n2)(n1+n2+1) )/2.

秩和检验法的定义

秩和检验是一种非参数检验法, 它是一种用样本秩来代替样本值的检验法。

用秩和检验可以检验两个总体的分布函数是否相等的问题

秩和检验的适用范围

如果两个样本来自两个独立的但非正态或形态不清的两总体,要检验两样本之间的差异是否显著,不应运用参数检验中的T检验,而需采用秩和检验。

秩和检验的方法

两个样本的容量均小于10的检验方法

检验的具体步骤:

第一步:将两个样本数据混合并由小到大进行等级排列(最小的数据秩次编为1,最大的数据秩次编为n1 + n2)。

第二步:把容量较小的样本中各数据的等级相加,即秩和,用T表示。

第三步:把T值与秩和检验表中某α显著性水平下的临界值相比较,如果T1 < T < T2,则两样本差异不显著;如果T<>T1或T>=T2, 则表明两样本差异显著。

例: 某年级随机抽取6名男生和8名女生的英语考试成绩如表1所示。问该年级男女生的英语成绩是否存在显著差异?

92   78    94    88    76   87
69   52    86    80    47   63   76   82
男秩次 13    7     14    12    5.5  11
女秩次 4      2     10     8      1     3   5. 5    9
  1. 建立假设:

    H0:男女生的英语成绩不存在显著差异;

    H1:男女生的英语成绩存在显著差异。

  2. 编排秩次,求最小样本的秩和,本数据中是男秩次:

    T = 13 + 7 + 14 + 12 + 5.5 + 11= 62.5

  3. 统计推断:根据n1 = 6,n2 = 8,α = 0.05, 查秩和检验表,T的上、下限分别为T1 = 29,T2 = 61,有T > T2,结论是:男女生的英语成绩存在显著差异。

两个样本的容量均大于10的检验方法

当两个样本容量都大于10时,秩和T的分布接近于正态分布,因此可以用Z检验,其基本公式为:Z=Tn1(n1+n2+1)2n1n2(n1+n2+1)12Z=\frac{T-\frac{n_1(n_1+n_2+1)}{2}}{\sqrt{\frac{n_1*n_2(n_1+n_2+1)}{12}}}

**例:**某校演讲比赛后随即抽出两组学生的比赛成绩如表2,问两组成绩是否有显著差异?

列一 成绩
一组 74    68    86    90    75    78    81    72    64    76    79    77
二组 80    77    69    86    76    91    66    73    65    78    81    82    92    93
一组秩次 8      4   21.5   23     9   14.5  18.5    6     1   10.5   16    12.5
二组秩次 17   12.5   5    21.5 10.5  24     3       7     2    14.5  18.5 20    25    26

解: 检验步骤:

  1. 建立假设:

    H0:两组成绩不存在显著差异;

    H1:两组成绩存在显著差异。

  2. 编排秩次,求秩和:

    n1 = 12, n2 = 14, T = 144.5,代入公式,有:

    $ Z=\frac{T-\frac{n_{1} \left(n_{1}+n_{2}+1 \right)}{2}} {\sqrt{\frac{n_{1} \times n_{2} \left(n_{1}+n_{2}+1\right)}{12}}}=\frac{144.5-\frac{12(12+14+1)}{2}}{\sqrt{\frac{12 \times 14(12+14+1)}{12}}}=\frac{144.5-162}{19.44}=-0.90 $

  3. 统计推断:

    因为|Z|<1.96,则应保留虚无假设,拒绝备择假设。

    结论是:两组的演讲比赛成绩不存在显著差异。

-------------本文结束感谢您的阅读-------------

欢迎关注我的其它发布渠道