5.3 多个独立样本的Kruskal-Wallis秩和检验

最后更新:2023/09/09

应用场景:

多个独立的样本(完全随机设计,组数≥3)的计量资料或等级资料,推断组间分布位置有无差异。

因为这个方法的统计量以$H$表示:$ H = \frac{12}{N(N+1)} \sum{i=1}^ {k} \frac{Ri^ 2}{n_i}-3(N+1) $

所以,这个方法也称为Kruskal-Wallis H test。

前提条件:

  • 分布未知或不服从正态分布的计量资料;或者等级资料;
  • 完全随机设计,分组数≥3;

==注意==:

在上一教程(Wilcoxon秩和检验)中,同样有==分布未知==的计量资料这一应用条件,如何作出分布未知的判断,当然没有相应的统计方法;从实践角度来说,如果我们面对的计量资料没有外部信息证明它是服从正态分布的,那么单组样本量(n)在10以内的数据,均应视为分布未知,因为所有的检验数据是否服从正态分布的统计方法,对样本量都是非常敏感的,n ≤10 对于 Shapiro-Wilk, Kolmogorov-Smirnov等正态性检验方法来说,检验效能都是非常低的。因此保守起见,对于小样本计量资料,尤其是那些数据变异比较明显的,应更倾向于视为“分布未知”而采用非参数的检验方法。

本方法我们只给出一个等级资料的例子,针对计量资料的Kruskal-Wallis秩和检验,分析与推断过程与之完全相同。

【例5-4】重组人白细胞生成素预防化疗后白细胞减少的临床研究

汪晓洁等^[1]^ 采用不同剂量的基因重组人粒细胞集落刺激因子(rhG-CSF)预防晚期非小细胞肺癌(non-small cell lung cancer,NSCLC)化疗后白细胞减少症,探讨该药合理的应用策略。

本试验共纳入受试者126人,随机分为A、B、C共3组,各组给予rhG-CSF的总剂量分别为:300μg、600μg、900μg。

使用SPSS对该研究数据进行统计分析的具体过程如下:

1. 建立数据集

经整理,数据列表(数据视图)如下:

image-20230909091144086
图5-4-1

其中,Group=1示A组,Group=2示B组,Group=3示C组;变量WBC为白细胞减少程度的分级,0表示未发生白细胞减少,1-4与减少程度I-IV级对应;Freq为频数。

因为使用了频数表,因此在分析之前先行加权操作(可参看之前的教程)。

2. Kruskal-Wallis秩和检验操作

点击菜单:

Analyze => Nonparametric Tests => Legacy Dialogs => k Independent Samples

image-20230909092036155
图5-4-2

设置好检验的变量(Test Variable List)统计方法(Test Type,默认勾选的就是Kruskal-Wallis秩和检验),分组信息(Define Range),如果是计量资料,还可设置输出统计描述(Options->Descriptive)的结果,最后点击【Ok】输出统计结果。

3. 结果解读

经上述菜单操作,默认输出(SPSS 27 64位)的统计结果中包括2个统计表:

image-20230909092332559
图5-4-3

Kruskal-Wallis秩和检验的结果显示,应用3种不同剂量rhG-CSF的受试者,发生白细胞减少的程度不尽相同,差异具有统计学意义($H=16.03, P<0.001$)。

[1]汪晓洁,寿涛,胡静等.不同剂量rhG-CSF预防晚期非小细胞肺癌化疗后白细胞减少的临床研究[J].中国癌症杂志,2015,25(10):823-827.

© By StatX..