[11] ノンパラメトリック検定法


  [11.1] マン−ホイッ トニーのU検定
  [11.2] ウィルコクスンの符号化順位検定
  [11.3] クラスカル−ウォリスのH検定
  [11.4] フリードマンのχr検定

 パラメトリック検定とは、標本の母集団が正規分布すると仮定できる連続型データに対して用いられる統計手法である。ノンパラメトリック検定とは、 標本の母集団が正規分布しない場合や、順位データなど連続型のデータでない場合に用いられる統計手法である。

集計データに対する検定 ⇒ χ2乗検定

順位データに対する検定法の種類

標本数 独立した標本 関連した標本
2つの標本 Man-WhitneyのU検定 Wilcoxonの符号化順位検定
3つ以上の標本 Krascal-WallisのH検定 Friedmanのχ2乗検定


[11.1] マン−ホイットニーのU検定

 独立した2組の標本が属している母集団の分布が等しいかどうかを検定するノンパラメトリック手法。

検定手順

  1. 帰無仮説 H0:「2 群の母代表値に差はない」。
    対立仮説 H1:「2 群の母代表値に差がある」。
    有意水準 α で両側検定を行う。
  2. 2 群のケース数をそれぞれ n1,n2,また,n = n1 + n2 とする。
  3. 2 群をこみにして観察値を小さい順に並べ,小さい方から順位をつける。
    同順位がある場合には平均順位をつける。
  4. 各群ごとに,付けられた順位の和 R1,R2 を求める。
  5. 検定統計量 U1,U2 を求める。
    U1 = n1 * n2 + n1 * ( n1 + 1 ) / 2- R1
    U2 = n1 * n2 + n2 * ( n2 + 1 ) / 2 - R2
  6. 検定統計量 U0 は U1 と U2 のうち、小さい方とする。
  7. (1) ケース数が小さい場合
    統計数値表を参照して棄却限界値を求める。
    帰無仮説の採否を決める。
    U0 > 棄却限界値のとき,帰無仮説を採択する。 →「2 群の母代表値に差があるとはいえない」。 
    U0 ≦ 棄却限界値のとき,帰無仮説を棄却する。 →「2 群の母代表値に差がある」。
  8. (2) ケース数が大きい場合(n1 or n1 が20を超える場合)
    検定統計量 U の平均値は E(U) = n1 * n1 / 2,分散は V(U) = n1 * n1 ( n + 1 ) / 12 ゆえ,次式の Z0 は,正規分布に従う。
    z = | U - E(U) | / sqrt( V(U) )
    有意確率を P = Pr{| Z | ≧ Z0} とする。
    正規分布表,または正規分布の上側確率の計算を参照すること。
    帰無仮説の採否を決める。
    P > α のとき,帰無仮説を採択する。 →「2 群の母代表値に差があるとはいえない」。 
    P ≦ α のとき,帰無仮説を棄却する。 →「2 群の母代表値に差がある」。

[11.2] ウィルコクスンの符号化順位検定

 対になった2組の標本が属している母集団の分布が等しいかどうかを検定するノンパラメトリック手法。

検定手順

  1. 帰無仮説 H0:「母代表値に差はない」。
    対立仮説 H1:「母代表値に差がある」。
    有意水準 α で両側検定を行う(片側検定も定義できる)。
  2. n ケースの,対応のある 2 変数を Xi,Yi,両者の差を di = Xi - Yi とする(i = 1,2,... ,n)。
  3. Xi - Yi の絶対値の小さい方から順位をつける。ただし,Xi=Yi の組は除く。
    同順位の場合は平均順位をつける。
  4. Xi > Yi の組の順位の和と Xi < Yi の組の順位の和のうち,小さい方を検定統計量 T とする。
  5. (1) N が小さいとき
    (i) 統計数値表を参照して棄却限界値を求める。
    (ii) 帰無仮説の採否を決める。
    検定統計量 > 棄却限界値ならば,帰無仮説を採択する。
    「母代表値に差があるとはいえない」。
    検定統計量 ≦ 棄却限界値ならば,帰無仮説を棄却する。
    「母代表値に差がある」。
  6. Xi ≠ Yi の組の数 N が大きいとき(N > 25)
    (i) 検定量 z0 を計算する。
              T - n*(n-1)/4
    z = --------------------------
         sqrt( n*(n+1)*(2n+1) / 24 )
    (ii) 有意確率を P = Pr{| Z | ≧ Z0} とする。
    (iii) 帰無仮説の採否を決める。
    P > α のとき,帰無仮説を採択する。→ 「母代表値に差があるとはいえない」。
    P ≦ α のとき,帰無仮説を棄却する。→ 「母代表値に差がある」。

[11.3] クラスカル−ウォリスのH検定

3群以上の独立した標本が同一の母集団から抽出されたものであるかどうかを順位和を用いて検定するノンパラメトリック手法。
(有意差があった場合には多重比較(Tukey法、Scheffe法)により有意差がどこの群間にあるかを検定)

検定手順

  1. 帰無仮説 H0:「母代表値に差はない」。
    対立仮説 H1:「母代表値に差がある」。
    有意水準 α で両側検定を行う(片側検定は定義できない)。
  2. k 群の標本において,各群のケース数を nj(j = 1, 2, ... , k),n = Σ nj とする。
  3. n 個の観測値を全てこみにして小さい方から順位をつける(同順位がある場合には平均順位をつける)。
  4. 第 j 群の第 i ケースの順位を rij とし,第 j 群の順位の和を Rj = Σ rij とする
  5. H を計算する。
       12 Σ[(Rj)2/nj]
    H0 = ---------------- − 3( N - 1 )
         N( N+1 )
    注:同順位が多い場合には,検定統計量 Sx の修正が必要である。
  6. H は,自由度が k - 1 の χ2 分布に従う。
  7. (i) 有意確率を P = Pr{χ2 ≧ S0} とする。
    (ii) 帰無仮説の採否を決める。
    P > α のとき,帰無仮説を採択する。→ 「母代表値に差があるとはいえない」。
    P ≦ α のとき,帰無仮説を棄却する。→ 「母代表値に差がある」。

[11.4] フリードマンのχ2r 検定

 関連のある標本に関して、順位に基づいて代表値の間に有意差があるかどうかを検定する。

検定手順

  1. 帰無仮説 H0:「母代表値に差はない」
    対立仮説 H1:母代表値に差がある」
    有意水準αで両側検定を行う。
  2. r種類の対象(行)にc種の処理(列)を行い、得点を入れて、表を作成する。
  3. 各行の得点を1からkまで順位づける。(同順位は平均順位とする。)
  4. 順位を各列ごと(条件ごと)に集計する。
  5. χ20を算出:
    χ2r = 12 / nk(k+1) * Σ(Rj)2 − 3n(k+1)
       (k:処理条件の数、n:被験者の数、Rj:特定の処理条件の順位の計)
  6. 検定量 χ2rは、自由度 df = k-1 のχ2分布に従う。
  7. (i) 有意確率を P = Pr{χ2 ≧ χ20} とする。
    (ii) 帰無仮説の採否を決める。
    P > α のとき,帰無仮説を採択する。→ 「処理に差があるとはいえない」。
    P ≦ α のとき,帰無仮説を棄却する。→ 「処理に差がある」。

  8. 全体として処理間に差があるときには,どの処理間に差があるかについて多重比較(対比較)を行うことができる。