バイオ実験に絶対使える統計の基本Q&A
  • [SHARE]
  • Send to Facebook
  • このエントリーをはてなブックマークに追加
バイオ実験に絶対使える 統計の基本Q&A
【第3回】

この新刊立ち読みコーナーでは,新刊『バイオ実験に絶対使える 統計の基本Q&A』から,1項目ずつ抜粋してご紹介しています.

Q3 3つ以上の群の差を調べるにはどうしたらよいですか?t検定は使えないのですか?

荻島創一:東北大学東北メディカル・メガバンク機構医療情報ICT部門
※基本編 4章 実験の目的に合った検定の選び方・実験計画Q36を抜粋(2012.10.02掲載)

Answer

3つ以上の群の平均値の差を調べるには,全群のなかで差のある群の有無を調べる検定を行います.差のある群があるとわかったら,どの群に差があるのかを調べる検定を行います.

図1 表1のデータのコラム散布図

クリックして拡大

1)3つ以上の群のなかで差のある群の有無を調べる

3つ以上のグループの差を調べるには,これらの群のデータの散布図(コラム散布図)をプロットし,一般にはこれらの群の母集団がそれぞれ正規分布にしたがうときはパラメトリックな検定として分散分析を用います.このQuestionでは散布図と分散分析について解説し,実際にF値とその有意確率を求め方の例を,データを用いて説明します.まず,これらの群のデータのコラム散布図をプロットするところからはじめましょう.ここでは,表1のように10種類のバクテリアの菌株の成長率のデータが得られたとします.そのデータをもとに横軸に菌株番号,縦軸に菌株の成長率をとって点でプロットします(図1).これによりコラム散布図を得ることができます.コラム散布図以外に,箱ひげ図(box plot)をプロットしてもよいでしょう.得られたグラフから差がありそうな群を確認することができます.

表1 10種類のバクテリアの菌株の成長率のデータ
菌株番号 バクテリアの菌株の成長率(dbl/h) 菌株群内平均 菌株群内変動
1 0.9 0.85 0.91 0.86 0.92 0.91 0.9 0.87 0.9 0.88 0.89 0.005
2 1.1 1.2 1.1 1.1 1.1 1.2 1.1 1.3 1.1 1.4 1.17 0.101
3 0.95 0.92 0.95 0.91 0.95 0.96 0.9 0.93 0.94 0.95 0.936 0.00364
4 1.1 1.4 1.1 1.1 1 1.1 1 1.2 1.3 1.2 1.15 0.145
5 2.5 2.7 2.55 2.4 2.5 2.5 2.65 2.6 2.7 2.6 2.57 0.086
6 1.3 1.1 1.1 1.2 1.1 1.1 1.5 1.2 1.3 1.1 1.2 0.16
7 0.95 0.9 0.92 0.93 0.96 1 0.9 0.92 0.94 0.95 0.937 0.00821
8 0.92 0.95 0.93 0.95 1.1 0.95 0.95 1.3 0.95 1.1 1.01 0.1328
9 0.89 0.9 0.88 0.89 0.89 0.88 0.89 0.87 0.89 0.92 0.89 0.0016
10 0.91 0.93 0.92 0.91 0.91 0.92 0.91 0.93 0.91 0.92 0.917 0.00061
図2 Microsoft Excelの計算表

クリックして拡大

3つ以上の群の平均値の差を調べるには,これらの群の母集団がそれぞれ正規分布にしたがうときはパラメトリックな検定として分散分析(analysis of variance:ANOVA)(一元配置分散分析)を行います.分散分析は,群間変動と群内変動の和の比を群数や標本の大きさで正規化したF値による検定です.実際には,Microsoft Excelを用いて図2のように計算します

一方,正規分布にしたがわないときはノンパラメトリックな検定としてクラスカル・ウォリス(Kruskal-Wallis)の検定を行います.

この10種類のバクテリアの菌株の成長率のデータで,一元配置分散分析を行うと,有意確率pは7.51×10-65となり,有意水準α=0.05としたとき,有意な差があることがわかります.すなわち,この10種類のバクテリアの菌株のいずれかが,統計的に有意に差のある成長率を示していることがわかります.

2)どの群に差があるのかみつける

この10種類のバクテリアのうち,どのバクテリアがそうした統計的に有意に差のある成長率を示しているかは,散布図をみると,それは菌株番号5のバクテリアではないかと考えられます.統計学的に示すには,分散分析の後に多重比較を行います〔事後比較(post hoc comparison)〕.これにはパラメトリックな検定としては,テューキー(Tukey)の方法やシェッフェ(Scheffe)の検定が,ノンパラメトリックな検定としては,ボンフェローニ補正のマン・ホイットニーのU検定が用いられます.テューキーの方法は,t検定を拡張したもので,t値の計算に,1元配置分散分析における誤差分散を用いて,バクテリアの全種類の間で有意差解析を行うものです.なお,分散分析を行わずに多重比較を行う,事前比較(a priori comparison)という方法もあります.

最初の,「t検定は使えないのですか?」という質問ですが,残念ながら使えません.分散分析を行い,有意差があるときは,いずれの群間で有意差があるかを多重比較で検定するようにしましょう.

本書中の関連項目

より詳しく理解したい方は本書中の以下のQもご覧ください

  1. 基本編 1章 Q07「t 検定はどのようなときに使うものですか? また関連する方法があれば教えてください」
  2. 基本編 4章 Q27「3群以上を一度に検定したいときは,どんな方法がありますか?」

参考図書

  1. 『統計学入門(基礎統計学)』(東京大学教養学部統計学教室/編), 東京大学出版会,1991
  2. 『数学いらずの医科統計学 第2版』(津崎晃一/訳),メディカルサイエンスインターナショナル,2011
次回は『Q4 マウスを用いた実験で,個体差が大きく有意差が取りにくい場合はどうしたらよいですか?』です.乞うご期待!

PrevQ3Next

TOP

サイドメニュー開く