バイオ実験に絶対使える統計の基本Q&A
  • [SHARE]
  • Send to Facebook
  • このエントリーをはてなブックマークに追加
バイオ実験に絶対使える 統計の基本Q&A
【最終回】

この新刊立ち読みコーナーでは,新刊『バイオ実験に絶対使える 統計の基本Q&A』から,1項目ずつ抜粋して合計6項目をご紹介いたします.5回目に引き続き,今回も現場で出会う具体例とその考え方をケーススタディ形式でお届けいたします.

なお,本コーナーは今回で最終回となりますが,実際の本ではさらにたくさんの疑問・悩みにお応えしています.ぜひ本書のほうもお手にとってみてください.

Case2 ノックアウトマウスを作製したところ,野生型よりも体が大きいようです.ノックアウトの表現型への影響の相関を調べるにはどうしたらよいですか?

茂櫛 薫:東京医科歯科大学難治疾患研究所
※実践編 2章個体数,表現型,行動解析などのケーススタディーCase12を抜粋(2012.11.13掲載)

考え方

野生型とノックアウトマウスの各個体において,体重に差があるかどうかを評価するためには,それぞれの群の平均が異なることを示す必要があります.この差を統計的に評価するためには,t検定もしくはマン・ホイットニーのU検定を用います.これらの統計的手法は,個体間のばらつきを加味した上で,2群の差がどれくらい偶然に起こり得るかをp値として算出します.得られたp値が,あらかじめ設定した閾値(有意水準)より小さければ,野生型とノックアウトマウスの体重には偶然とは考えにくいほど差がある,ということを主張することができます.

ある系の野生型マウスとノックアウトマウスに対して,8週齢における体重を測定したところ,表のような結果が得られたとします.

野生型マウス
個体番号 1 2 3 4 5 6 7 8 9 10
体重(g) 30.5 37.2 29.2 33.2 38.1 31.2 31.6 31.1 32.1 33.4
ノックアウトマウス
個体番号 1 2 3 4 5 6 7 8 9 10
体重(g) 34.2 43.1 37.6 39.0 39.4 37.6 40.9 44.3 35.7 40.7

1)データのプロット

図1 マウスの体重の散布図

クリックして拡大

データを見ると,確かにノックアウトマウスの方が体重が重い傾向がありそうですが,これだけでは何とも言えません.データを視覚的に把握するため,プロットします(図1).各群とも若干のばらつきがありますが,ノックアウトマウスの方が体重が重いのは間違いないようです.

2)片側・両側検定

統計学的検定の基本的な考え方の1つとして,片側検定と両側検定があります.この場合には,事前にノックアウトマウスの方が体重が重いことがわかっており,それを証明したい場合が片側検定に相当し,方向性を考慮しないで差に意味があるかを検討したい場合が両側検定となります.同じデータを片側検定と両側検定に適用すると,変化の向きを固定する片側検定の方が有意になりやすくなります.しかし,医学生物学系の論文では,一般的な解析において片側検定が用いられることは少なく,前提条件を置かずに(すなわちより厳しい)両側検定の結果を用いて2群の差の有無を評価する場合がほとんどです.したがって,ここでは両側検定を用いて2群のマウスの体重を比較することにします.

3)正規性の検定

正規分布は,一般的なデータにしばしば見られる,理想的な分布形状の1つです.解析対象のデータが正規性を持つと仮定する場合には,正規分布による近似により検定(パラメトリック検定)を行います.正規性を持つと仮定しない場合には,元データを順位データに変換した検定(ノンパラメトリック検定)を行います.この2つの手法を適切に使い分けるため,正規性の検定を行います.正規性の検定には,コルモゴロフ・スミルノフの検定やシャピロ・ウィルクの検定,アンダーソン・ダーリンの検定,ダゴスティーノ・ピアソンの検定,Q-Qプロットによる視覚的な確認など,いくつか方法があります(これらの方法は,R,SPSS,SAS等の統計処理ソフトを用いて実行することができます.

例えば,シャピロ・ウィルク検定を各群のマウスの体重に適用した場合,野生型はp=0.148,ノックアウトマウスはp=0.971となります.ここで,シャピロ・ウィルク検定の帰無仮説は「データが正規分布に従う」というものですので,有意水準5%では帰無仮説を保留することになります.したがって「データは正規分布に従わないことは否定できない」,わかりやすく言えば「正規性を仮定することは可能である」という解釈になります.

4)正規性を持つ場合における等分散の検定

図2 Excelによる2分の等分散の検定

クリックして拡大

等分散の検定は,2つのt検定の方法のうち,より適切な方法を選ぶために用いることができます.等分散の検定では,帰無仮説を「2群の分散には差がない」として,2群の分散の比に差があるかどうかを検討します.ExcelではFTEST関数を用いて等分散の検定を実行することができます.例えば図2のように,セルB2~B11が野生型マウスの体重,セルC2~C11がノックアウトマウスの体重が入力されていた場合に,セルD1に「=FTEST(B2:B11,C2:C11)」と入力してエンターキーを押すことで,F分布を用いた等分散の検定を行うことができます.先に提示したデータに等分散の検定を適用すると,p=0.784となります.このとき,帰無仮説は「2群の分散に差がない」というものであるため,有意水準5%では帰無仮説を保留することになり,「等分散を仮定することは可能である」という解釈になります.そのため,5)で述べる2つのt検定のうち,より検出力の高いスチューデントのt検定を用いることが可能です.

5)2群の平均値の差の検定

5-1)正規性を仮定し,等分散を仮定する場合:スチューデントのt検定

ここまでのところで,各群の体重に対して正規性および等分散を仮定することに問題ないことがわかりました.このような場合に用いるのが,スチューデントのt検定となります.実際に検定を行うとp=0.0001となり,有意水準5%では帰無仮説を棄却し,「2群の平均値に差がないとは言えない」,すなわち「2群の平均値には差がある」という解釈になります.

5-2)正規性を仮定し,等分散を仮定しない場合:ウェルチのt検定

等分散でない場合,あるいは最初から等分散を仮定しないような場合には,ウェルチのt検定を用います.図2のデータを元に検定を行うとp=0.0001となり,スチューデントのt検定の場合と同様に有意水準5%では「2群の平均値には差がある」という解釈になります.

5-3)正規性を仮定しない場合:マン・ホイットニーのU検定

正規分布に従わない場合,あるいは最初から正規性を仮定しない場合には,マン・ホイットニーのU検定(別名 ウィルコクソンの順位和検定)を用います.この検定には変法がいくつかあり,ウィルコクソン分布による検定,正規近似による検定,同値(タイ: tie)が存在する場合などにおける修正項,組合わせ列挙による近似計算および正確確率法による計算などがありますので,用いる統計ソフトで若干異なるp値が得られる場合があります.フリーの統計ソフトRのcoinライブラリに含まれるwilcox_testコマンドを用い,正確確率法により検定を行うとp=0.0003となり,上記と同様に有意水準5%では「2群の分布には差がある」という解釈になります.

研究の合間でのデータ整理などで,傾向をさっと確認しておきたい場合には,検出力はt検定に若干劣るものの正規性の検討などが不要なマン・ホイットニーのU検定が便利です.

参考図書

  1. 『新版 医学への統計学』(古川俊之/監,丹後俊郎/著),朝倉書店,1993→臨床研究で得られるデータの事例を多数あげながら,各種の統計手法について解説している
新刊『バイオ実験に絶対使える 統計の基本Q&A』から,合計6項目を12週にわたってご紹介してきましたが,いかがでしたでしょうか? 「今度こそ統計が理解できそう!」とか「とても参考になった」と感じた方は,ぜひ実際の本のほうもご活用ください.これまでご紹介した以外にも多くの疑問・悩みにお応えしています.

PrevCase2Next

TOP

サイドメニュー開く