統計の落とし穴と蜘蛛の糸
著/三中信宏
第10回 実験計画はお早めに―完全無作為化法
はじめに
これまで4回にわたって,パラメトリック統計理論について解説してきました.もちろん,厳密さにこだわるのであれば,もっと数学的な内容をご紹介する必要があったでしょう.しかし,本連載全体の趣旨からいえば,そのようないわゆる「数理統計学」の詳細を追い求めるのではなく,むしろ現実に得られるデータを踏まえてどのように統計学的考察を進めていくのかという点に軸足を置く方が適切でしょう.
一方では,厳密な数学理論体系としてのパラメトリック統計学があり,他方では,日々の研究現場で生まれ続ける生のデータがある.統計ユーザーである私たちにとっては,理論とデータの両方をバランスよくみながら,進むべき道をよく考える必要があるでしょう.しかし,そうはいわれても実際にどうすればいいのか戸惑う読者は少なくないかもしれません.
本連載の読者にとっては,統計学的に致命的ミスを犯さない実験観察のプランニング技法すなわち「実験計画法」は日常的に必要になる知識だと思います.ある実験を進めようとするとき,その計画がはたして統計学的に問題ないのかを事前に検討することは,その実験に投入される金銭と時間,そしてマンパワーを無駄にしないために不可欠だからです.
そこで,今回からは実験計画法の実例をお見せしながら,数値データからの計算を進める作業段階と,それを背後から理論的に支える統計学理論との絶妙なかかわり合いを説明しましょう.
実験計画法の基本原則
そもそも実験計画法って何なんですか?
農業実験は農作物の食料生産と品質管理にとって不可欠です.しかし,今から一世紀前,農業実験を正確に実施するための科学的な基本方針がまったくなく,現場の実験者たちに委ねられていたのが実情でした.イギリスのロザムステッド農業試験場に所属していた生物統計学者ロナルド・フィッシャー (Ronald A. Fisher,1890〜1962) は,1920年代に,のちに実験計画法 (experimental design) とよばれる理論体系のもとになる論文を出版しました.「野外実験の準備」 と題されたこの論文1)には,今なお有効な実験計画の次の三原理の理念が提唱されていました:
- ①反復実施:
- 同一実験処理を複数回実施することにより,その処理にともなうばらつきを評価する.
- ②無作為化:
- 実験処理区のランダムな配置をすることにより,背景要因によるデータへの体系的な影響を偶然誤差化する.
- ③局所管理:
- 実験場所を適切にブロック分割することにより,ブロック内の実験環境の均一化をはかる.
フィッシャーが提唱した実験計画の三原理は,農業実験にかぎらず,あらゆる分野での実験のプランニングをする際の統計学的なガイドラインとして常に目配りする必要があります.その理由は,綿密な設計を怠ったまま実験を実施したとき,得られたデータが統計学的な分析にかけられないリスクが高まるからです.その意味で,実験計画は,単にデータの解析法にとどまるわけではなく,むしろデータをとるための実験を思い立った最初の段階からすでにはじまっていると考えるべきでしょう.
なぜ試験区配置の無作為化が必要なのか
以下では,農業実験の実例の一つとして,Gomez and Gomez (1984)2)から雑虫剤試験の実例をとり上げ,実験計画の理念とその実践について説明を進めましょう.この殺虫剤試験は,対照群 (無処理群) を含めた7種類の殺虫剤 (a〜g) がイネの収量に対して及ぼす効果を調べるために,フィリピンの国際イネ研究所 (IRRI) で実際に行われた実験です.実験計画法では,ここでの殺虫剤は実験者がコントロールできる要因 (factor) であり,異なる殺虫剤はその要因を構成する水準 (level) とよばれます.
本実験では1要因7水準に関して4反復の試験区が設定されました.これは同一水準の実験が4回反復されるわけですから,フィッシャーの 「反復実施」 の原則が守られていることになります.7水準を4反復するためには合計28試験区が必要になります.図1は実験圃場における28試験区の配置を図示しています.ひと目でわかるように“無作為化”されたこの試験区配置はもちろんフィッシャーの 「無作為化」 の原則を踏まえています.無作為化配置がなぜ必要かは,無作為化されなかったならばどういう結末になるかを考えれば明白です.図2は無作為化されていない仮想的な試験区配置です.
この図2の試験区配置はすべての水準が端からきれいに並べられていますが,その点が致命的なリスクを抱える原因となります.たとえば,この圃場の水平方向に潜在的な土壌水位の勾配があって,左側ほど湿潤な試験区だったとします.殺虫剤の水準aはもっとも湿潤な試験区に集中的に配置されたことになります.収穫してみたところ,水準aの収量がとても多かったと仮定しましょう.このとき私たちは「殺虫剤aが効いたから高収量なのだ」と結論できるでしょうか.
いいえ! もしかしたら水位が高いから収量が高いのかも知れないじゃないですか.
そのとおりです.そしていかなる統計手法を駆使したとしても,水準aの効果と土壌水位の効果とを区別することはできません.試験区配置を無作為化しなかったために,水準と土壌水位という2つの要因効果が混じりあってしまったからです 〔実験計画法では交絡 (confounding) とよびます〕.要因間の交絡がある場合,その実験計画は最初からまちがっていたと結論するしかありません.実験計画の大切さがおわかりいただけたでしょうか? 一方,図1の無作為化配置ではすべての水準は土壌水位の異なるさまざまな試験区に割り付けられているので,土壌水位のちがいとは独立に雑虫剤の効果を調べることが可能です.Fisherの無作為化の意義はここにあります.この図1に示されたような無作為化配置を含む実験計画は完全無作為化法とよばれています.
完全無作為化法の実験データと統計モデル
完全無作為化法にしたがって試験区が割り付けられた図1の殺虫剤試験では表1に示すような収量データが得られました.表1の左端には処理 (treatments) の水準が列挙されています.続く各行には反復された4データ値 (kg/ha) が並べられ,さらにその右側には水準ごとの処理和 (treatment total) と処理平均 (treatment mean) が計算されています.全体を集計した総和 (grand total) と総平均 (grand mean) が下段に記されています.
収量データが得られ,その集計がまとめられた時点で,実験計画法は次の段階に移ります.表1をよくみると,計28個それぞれのデータが多かれ少なかればらついていることはすぐにわかります.しかし,私たちの目的は一つひとつのデータのばらつきの観察にあるわけではありません.そもそもこの試験をやろうと思い立ったのは,イネの収量に対して各殺虫剤がどれくらい効くのかを知りたいという目的があったからでしょう.
得られたデータを統計解析するための方針は,実験計画を立てた時点で私たちが想定している線形統計モデル(linear statistical model)を確認することからはじまります.本例で仮定されている統計モデルは図3に示すとおりです.要するに,図3の統計モデルは,データ「xij」の総平均μのまわりのばらつきは処理要因 「αi 」 と誤差要因 「εij」 の2つの要因によって生じているものと解釈すると宣言しているわけです.
では,この線形統計モデルがデータのばらつきの原因を探るうえでどのように用いられるのでしょうか.それについては次回の記事で説明することにしましょう.
文献
- 1) Fisher RA:Journal of the Ministry of Agriculture of Great Britain, 33:503-513, 1926
- 2) Gomez KA & Gomez AA:Statistical Procedures for Agricultural Research, Second Edition. John Wiley & Sons, New York, 1984
統計の落とし穴と蜘蛛の糸 目次
- 第1回 データ解析の第一歩は計算ではない (2017/11/10公開)
- 第2回 データの位置とばらつきを可視化しよう (2017/11/17公開)
- 第3回 データのふるまいをモデル化する (2017/11/24公開)
- 第4回 パラメトリック統計学への登り道① ─ばらつきを数値化する (2017/12/01公開)
- 第5回 パラメトリック統計学への登り道② ―自由度とは何か (2017/12/08公開)
- 第6回 確率変数と確率分布をもって山門をくぐる (2017/12/15公開)
- 第7回 正規分布という王様が誕生する (2017/12/22公開)
- 第8回 ピアソンが築いたパラメトリック統計学の礎石 (2018/01/05公開)
- 第9回 秘宝:確率分布曼荼羅の発見! (2018/01/12公開)
- 第10回 実験計画はお早めに―完全無作為化法 (2018/01/19公開)
- 第11回 正規分布を踏まえたパラメトリック統計学の降臨 (2018/01/26公開)
- 第12回 統計データ解析の地上世界と天空世界 ―連載の総括として (2018/02/02公開)
- 質問コーナー:散布図の幹葉表示の作成方法が一部分理解できません… (2018/02/09公開)