バイオ実験に絶対使える統計の基本Q&A
  • [SHARE]
  • Send to Facebook
  • このエントリーをはてなブックマークに追加
バイオ実験に絶対使える 統計の基本Q&A
【第2回】

この新刊立ち読みコーナーでは,新刊『バイオ実験に絶対使える 統計の基本Q&A』から,1項目ずつ抜粋してご紹介しています.

Q2 同じ実験を繰り返して得られた平均値の誤差を出すときに,標準偏差と標準誤差ではどちらを用いるのでしょうか?

富永大介:独立行政法人産業技術総合研究所
※基本編 4章 実験の目的に合った検定の選び方・実験計画Q29を抜粋(2012.09.18掲載)

Answer

同じ実験を何度も繰り返し,その度に平均値が得られたとき,その値にはバラつきが見られますが,この平均値の標準偏差のことを標準誤差と言い,リピート実験の再現性の良さを表します.リピート実験が3~5回程度であれば,標準誤差よりも3~5個の平均値そのものを全て示す方がわかりやすいでしょう.

1)標準偏差と標準誤差

図1 各サンプル群の平均値と標準誤差

クリックして拡大

標準偏差(Standard Deviation:SD)と標準誤差(Standard Error:SE)はそれぞれ,

  • 標準偏差:サンプルのばらつき.1群から計算される.
  • 標準誤差:平均値のばらつき.同じ母集団から得られた(と想定される)多群の場合にだけ計算される.

という意味です.ある実験でn個のサンプルを取るとすると,そのサンプル群の平均値と標準偏差が計算できます.このときはまだ,サンプルが1群しかないので標準誤差は計算できません.同じ実験を繰り返すと,繰り返した回数だけサンプル群が増え,多群になります.そして各サンプル群について平均値と標準偏差が計算でき,実験をk回繰り返すと,平均値と標準偏差がk個得られます.すると,このk個の平均値から「平均値の標準偏差」が計算できます.これを標準誤差といいます.つまり,標準偏差が「サンプルがどの程度ばらついているか」を表すのに対して,標準誤差はリピート実験を行った際などに「平均値はどの程度ばらつくのか?」を表します(図1).したがって実験観測の精度や再現性を表す量と捉えられます.

2)標準誤差の推定方法

サンプルが1群しかないときでも,標準誤差を推定する方法があります.サンプルがn個あり,その分布が正規分布の時は,標準偏差(SD)と標準誤差(SE)の間には SE=SD/√nという関係があります.これによって,1群しか観測していないときでも,その平均値の信頼区間を計算することができます.サンプルの平均値がmとき,正規分布であればmの95%信頼区間の幅は「1.96×標準誤差」なので,95%信頼区間は 正規分布の95%信頼区間:m±1.96×SE=m±1.96×SD/√nとなり,「1群のサンプルの平均値がmのとき,真の平均値がm±1.96×SD/√nの範囲内に入っている確率が95%である」と解釈されます.99%信頼区間を求めたいときには1.96の代わりに2.58とします.しかしサンプル数が100個程度よりも小さいときには,正規分布ではなくt分布を使うべきで,そのときの95%信頼区間はサンプル数によって変わりますが,仮にサンプルが5個だったとすると サンプル数5個のときのt分布の95%信頼区間: m±2.13×SE=m±2.13×SD/√5となります.2.13という数字は,t分布の表をみて決めます.表には多くの場合「自由度」という言葉が使われていますが,自由度とは,サンプル数-1のことです.

なお,実験の繰り返し数を増やしていくと,値のばらついた平均値がたくさん得られますが,その分布はだんだんと正規分布に近づいていき,ばらつきが小さくなっていきます(分母に√nがあるため).これを中心極限定理といいます.

3)標準偏差と標準誤差の使い分けの目安

標準誤差の背景には以上のように,正規分布またはt分布があり,したがってリピート実験の回数としては,分布の形が見えるようになるために,30程度,少なくとも20程度は必要です.リピート実験の回数が3回程度であれば,無理して標準誤差を計算するよりも,3回の平均値と標準偏差をそのまま示す方がよいでしょう.論文などでは,5~10回程度以上の場合に標準誤差を計算している例が多いように見受けられます.

参考図書

  1. 『統計解析入門 第2版(MSライブラリ3)』(篠崎信雄,竹内秀一/著),サイエンス社,2009→標準誤差の図解とサンプル数の決め方の解説
  2. 『Statistics Hacks ―統計の基本と世界を測るテクニック』(Bruce Frey/著 鴨澤眞夫,西沢直木/訳), オライリー・ジャパン,2007 →標準誤差,標準偏差,信頼区間,サンプル数の関係の表や標準誤差の種類などの解説
  3. 『44の例題で学ぶ統計的検定と推定の解き方』(上田拓治/著),オーム社,2009→標準誤差の定義式の導出
次回は『Q3 3つ以上の群の差を調べるにはどうしたらよいですか?t検定は使えないのですか?』です.乞うご期待!

PrevQ2Next

TOP

サイドメニュー開く