同じ実験を何度も繰り返し,その度に平均値が得られたとき,その値にはバラつきが見られますが,この平均値の標準偏差のことを標準誤差と言い,リピート実験の再現性の良さを表します.リピート実験が3~5回程度であれば,標準誤差よりも3~5個の平均値そのものを全て示す方がわかりやすいでしょう.
標準偏差(Standard Deviation:SD)と標準誤差(Standard Error:SE)はそれぞれ,
という意味です.ある実験でn個のサンプルを取るとすると,そのサンプル群の平均値と標準偏差が計算できます.このときはまだ,サンプルが1群しかないので標準誤差は計算できません.同じ実験を繰り返すと,繰り返した回数だけサンプル群が増え,多群になります.そして各サンプル群について平均値と標準偏差が計算でき,実験をk回繰り返すと,平均値と標準偏差がk個得られます.すると,このk個の平均値から「平均値の標準偏差」が計算できます.これを標準誤差といいます.つまり,標準偏差が「サンプルがどの程度ばらついているか」を表すのに対して,標準誤差はリピート実験を行った際などに「平均値はどの程度ばらつくのか?」を表します(図1).したがって実験観測の精度や再現性を表す量と捉えられます.
サンプルが1群しかないときでも,標準誤差を推定する方法があります.サンプルがn個あり,その分布が正規分布の時は,標準偏差(SD)と標準誤差(SE)の間には SE=SD/√nという関係があります.これによって,1群しか観測していないときでも,その平均値の信頼区間を計算することができます.サンプルの平均値がmとき,正規分布であればmの95%信頼区間の幅は「1.96×標準誤差」なので,95%信頼区間は 正規分布の95%信頼区間:m±1.96×SE=m±1.96×SD/√nとなり,「1群のサンプルの平均値がmのとき,真の平均値がm±1.96×SD/√nの範囲内に入っている確率が95%である」と解釈されます.99%信頼区間を求めたいときには1.96の代わりに2.58とします.しかしサンプル数が100個程度よりも小さいときには,正規分布ではなくt分布を使うべきで,そのときの95%信頼区間はサンプル数によって変わりますが,仮にサンプルが5個だったとすると サンプル数5個のときのt分布の95%信頼区間: m±2.13×SE=m±2.13×SD/√5となります.2.13という数字は,t分布の表をみて決めます.表には多くの場合「自由度」という言葉が使われていますが,自由度とは,サンプル数-1のことです.
なお,実験の繰り返し数を増やしていくと,値のばらついた平均値がたくさん得られますが,その分布はだんだんと正規分布に近づいていき,ばらつきが小さくなっていきます(分母に√nがあるため).これを中心極限定理といいます.
標準誤差の背景には以上のように,正規分布またはt分布があり,したがってリピート実験の回数としては,分布の形が見えるようになるために,30程度,少なくとも20程度は必要です.リピート実験の回数が3回程度であれば,無理して標準誤差を計算するよりも,3回の平均値と標準偏差をそのまま示す方がよいでしょう.論文などでは,5~10回程度以上の場合に標準誤差を計算している例が多いように見受けられます.