標準偏差と標準誤差

はじめに

こんにちは。TSNです。
今回は、統計を学び始めた際に混同しやすい、標準偏差標準誤差についてまとめてみたいと思います。

確かに名前は似ていますが、二つが表す内容はそれなりに異なるんで、注意してください。

標準偏差(Standard Deviation)

標準偏差(SD: Standard Deviation)が表すのは、ずばり「データの散らばり具合」です。

「データの散らばり具合」…?

となった方も安心してください。僕も最初はそうなりました。

よく小児の成長曲線で「±2SDの範疇だから~」といった文言を聞いたことがある方は多いと思います。
このSDは標準偏差を表しており、SDの値が大きいほど各データがとり得る値がまちまちで、SDが小さいと各データのばらつきも小さくなるイメージです。

ちなみに標準偏差σを数式で表すと、下記の通りです。

\(\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i – \mu)^2}\)

求めるのに必要なデータは、

 N:データ数
 Xi:各データの値
 μ:データの平均値

の3項目となります。

○重要なポイント

  • 標準偏差はデータ全体の分布の特性を示す。
    → 大きい程ばらつきが大きく、小さいとばらつきも小さい
  • 単一のサンプルや全体母集団のいずれにも適用可能。

標準誤差(Standard Error)

標準誤差(SE: Standard Error)は、「サンプル平均の信頼性」を表しています。

サンプル平均・・・?

となりましたよね。
具体例で考えてみましょう。

ある30人のクラスで数学のテストを行いました。
5人の友達同士で点数を見せ合って、クラスの平均点を予想することは出来るでしょうか。

その5人の平均点を元に予想するにしても、5人の点数がバラついていると予測は難しくなり、近いと予想の精度が高くなる気がしませんか?

また、そのクラスで25人で見せ合えば、予想の精度はさらに高くなる気がしませんか?

そんな気持ちを数式で表すと、下記の通りです。

\(\large{\frac{\sigma}{\sqrt{n}}}\)

標準誤差を求めるのに必要なデータは、

 σ:標準偏差
 n:データ数

と2項目です。

○重要なポイント

  • 標準誤差はサンプルの平均値が母集団平均をどれだけ反映しているかを測る
  • サンプルサイズが大きくなると標準誤差は小さくなる(推定の精度が向上する)

まとめ

標準偏差はデータのばらつきを測定するための指標であり、個々のデータの分布を理解するのに役立ちます。
標準誤差はサンプルの平均が母集団をどれだけ正確に反映しているかを示す指標です。

両者を混同しないことが重要であり、用途に応じて適切に使い分ける必要があります。

標準偏差と標準誤差の違いを理解することで、データ分析や研究の解釈がより正確になります。ぜひこれらの概念をマスターして、データ分析のスキルを向上させましょう!

タイトルとURLをコピーしました