1つだけ0以外の値をもつデータの平均と標準誤差が一致した話

Nov. 17, 2020, 8:55 a.m.

#数学 

ここでの標準誤差は標本標準偏差1をデータ数の平方根で割ったものとして定義しています2

例えば↓のようなデータ

[0, 0, 0, 0, 0.3, 0, 0, 0, 0, 0]

において平均値は 0.03 、標準誤差は 0.03 となり、一致します。びっくりしたので以下で証明。

データ数を\(n\)、一つだけ存在する0以外の値を\(x\)とおくと、平均値\(\mu\)は
$$\mu=\frac{x}{n}$$
ゆえに、標準誤差\(SD\)は
$$ \begin{align} SD&=\sqrt{\frac{1}{n-1}\left((x-\mu)^2+(n-1)\mu^2\right)}\cdot\frac{1}{\sqrt{n}} \\ &=\sqrt{\frac{1}{n(n-1)}(x^2-2\mu x+n\mu^2)} \\ &=\sqrt{\frac{1}{n(n-1)}(n^2\mu^2-2n\mu^2+n\mu^2)} \\ &=\sqrt{\frac{1}{n(n-1)}n\mu^2(n-1)} \\ &=\mu \end{align} $$


  1. 不偏標準偏差ではない 

  2. つまり \(\sqrt{\frac{1}{n-1}\sum_{k=1}^n(x_i - \mu)^2}\cdot\frac{1}{\sqrt{n}}\)