Statistics

統計入門

1次元データ

代表値 averages

 分布のしかたを中心的な値で示したもの。平均、中央値、最頻値

平均 mean (算術平均 arithmetic mean)
 観測値 x_1,x_2,\cdots,x_n\, の和をデータ数 \,n\, で割ったもの
\overline x \equiv \frac 1n \sum_{i=1}^n x_i
\overline x \equiv \frac 1n \sum_{i=1}^n x_i}

メディアン中央値 median
 観測値を大きさの順に並べ替えたときの中央の値
 データ数が偶数の時の取扱い

モード最頻値 mode
 分布の峰に対応する値

散らばりの尺度

レンジ範囲 range
 最大値と最小値の幅
 R \equiv \text{max}\,(x_1,x_2,\cdots,x_n)-\text{min}\,(x_1,x_2,\cdots,x_n)

平均偏差 mean deviation
 偏差deviation(|x_i - \overline x|) の平均
 d \equiv \frac 1n \sum_{i=1}^n |x_i - \bar x|

分散 variance
 偏差を絶対値ではなく、2乗した上での平均
s^2_x \equiv \frac 1n \sum_{i=1}^n (x_i - \overline x)^2 = \frac 1n \sum_{i=1}^n x^2_i - \overline x^2

標準偏差 standard deviation
 分散の平方根(dimensionを同じくする)
s_x \equiv \sqrt {s_x^2

変動係数 coefficient of variation
 分布の中心が著しく異なる場合など、平均を考慮した上での比較(無名数)(平均が大きいと分散が大きい場合など)
 C.V. \equiv \frac {s_x}{\overline x}

分布の形状

歪度 skewness 分布の非対称性を示す。値が正の時は、右すそが伸びている。
\alpha_3 \equiv \frac 1n \sum_{i=1}^n\left(\frac {x_i - \overline x}{s_x}\right)^3

尖度 kurtosis 分布の尖り具合を示す。
\alpha_4 \equiv \frac 1n \sum_{i=1}^n\left(\frac {x_i - \overline x}{s_x}\right)^4

中央値 median
  • 値が点の場合で有効ケース数が偶数( 2n )の時には2方法がある。

ジニ係数 Gini Coefficient 不平等度の指標 (ただし、\mu \equiv \overline x )
G \equiv \frac {1}{2 \mu n^2} \sum_{i=1}^n \sum_{j=1}^n |x_i - x_j|

2次元データ

相関関係 2変数間の関係。特に直線関係を指す場合が多い。

相関係数 correlation coefficent
 通常、ピアソンの積率相関係数product-moment correlation coefficient を指す。

 r_{xy} \equiv \frac {\sum (x_i - \bar x)(y_i - \bar y)/n}{\sqrt {\sum (x_i - \bar x)^2/n} \sqrt {\sum (y_i - \bar y)^2/n}} }}} 

{= \frac {\sum (x_i - \bar x)(y_i - \bar y)}{\sqrt {\sum (x_i - \bar x)^2}\sqrt{\sum(y_i - \bar y)^2}}
 ここで、分母は変数x,yそれぞれの標準偏差である。分子はx の偏差x_i-\bar xy の偏差y_i -\bar y を同時に考慮した場合の平均で、共分散 covariance という。

回帰直線回帰方程式
 x を独立変数、y を従属変数としたとき、
 y=bx+a
という直線関係が想定されるとする。
この場合、\sum \{y_i - (bx_i + a)\}^2 を最小とする、a,bを求めると、
\qquad b = \frac {\sum x_i y_i -n\bar x \bar y}{\sum x_i^2 -n\bar x^2},
\qquad a=\bar y - b \bar x

決定係数 coefficent of determination
 相関係数r は、回帰直線による当てはまりの尺度でもあり、r^2 を決定係数という。r=1 のとき、正確に当てはまる。


参照サイト

ヘルプ:数式の書き方 - Meta

$$$$を使わない数式の入れ方(表{自分流})

名称 $$$$を使う数式 $$$$を使わない数式
ルート \sqrt{a} :(√a):
ルート \sqrt[y]{x} :(y√x):
積分 \int_{z}^{y} x\,dx :∫(x,y,z)dx:

最終更新時間

2024年04月11日 (木) 23時26分59秒;
最終更新:2024年04月11日 23:26
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。