統計入門
1次元データ
代表値 averages
分布のしかたを中心的な値で示したもの。平均、中央値、最頻値
平均 mean (算術平均 arithmetic mean)
観測値
の和をデータ数
で割ったもの
メディアン、中央値 median
観測値を大きさの順に並べ替えたときの中央の値
データ数が偶数の時の取扱い
モード、最頻値 mode
分布の峰に対応する値
散らばりの尺度
レンジ、
範囲 range
最大値と最小値の幅
平均偏差 mean deviation
偏差deviation(
) の平均
分散 variance
偏差を絶対値ではなく、2乗した上での平均
標準偏差 standard deviation
分散の平方根(dimensionを同じくする)
変動係数 coefficient of variation
分布の中心が著しく異なる場合など、平均を考慮した上での比較(無名数)(平均が大きいと分散が大きい場合など)
分布の形状
歪度 skewness 分布の非対称性を示す。値が正の時は、右すそが伸びている。
尖度 kurtosis 分布の尖り具合を示す。
中央値 median
- 値が点の場合で有効ケース数が偶数( )の時には2方法がある。
ジニ係数 Gini Coefficient 不平等度の指標 (ただし、
)
2次元データ
相関関係 2変数間の関係。特に直線関係を指す場合が多い。
相関係数 correlation coefficent
通常、ピアソンの積率相関係数product-moment correlation coefficient を指す。
ここで、分母は変数
それぞれの標準偏差である。分子は
の偏差
と
の偏差
を同時に考慮した場合の平均で、
共分散 covariance という。
回帰直線、
回帰方程式
を独立変数、
を従属変数としたとき、
という直線関係が想定されるとする。
この場合、
を最小とする、a,bを求めると、
,
決定係数 coefficent of determination
相関係数
は、回帰直線による当てはまりの尺度でもあり、
を決定係数という。
のとき、正確に当てはまる。
参照サイト
$$$$を使わない数式の入れ方(表{自分流})
名称 |
$$$$を使う数式 |
$$$$を使わない数式 |
ルート |
|
:(√a): |
ルート |
|
:(y√x): |
積分 |
|
:∫(x,y,z)dx: |
最終更新時間
2024年04月11日 (木) 23時26分59秒;
最終更新:2024年04月11日 23:26