kNakajima's Blog

技術系のアウトプットブログです。

マンガでわかる統計学 内容整理

 

マンガでわかる統計学

マンガでわかる統計学

 

統計学の学び直しシリーズ第一弾として上記の本を読んだために簡単にまとめ。
統計学自体は一通り勉強したことがあったので、サクサク読めました。
今まであやふやだった基本用語の整理はできたと思います。
今後、復習しやすいように本書で出てきた統計学の基本用語をまとめておこうと思います。

  

1章 データの種類

数量データ
定量的に扱うことができるデータ
例. 気温, 身長など

カテゴリデータ
定量的に扱うことができないデータ
例. 天気, 資格の難易度など

2章 数量データ

階級
データを値の範囲ごとに分ける区切り

階級値
その階級の範囲の真ん中の値

度数
その階級に属するデータ数

相対度数
全データに対して、その階級に属するデータの割合

平均
一般的な平均は相加平均と呼ばれる。
他にも、幾何平均, 調和平均などがある。

中央値
データをソートしたときに、真ん中に来るデータの値

標準偏差
データの散らばりの度合い
(最小で0となる。)

推測統計学
標本から母集団の状態を推測することを目的とした統計学

記述統計学
母集団 = 標本 として、集団の状況を表すことを目的とした統計学

3章 カテゴリデータ

単純集計表
カテゴリデータの状況の雰囲気を掴むために利用

4章 基準値と偏差値

基準化(標本化)
データ値の価値を検討しやすくするためのデータ変換

基準値
基準化されたデータの値
特徴として、平均値 0, 標準偏差 1となる。

偏差値
偏差値 = 基準値 × 10 + 50 
平均値 50,  標準偏差 10 となる。

5章 確率

確率密度関数
階級の幅を極限まで狭めることでできる曲線
積分すると1になり、面積は確率と等しい。
代表例として、正規分布, 標準正規分布, カイ二乗分布, t分布, F分布などがある。

正規分布
引数として平均と標準偏差をとる。
平均を中心に左右対称となる。

標準正規分布
正規分布において、平均を0, 標準偏差を1とした場合
基準化したデータの分布は標準正規分布に従う。

6章 相関

相関係数
数量データと数量データの直線的な関連度合いを示す値
範囲は -1 ~ 1であり、-1に近いほど負の相関があると言い、
1に近いほど正の相関があると言う。また、0のときは無相関と言う。

相関比
数量データとカテゴリデータの関連度合いを示す値
範囲は 0 ~ 1であり、1に近いほど相関が強いと言い、0に近いほど相関が弱いと言う。

クラメールの連関係数
カテゴリデータとカテゴリデータの関連度合いを示す値
範囲は 0 ~ 1であり、1に近いほど相関が強いと言い、0に近いほど相関が弱いと言う。

7章 検定

検定
母集団について分析者が立てた仮説が正しいかどうかを、
標本データから推測する分析手法のこと。
目的に合わせて、どの検定手法を利用するかを決める。

帰無仮説
立証が難しい肯定的な仮定を充てる。

対立仮説
帰無仮説に対立する仮定

棄却域
確率密度関数において、対立仮説が正しいとみなす範囲
検定手法によりどの分布に従うかは異なる。
(帰無仮説が正しい確率は最大で有意水準と等しい。)

有意水準
棄却域の範囲を決める値
(一般的に0.05か0.01とする。)

検定統計量
標本データを一つの値に変換したもの
求め方は検定手法により異なる。