統計に使うデータの種類~質的・量的データ、名義・順序・間隔・比例尺度~

統計解析で使うデータは大きく質的データと量的データにわかれます。

これ、必ず統計のテキストの最初のほうに出てきますよね。

統計のテキストで何が嫌って、統計を始める前に知っておくべき用語やこういうデータの名前とか、そういうところではないでしょうか。

でもこれら、なぜテキストの何ページも使って書かれているかというと、これらがわかっていないと、解析手法が適切に選べない・正しい解釈ができない・データの処理の仕方がわからない…そんな事態が起こるからなのです。

特に、解析ソフトSPSSをお使いの方は要注意。※ほかのソフトのことは知りません

SPSSさんは、間違った変数の定義づけや設定をしても、なんかうまいこと解析してくれちゃうことが多いです。

なんか解析できた、p値が0.05未満だからOK!

そんな安易な使い方をされている方、実はかなーり多いのではと思っております。

でもそれはいかんので、眠くならないスライド2枚で、データの種類・尺度の名前をおさえてください。

質的データは、名前、種類、分類などにただただ番号をつけて区別したデータのこと。

性別・血液型、順位・学年・満足度得点などがあげられますが、このうち

性別・血液型のように、他のものと区別・分類するためのものを名義尺度

順位・学年・満足度得点のように、1,2,3…の順序に意味はあるが、その数字の間隔には意味がないものを順序尺度と呼びます。

そして、量的データは、計測機器などで測定できる数値で、意味のある単位がつくデータのこと。

年齢・点数・時刻、身長・体重・速度などがあげられ、このうち

年齢・点数・時刻のように数値の目盛が等間隔になっているものを間隔尺度

身長・体重・速度のように、原点(例えば“0”)があり、間隔や比率に意味があるものを比例尺度と呼びます。