統計に使うデータの種類~質的・量的データ、名義・順序・間隔・比例尺度~
統計解析で使うデータは大きく質的データと量的データにわかれます。
これ、必ず統計のテキストの最初のほうに出てきますよね。
統計のテキストで何が嫌って、統計を始める前に知っておくべき用語やこういうデータの名前とか、そういうところではないでしょうか。
でもこれら、なぜテキストの何ページも使って書かれているかというと、これらがわかっていないと、解析手法が適切に選べない・正しい解釈ができない・データの処理の仕方がわからない…そんな事態が起こるからなのです。
特に、解析ソフトSPSSをお使いの方は要注意。※ほかのソフトのことは知りません
SPSSさんは、間違った変数の定義づけや設定をしても、なんかうまいこと解析してくれちゃうことが多いです。
なんか解析できた、p値が0.05未満だからOK!
そんな安易な使い方をされている方、実はかなーり多いのではと思っております。
でもそれはいかんので、眠くならないスライド2枚で、データの種類・尺度の名前をおさえてください。
質的データは、名前、種類、分類などにただただ番号をつけて区別したデータのこと。
性別・血液型、順位・学年・満足度得点などがあげられますが、このうち
性別・血液型のように、他のものと区別・分類するためのものを名義尺度、
順位・学年・満足度得点のように、1,2,3…の順序に意味はあるが、その数字の間隔には意味がないものを順序尺度と呼びます。
そして、量的データは、計測機器などで測定できる数値で、意味のある単位がつくデータのこと。
年齢・点数・時刻、身長・体重・速度などがあげられ、このうち
年齢・点数・時刻のように数値の目盛が等間隔になっているものを間隔尺度、
身長・体重・速度のように、原点(例えば“0”)があり、間隔や比率に意味があるものを比例尺度と呼びます。