単相関・重相関・回帰分析・相関分析…統計用語のいろいろ不統一問題
普段とちがう解析ソフトの結果や、異なる領域(研究室単位でも)の研究でときどき出てくる、これ知らない統計用語、ありませんか。
私はこのお仕事をはじめてから、まあよく出会います。
で、いちいちうろたえます。「勉強不足だったのかな?!」「やっぱり統計わかんないわぁ」と。
でも冷静になると、ただただ文化の違う、いわゆる方言なのかなと気づくので、合間合間に皆さんにも共有しようと思います。
はいまずは、単相関・重相関ってなに?!について。
結論。
「単相関」=ただの「相関」
です。
具体的な例を示しましょう。
たとえば、野球選手30名の、100m走タイム、遠投、球速、懸垂、握力を測ったとします。
球速に関わってるのはなんだろう?を調べたい時、相関分析を選んだとします。
この結果わかるのは、球速ー100m走、球速ー遠投、球速ー懸垂、球速ー握力、この組み合わせのそれぞれの相関の強さです。
相関係数=相関の強さ
ですよ。
スライド中のヒートマップとは、エクセル統計独自のサービスで、-の相関なら赤に、+の相関なら青にセルを塗ってくれて、色の濃さで相関の強さをぱっと見わかるようにしてくれるものです。
ぱっと見、100m走と遠投には-の強めの相関があって、球速と遠投には+の強めの相関があるなぁ、そんなことがいえますね。
さてこの相関分析の結果ですが、この、「それぞれ1対1のペアの相関」=「単相関」と呼ぶわけです。
なるほど、でも、球速ってきっと1つの要素だけじゃなく、100m走、懸垂、遠投、握力も?いくつも関わっているはずよね?
そう思いますよね、まあそうでしょう。
つまり、球速は100m走、懸垂、遠投、握力がまとめて関係している可能性がある、ということで、
→「いくつも同時に相関がある」=「重相関」
そう呼んでいるわけです。
ただし、「重相関分析」そんなものはありません。
単相関分析➡これも言いませんね。単相関の検定=相関分析です。
複数の要因が関わっていることを調べる検定方法としては、重回帰分析(またはロジスティック回帰分析)を使いますよ。
なので表現の仕方としては、「重相関を調べるために重回帰分析をする」「単相関を調べるために相関分析をする」でしょうかね。
混乱しますよねえ。