ミクの歌って覚える統計入門
第2話 どおして、どおして分散は二乗なの?
2008/07/01  

レディースあんどジェントルメン、元気してるかなー。
インテ●はいってる、メガネっ娘ミクの時間がやってまいりました。
今日も元気に熱暴走っ、じゃなくて、歌っちゃうよ。
さっそく本日の1曲目、いっきまーす!

PLAY: 分散2乗の歌 (MP3 Download)
どおして分散は 二乗の和なの
絶対値足しても いけないのかな?
そんなときには 思い出してね
ピタゴラスの定理

平面の距離ならば ルートX二乗にY二乗
3次元ならば ルートX二乗にY二乗 Z二乗
N次元ならばー N個の二乗の和をとれば
距離を表すの それが分散の意味
   どおして分散は二乗なの?

みんなー、平均って知ってるよね。
ばかにすんなー、そんなの常識だって。
うんうん、それじゃあ分散は?
あれ、急に声がちっちゃくなっちゃったかなー。
そう、分散ってのは「ばらつき」のことだったよね。
平均が同じでも、みーんな平等に50点、っていうのと、半分勝ち組の100点、半分負け組の0点、っていうのでは、空気がぜんぜんちがうじゃない。
分散がおおきい、ってことは不平等ってことだね。

それでは、みなさんお待ちかねの計算コーナーでーす。
ほら、そこ、ぶーぶーいわないっ。
ミクが100点、リンが20点、レンが30点、平均はいくつでしょー。
えっ、ミクが100点採ったの見たことない、いつもと逆ですって?
うっ、うっさいわねー。
いーじゃない、問題の中くらい。(ぶつぶつ) で、つっこみどころはそこじゃなくって、平均はいくつかなってとこ?
そう、50点。
(100+20+30)÷3=50。

で、ここからが本題。
分散はいくつでしょー。
ここで、ミクはテストでこう書きました。
{(100−50)+(50−20)+(50−30)}÷3 = 33.3。
そーしたら、バツ!
えー、ちがうの?
だって、まんなかからどれだけ「ばらついてるか」でしょ。
だったら、みんなの点差を足して割ったらいいと思うの。
なーんか、なっとくいかないなー。

そこで、こっそりリンの答案見ちゃいました。
ほら、やっぱり逆だろうって、、、
うっ、うるさい、うるさい、うるさいっ!
いいんだもんっ、ミク負けないんだから。
そしたら、こーんな難しい計算をやっていたんです。

{(100−50)x(100−50)
 +(50−20)x(50−20)
 +(50−30)x(50−30)}÷3 = 1266.6。

どーして、どーして2こづつ掛け算しなくちゃいけないの。
もしかして、ミクを陥れるための陰謀?

あぶない、あぶない、これは極秘に調査しなくては・・・
・・・そーしたら、わかっちゃったのです。
いい、よく聞いてね、
 「データのばらつきとは、平均点からの距離を表している」
んだよ。

いきなり距離? 距離ってなんだ?
「そんなときには 思い出してね ピタゴラスの定理」なのです。
直角三角形を書いてみればわかるけど、まんなかから点(X, Y)までの距離は、
 距離=√(X^2 + Y^2)
でした。
ほら、2つづつ掛け算するってとこが似てるでしょ。
じゃあこんどは3Dにしてみるね。
まんなかから点(X,Y,Z)までの距離は、
 距離=√(X^2 + Y^2+Z^2)
になっちゃいます。

ピタゴラスの定理
ここで、距離の式をよーく見て、
 X=ミク
 Y=リン
 Z=レン
って思ったら、、、
もうわかっちゃったよね。
3人の点数の「ばらつき」は、「まんなかからどれだけ距離があるか」ってことだったんだ。

もし4人目が入ってきたら、
 距離=√(X^2 + Y^2+Z^2+ω^2)
ってな感じで、なんと4次元空間の距離になっちゃいます。
もう普通の絵には描けません。なんとか強引に描いちゃうと、こんな感じ。

ピタゴラスの定理4次元
でも、距離っぽいところはそのままで、なんとなーく「まんなかから離れてるんだなー」って感じです。
4次元空間って、意外と身近なところにあったんだねー。
1クラス50人だったら、なんと50次元空間!
空間っていうとSFチックでかっこいいよね。

でもちょっと待った!
距離の式にはルート√がくっついてるけど、分散にはルートが無いぞ?
そーなんです。
分散っていうのは、正しくは「距離の二乗」だったんだね。
で、距離そのものに直すには分散にルート√をくっつけて、できあがったのが「偏差」です。
 √分散=偏差

さっきのミク、リン、レンだと、√1266.6 = 35.6 くらい。
ほら、それっぽい距離になったでしょ。

偏差っていうと、受験生はみんないやーな顔をするんだよね。
「偏差値」っていうのは、みんなの平均が50、偏差が10になるように調整した数のこと。
つまり「みんなとどれだけ離れているか」ってことなんだ。
70は英才! 60だったらかなりいい、50が真ん中・・・
なんか、友達なくしそう。

ちなみに、最初にミクがやってたのは「平均偏差」って呼ばれているんだって。
でも、あんまり使われていないみたい。
「距離」のほうが意味があるからね。
でもでも、お情けで5点くらいくれてもいいのになー。
またミクがペケの掃除当番だよー、くうぅ。。。

さーて、本日もお別れの時間です。
もう分散も偏差も怖くないよねっ!
でも調子にのって「N次元空間の内積が、、、」なんてミエはってると、友達なくしちゃうぞ!
そんじゃねー、Goodbye!

  (・・・掃除当番、くうぅ。。。)

ページ先頭に戻る▲