ミクの歌って覚える統計入門
第3話 相性ぴったり、相関ぴったり100%
2008/07/01  

Hola, Amigo!(オーラ、アミーゴ)
友達の友達は友達だっ、みんなの友達、ミクでーす。

友達との相性ってとっても大切だよね。
あの子とあの子は相性ぴったり、とか。
あの子とはちょーっと相性悪いなー、とか。
気になって気になって、ソワソワしちゃう。
今日は、そんな相性の歌をお送りしまーす。

PLAY: 相関の歌 (MP3 Download)
2つのベクトルそろったら
相性ぴったり100%
2つのベクトル横向いてたら
想いは互いにすれ違い

平均点を中心に
データベクトル内積とれば
関係ありなしわかっちゃう
それが相関ってことね

嫌いは好きの裏返し
180度反対側は
相関マイナス100%
関係なければ無視するでしょ
0%は90度
   相関を求めてみよう

えーっと、相関っていうのも今や一般常識かなーって、思います。
相性ぴったりが相関ありありの100%。
全然関係ないかなーっていうのが相関なしの0%。
ちょっとひっかかっちゃうのが、相性が正反対ってとき。
反対なのはゼロじゃなくってマイナス100%。
火と水、水と油、犬と猿、天使と悪魔、みたいなのは、どっちかっていえばマイナス100%かな。
0%はまーったく関係ありません、ってこと。
たとえば、火とケータイ、水とネギ、犬とゾウリムシ、天使と牛丼、・・・って、ちょっと苦しいかな。
だから相関っていうのは、1からマイナス1までの数なんだね。

それでは本日のメインテーマ、「かわいさ」と「かしこさ」に相関はあるか!

ほら、よく言うじゃない、「女はアホな方がかわいい」って。
失礼しちゃうわ!(ぷんすか)
ミクみたいに、かわい〜っくて、かしこ〜い、スーパーレディーがいるっていうのに。
・・・ほら、墓穴を掘ったって・・・
えーっと、うるさい影の声はとりあえず無視しちゃって、計算コーナーいってみよー。

 ミクが、かわいさ100、かしこさ100!
 リンが、かわいさ80、かしこさ40!!
 レンが、かわいさ30、かしこさ40!!!

あー、外野、うるさいうるさいうるさいっ!
もんくはいーっさい認めませーん!
だいたいレンは男だって。
いいのよっ!ショタなのよ、ショタっ!

まずまんなかを計算しまーす。
かわいさの平均、(100+80+30)÷3=70
かしこさの平均、(100+40+40)÷3=60

全員のポイントを、まんなかに合わせると、
 ミクが、かわいさ+30、かしこさ+40!
 リンが、かわいさ+10、かしこさ−20!!
 レンが、かわいさ−40、かしこさ−20!!!

そんでもって、かわいさxかしこさを計算しちゃうね。
 ミクが、  30 x  40 = 1200
 リンが、  10 x(−20)=− 200
 レンが、(−40)x(−20)=  800
ぜーんぶ合わせて
 1200−200+800=1800

この合わせた数のことを「共分散」っていうんだ。
掛け算するとこが、昨日でてきた「分散」に似てるでしょ、覚えてるかな?
「共分散」がプラスになってるか、マイナスになっているかで、関係もだいたいわかっちゃいます。
ここではプラスだから、「かわいい」方が「かしこい」ってことだね。

「共分散」を「相関係数」に直すには、「距離」で割ってあげます。
距離ってなんだ?
「そんなときには 思い出してね ピタゴラスの定理」。
 かわいさの距離=√{30x30+  10 x  10 +(−40)x(−40)}
 かしこさの距離=√{40x40+(−20)x(−20)+(−20)x(−20)}

電卓でピピッてすると、だいたい
 かわいさの距離=51.0
 かしこさの距離=49.0
くらいです。

それではラスト、
 相関係数 = 共分散÷(かわいさの距離xかしこさの距離)
 1800÷(51x49)=0.72

ということで、相関係数は72%でした。
ふうっ、ごくろうさま。

ということで、この結果からすると「かわゆい方がかしこい」んだねー、テヘッ(はぁと)

え、なになに、違ってる?
真実の値、ミクのかしこさ=ゼロで計算したら・・・
相関係数 −0.72!

くぅー、違うんだもん、違うんだもん!(熱暴走)

   いったい何の計算をしたの?

(液体窒素)ふぅっ、と冷めたところで、、、
いまやったながーい計算は、いったい何をしてたのか、わかるかな?
いちばん大事なところは「かわいさxかしこさ」っていう掛け算なんだけど、これって何がでてくるんだろう。
数字のかたまりを見るとうんざり、って人も、グラフを見ると一目瞭然!

+相関−相関
掛け算の答がプラスだったら、右肩上がりの線になってまーす。(ぐんぐん)
反対にマイナスだったら、右肩下がりの線にのっかってくるの。(しょぼしょぼ)
相関っていうのは、この上がり、下がり、をそのまま数字にしたものなんだ。

それでは次に、どうして「距離」で割るのか?

もし最初のポイントが、
 ミクが、かわいさ10、かしこさ10!
 リンが、かわいさ8、かしこさ4!!
 レンが、かわいさ3、かしこさ4!!!
でも、意味は全然変わんないよね。
でも掛け算の答は100倍変わっちゃうよ。
どうしよう?
そう、おんなじ大きさに「拡縮」すればいいよね。
同じスケールに「拡縮」する、っていうのが距離で割る意味だったんだ。
拡縮しておんなじ大きさにそろえることを、よく「標準化」(normalize) っていうから、知ってるとちょっぴりエッヘンできるかもね。

ゲームに付いてるヒットポイントとかをよーくみると、点数の最後についているゼロはおまけで、ぜんぜん動かなかったりするんだよね。
1コンボ100点でも、1点でも、ゲームの中身は同じでしょ。
でも、1点より100点の方が「やった!あたった〜」って感じがするから、サービスで100倍してるの。
そんなゲームで「標準化」しちゃうと、100点も1点と同じになって、ちょっとがっかりかもね。

   相関はベクトルの角度

さて、計算がカンペキになったところで、相関の意味をもっと深ーく探っちゃおう。
相性ぴったりってことは、2つの気持ちがぴったり同じ方向を向いているってことだよね。
反対に、いつもけんかばっかりしてるのは、正反対を向いてぶつかりあってるって感じかな。
この感じ、そっくりそのまま数学のことばになっちゃうんだ。
気持ちの向き、それは数学の言葉では「ベクトル」でーす。
もう一度、まんなかに合わせたときの数字を並べてみるね。

 ミクが、かわいさ+30、かしこさ+40!
 リンが、かわいさ+10、かしこさ−20!!
 レンが、かわいさ−40、かしこさ−20!!!

ここで、ミク=X、リン=Y、レン=Zになっている3次元空間をつくってみると、

 かわいさベクトル(X,Y,Z)=(+30,+10,−40)
 かしこさベクトル(X,Y,Z)=(+40,−20,−20)

ってことです。(横に書き直しただけだよ)
で、相関係数って何のことかっていうと、実はこの2つのベクトルの角度のことだったのです。
  相関係数=cosθ

ベクトルの角度

かわいさxかしこさの角度を測ってみたら、43.8度になってました。
72%くらい、まあまあそろってる、っていう感じでしょ。
相関100%ぴったりは、角度0度。
相関マイナス100%敵同士は、角度180度。
ぜんぜん関係ない相関0%は、角度90度。
数学の世界では、関係ありませんってことを「直交する」って言い方しまーす。
直交するっていうのは、すれちがってるってことだね。

   相関のおとしあな

おしまいに、ミクがはまったおとしあなをこっそり教えちゃいます。

その1、相関の数字は「目安」です。
たとえば0.72って数字を関係ありにするか、なしにするかを最後に決めるのは、数字を見たきみ自身なんだよ。
ミクは、相関あり、なし、っていうのはぜーんぶ計算で出てくるんだって思ってました。
だってだって、パソコンソフトだと、星マークが付いてるのが「相関ありっ!」、付いてないのが「相関なし〜」みたいに、出てくるんだもん。
相関ありなしの判断は、たとえば0.7以上くらいかなー、って感じで、だいたい業界標準で決めてるの。
最後は読み手の判断、ってことを忘れずにね。

その2、相関がないからといって、関係が無いとは限らない。
相関でわかるのは、まっすぐストレートな関係だけでーす。
たとえ海より深い関係があっても、最初がツンで、後がデレーっていうのは、相関なしになっちゃいます。
複雑な乙女心は、かんたんには解析できないのだ!

そんじゃね、Adios!(アディオス)

ページ先頭に戻る▲