Hola, Amigo!(オーラ、アミーゴ)
友達の友達は友達だっ、みんなの友達、ミクでーす。
友達との相性ってとっても大切だよね。
あの子とあの子は相性ぴったり、とか。
あの子とはちょーっと相性悪いなー、とか。
気になって気になって、ソワソワしちゃう。
今日は、そんな相性の歌をお送りしまーす。
2つのベクトルそろったら
相性ぴったり100%
2つのベクトル横向いてたら
想いは互いにすれ違い
平均点を中心に
データベクトル内積とれば
関係ありなしわかっちゃう
それが相関ってことね
嫌いは好きの裏返し
180度反対側は
相関マイナス100%
関係なければ無視するでしょ
0%は90度
相関を求めてみよう
えーっと、相関っていうのも今や一般常識かなーって、思います。
相性ぴったりが相関ありありの100%。
全然関係ないかなーっていうのが相関なしの0%。
ちょっとひっかかっちゃうのが、相性が正反対ってとき。
反対なのはゼロじゃなくってマイナス100%。
火と水、水と油、犬と猿、天使と悪魔、みたいなのは、どっちかっていえばマイナス100%かな。
0%はまーったく関係ありません、ってこと。
たとえば、火とケータイ、水とネギ、犬とゾウリムシ、天使と牛丼、・・・って、ちょっと苦しいかな。
だから相関っていうのは、1からマイナス1までの数なんだね。
それでは本日のメインテーマ、「かわいさ」と「かしこさ」に相関はあるか!
ほら、よく言うじゃない、「女はアホな方がかわいい」って。
失礼しちゃうわ!(ぷんすか)
ミクみたいに、かわい〜っくて、かしこ〜い、スーパーレディーがいるっていうのに。
・・・ほら、墓穴を掘ったって・・・
えーっと、うるさい影の声はとりあえず無視しちゃって、計算コーナーいってみよー。
ミクが、かわいさ100、かしこさ100!
リンが、かわいさ80、かしこさ40!!
レンが、かわいさ30、かしこさ40!!!
あー、外野、うるさいうるさいうるさいっ!
もんくはいーっさい認めませーん!
だいたいレンは男だって。
いいのよっ!ショタなのよ、ショタっ!
まずまんなかを計算しまーす。
かわいさの平均、(100+80+30)÷3=70
かしこさの平均、(100+40+40)÷3=60
全員のポイントを、まんなかに合わせると、
ミクが、かわいさ+30、かしこさ+40!
リンが、かわいさ+10、かしこさ−20!!
レンが、かわいさ−40、かしこさ−20!!!
そんでもって、かわいさxかしこさを計算しちゃうね。
ミクが、 30 x 40 = 1200
リンが、 10 x(−20)=− 200
レンが、(−40)x(−20)= 800
ぜーんぶ合わせて
1200−200+800=1800
この合わせた数のことを「共分散」っていうんだ。
掛け算するとこが、昨日でてきた「分散」に似てるでしょ、覚えてるかな?
「共分散」がプラスになってるか、マイナスになっているかで、関係もだいたいわかっちゃいます。
ここではプラスだから、「かわいい」方が「かしこい」ってことだね。
「共分散」を「相関係数」に直すには、「距離」で割ってあげます。
距離ってなんだ?
「そんなときには 思い出してね ピタゴラスの定理」。
かわいさの距離=√{30x30+ 10 x 10 +(−40)x(−40)}
かしこさの距離=√{40x40+(−20)x(−20)+(−20)x(−20)}
電卓でピピッてすると、だいたい
かわいさの距離=51.0
かしこさの距離=49.0
くらいです。
それではラスト、
相関係数 = 共分散÷(かわいさの距離xかしこさの距離)
1800÷(51x49)=0.72
ということで、相関係数は72%でした。
ふうっ、ごくろうさま。
ということで、この結果からすると「かわゆい方がかしこい」んだねー、テヘッ(はぁと)
え、なになに、違ってる?
真実の値、ミクのかしこさ=ゼロで計算したら・・・
相関係数 −0.72!
くぅー、違うんだもん、違うんだもん!(熱暴走)
いったい何の計算をしたの?
(液体窒素)ふぅっ、と冷めたところで、、、
いまやったながーい計算は、いったい何をしてたのか、わかるかな?
いちばん大事なところは「かわいさxかしこさ」っていう掛け算なんだけど、これって何がでてくるんだろう。
数字のかたまりを見るとうんざり、って人も、グラフを見ると一目瞭然!
掛け算の答がプラスだったら、右肩上がりの線になってまーす。(ぐんぐん)
反対にマイナスだったら、右肩下がりの線にのっかってくるの。(しょぼしょぼ)
相関っていうのは、この上がり、下がり、をそのまま数字にしたものなんだ。
それでは次に、どうして「距離」で割るのか?
もし最初のポイントが、
ミクが、かわいさ10、かしこさ10!
リンが、かわいさ8、かしこさ4!!
レンが、かわいさ3、かしこさ4!!!
でも、意味は全然変わんないよね。
でも掛け算の答は100倍変わっちゃうよ。
どうしよう?
そう、おんなじ大きさに「拡縮」すればいいよね。
同じスケールに「拡縮」する、っていうのが距離で割る意味だったんだ。
拡縮しておんなじ大きさにそろえることを、よく「標準化」(normalize) っていうから、知ってるとちょっぴりエッヘンできるかもね。
ゲームに付いてるヒットポイントとかをよーくみると、点数の最後についているゼロはおまけで、ぜんぜん動かなかったりするんだよね。
1コンボ100点でも、1点でも、ゲームの中身は同じでしょ。
でも、1点より100点の方が「やった!あたった〜」って感じがするから、サービスで100倍してるの。
そんなゲームで「標準化」しちゃうと、100点も1点と同じになって、ちょっとがっかりかもね。
相関はベクトルの角度
さて、計算がカンペキになったところで、相関の意味をもっと深ーく探っちゃおう。
相性ぴったりってことは、2つの気持ちがぴったり同じ方向を向いているってことだよね。
反対に、いつもけんかばっかりしてるのは、正反対を向いてぶつかりあってるって感じかな。
この感じ、そっくりそのまま数学のことばになっちゃうんだ。
気持ちの向き、それは数学の言葉では「ベクトル」でーす。
もう一度、まんなかに合わせたときの数字を並べてみるね。
ミクが、かわいさ+30、かしこさ+40!
リンが、かわいさ+10、かしこさ−20!!
レンが、かわいさ−40、かしこさ−20!!!
ここで、ミク=X、リン=Y、レン=Zになっている3次元空間をつくってみると、
かわいさベクトル(X,Y,Z)=(+30,+10,−40)
かしこさベクトル(X,Y,Z)=(+40,−20,−20)
ってことです。(横に書き直しただけだよ)
で、相関係数って何のことかっていうと、実はこの2つのベクトルの角度のことだったのです。
相関係数=cosθ
かわいさxかしこさの角度を測ってみたら、43.8度になってました。
72%くらい、まあまあそろってる、っていう感じでしょ。
相関100%ぴったりは、角度0度。
相関マイナス100%敵同士は、角度180度。
ぜんぜん関係ない相関0%は、角度90度。
数学の世界では、関係ありませんってことを「直交する」って言い方しまーす。
直交するっていうのは、すれちがってるってことだね。
相関のおとしあな
おしまいに、ミクがはまったおとしあなをこっそり教えちゃいます。
その1、相関の数字は「目安」です。
たとえば0.72って数字を関係ありにするか、なしにするかを最後に決めるのは、数字を見たきみ自身なんだよ。
ミクは、相関あり、なし、っていうのはぜーんぶ計算で出てくるんだって思ってました。
だってだって、パソコンソフトだと、星マークが付いてるのが「相関ありっ!」、付いてないのが「相関なし〜」みたいに、出てくるんだもん。
相関ありなしの判断は、たとえば0.7以上くらいかなー、って感じで、だいたい業界標準で決めてるの。
最後は読み手の判断、ってことを忘れずにね。
その2、相関がないからといって、関係が無いとは限らない。
相関でわかるのは、まっすぐストレートな関係だけでーす。
たとえ海より深い関係があっても、最初がツンで、後がデレーっていうのは、相関なしになっちゃいます。
複雑な乙女心は、かんたんには解析できないのだ!
そんじゃね、Adios!(アディオス)