第二話　そんなにうまくゆくのかな？世の中直線だけじゃない

・・・こんばんわ～・・・ぐぅ、、、って、もう朝ぁ～？
んじゃ、オッハ～～。。。ねむくてねむくて、死にそうだぉ～。
前回の回帰分析で、経験値の予測をやったでしょ。
あれを見て、「そっかぁー、三日で３０００ポイント突破かー」って思ってホントにやってみたんだけど。。。
ぜんっっっっっぜん、足りないっ！
半分の１５００ポイントでストップしちゃったの。
かっ、勘違いしないでよね、これは科学的な検証なんだからっ。
べっ、別にゲームを始めたら、おもしろくって、はまって、止められなくなっちゃって、
学校行くのもお仕事も忘れて３日も徹夜しちゃったんじゃないんだからねっ！
くくぅー、、、そーだよねー・・・
もし、未来がぜーんぶ直線上にのっかってたら、予言なんてメチャかんたんだよね～。
ってなことで、今日のテーマは「直線だけじゃない、いろんなパターンの回帰分析！」
ぐぅ、、、。

PLAY:

いろんなモデルの歌 (MP3 Download)

未来は直線だけじゃない　可能性は無限大
指数関数ねずみ算　対数関数人の慣れ　変化は微分で記述する

直線たったの１次式　変化するのは２次３次
次数どんどん上げてけば　精度どんどん上がってく　万能なのは多項式

必殺テイラー展開で　どんなカーブも描けちゃう
判断ものさしＡＩＣ　モデルは意味とデータから

計算の前にモデルありき

まずは屈辱の経験値データ・・・やっぱ見る？
見せなきゃだめなんだよね、これは科学なんだから。。。（グッスン）

ゲームを始めて、最初のうちは調子よく進んでたんだけど、、、
そのうちだんだんハイになってきて、頭がポワ～ンってなっちゃったんだよね。
それが２日目にはモヤモヤ～って感じになって、ほとんど進まなくなっちゃったの。
直線回帰予測では「時間をかけるほど -> 経験値が上がる」って単純に思ってたんだけど、
実際には「後に行くほど、経験値は上がりにくくなる」ってことだったんだね。
それじゃあ、この「後に行くほど上がりにくい」って関係を、数学では何と言うでしょう？
えーっと、比例の反対だから、反比例、かな？
おしい、ちょっと違うんだ。
反比例っていうのは「後に行くほど、減ってゆく」ことでしょ。
経験値がどんどん減っていったら、悲しいよね・・・
そうじゃなくって、経験値は「後に行くほど、増え方が、減ってゆく」の。
反比例して減ってゆくものを、積み重ねるってこと。
反比例っていうのを式にすると、

y = 1 / x

で、積み重ねるっていうのは、文字通り積分のことだから・・・

Y = ∫ 1/x dx = ln ( x )

答えは「対数」。
えー、わかんなーい、、、って、こんなのその場で考えたってわかんないよ、ふつー。公式覚えてるかどうかだけ。
なので３日後の経験値は、直線じゃなくて、対数で予想した方がよかったんだ。

対数って知ってる？

「対数」って、あまり普段使わないし、イメージ湧かないよね。
学校では、たぶん「指数の逆」だって教わるんだけど・・・

y = a ^ x のとき、その逆の関係を
x = log[a] y と書いて、これを対数と定義する。

うーん、指数だってアヤフヤなところに、さらにその逆っていったら、なんかもうアヤアヤフヤフヤ。
ミクのイメージだと、対数っていうのは「後に行くほど、増え方が減ってゆく」関係のこと。
ほら、映画やゲームがヒットすると、続編で２とか３とか、出てくるでしょ。
でも２のインパクトって、たいてい初代より小さいよね。
で、３のインパクトは、２より小さい。
それが４とか５とかになると、もうアンタしつこく何やってんの？って感じ。
でもこれって、制作スタッフが手抜いてるんじゃなくって、
２で１と同じことやってるだけだと、１より評価が下がっちゃうんだ。
１と同じ評価になるためには、１の何倍も良くないといけないの。
ってな感じで、リメイクを重ねるにつれて、インパクトがどんどん小さくなってゆくっていうのが対数のイメージ。

その対数が、学校で教わるように「指数の逆」になっていることの方が、むしろ不思議。
それには秘密があるんだ。
指数って何だろう。
簡単に言えば「ねずみ算」のこと。
親ねずみが１０匹の子供を産んで、次の月に１０匹の子供が１０匹ずつ子供を産んで、
その次の月に全部の子供がまた１０匹ずつ子供を産んで・・・
ってな具合に、子供の数がどんどん増えてゆくのが指数関数。
ねずみは、1、10、100、1000、10000 ・・・って１桁ずつ増えてゆくんだ。※
月の数を x、ねずみの数を y にして式を書くと、

y = 10 ^ x

10を x回掛け算したら、つまり数字を x桁にしたら、y になりますよって意味だね。
次の世代が、今いるねずみの数だけ増えるんだから、
指数っていうのは、
　　増え方が、そのときの数(y)に比例して増える関係 のこと。
そうすると、対数との関係が見えてくるんじゃない？
対数っていうのは
　　増え方が、そのときの数(x)に反比例して増える関係 のこと。
ほら、なんか逆っぽいでしょ。

これを式で書いてみるよ。

指数：
　dy/dx = a y　　　　　-- 増え方が、そのときの数に比例して増える関係
　それは
　　　y = C a ^ x　　　-- 指数関数
　だったときです。
対数：
　dx/dy = (1/a) x　　　-- 上の指数の式の x と y を逆にしてみました
　dy/dx = a / x　　　　-- 増え方が、そのときの数に反比例して増える関係
　それは
　　　y = a ln | x | + C -- 対数関数
　だったときです。
　　（C は不定な定数、とりあえずなんでもいい数ってことだよ）

増え方って、数学の言葉で言うと「微分」。
記号で書くと dy/dx 。
増え方がわかっているとき、全体の関係がどうなるかっていうのは、積分するとわかるの。
こういうのを「微分方程式」って言うんだ。
でもって、指数・対数の考え方が、微分方程式の基礎中の基礎になってるんだね。

■

ねずみ算
オリジナルのねずみ算は、江戸時代の「塵劫記」という本に載ってます。
２匹のねずみが、１２匹の子供を産んで、その１２匹と親の２匹が次の月に１２匹ずつ子供を産んで、
その親子が全部、次の月に１２匹ずつ子供を産んで・・・
こんな風にどんどんねずみが増えていったら、１年後にねずみは何匹になるでしょう？
月数を x、ねずみの数を y にして式を書くと、
　　y = 2 * ( 7 ^ x )
最初の２は、親が２匹いたから。
後の７は、２匹の親と１２匹の子供を合わせて１４匹なんだけど、２匹で子供を産むから半分に割って７。
１年後は x = 12 のとき、ねずみの数はなんと２７６億８２５７万４４０２匹！

必殺、Ｎ次の多項式！

さて、ここまでで未来予測のパターンは３つ出てきたよ。
直線、指数、対数。
これで終わりなの？
そんなことないよね。
未来の変化パターンは無限にあるんだから、どんなにたくさん数式を作ってもカンペキにはならないの。
だったら、未来予測なんて無駄じゃない？
そうかなー。
たとえば１２色しかない色鉛筆だって、無限の色の風景を描くことができるじゃない。
同じように、いくつかの知ってるパターンを組み合わせれば、それなりに未来予測できるんじゃないかな。
それじゃあ回帰分析の色鉛筆は、いったい何色あるんだろう。
もちろんたくさん知ってるほど、たくさんの色が使えるんだけど、最低限はずせないのは「２次式」かな。
放り投げたボールは「放物線」を描いて飛んでゆくでしょ。
あの放物線は、数式で言えば２次式。
重力みたいに一定の力で引っぱっているときは、グラフは放物線のようなカーブになるんだ。
なぜ「２次」っていうんだろう？
それは、物体の位置=０次、物体の速度=１次、物体の加速度=２次になっているから。
一定の力で引っぱってるってことは、加速度が一定、だから２次式。
２次があるってことは、その上に３次だってあるんだ。
もし重力が一定じゃなくて、下に行くほど強くなってゆくみたいに変化していたら、
放り投げたボールは三次式になって飛んでゆくはず。
そのときは、加速度の変化、だから「加加速度」ってことになるかな。
その上は、加加加速度=４次、加加加加速度=５次、加加加加加速度=６次、加加加加加加・・・いててっ、舌かんじゃった。

ここで１つ、Ｎ次式の重要な必殺技を教えちゃいます。
いま、加速って言ったけど、実際のＮ次式には加速だけじゃなくて減速もありなの。
式の上では、＋プラスが加速になって、－マイナスが減速になるんだ。
例えば

y = - 3 x^2 + 5 ^x + 7

って式は、加速度 -3 で、速度が +5 。
最初は +5 で前進しているけど、-3 の力でだんだんブレーキがかかってきて、
そのうちストップして、今度は反対方向に動き出すの。
つまりこれは、ボールを上向きに放り投げたときの運動だね。
これのどこが必殺技なのか？
いま、２つの数字の加減速でもって、行って帰ってくるカーブが描けたよね。
この調子で、加減速をうまーく調整すれば、どんな形のカーブだって描けちゃうの！
　まず速度を決めて、（１次）
　カーブさせたかったら加減速を調整して、（２次）
　ちょっと加速し過ぎたかな、と思ったら「加加速度」＝加速度の変化を調整して、（３次）
　それで減速し過ぎちゃったかな、と思ったら、今度は「加加加速度」＝加速度の変化の変化を調整して・・・（４次）
　これをどこまでも続ければ、最終的にはどんなカーブだってＮ次式に収まっちゃうんだ。※
どんな形のカーブも無限次の式で表せる、これがＮ次式の必殺技。
名付けて「テイラー展開っ！」（ ← 必殺技っぽく、気合いと共に叫ぼう！）
例えば５次式のカーブが描きたかったら、とにかく

y = a x^5 + b x^4 + c x^3 + d x^2 + e ^x + f

という式の形を先に決めちゃうの。
あとは、a～f の６つのパラメータを決めれば予測が完成ってこと。
こういうやり方を、まとめて「多項式回帰」って呼んでるよ。

■	どんなカーブでも？どんなカーブでも、っていったけど、実はＮ次式では描けない線もあります。１点で急激にカクッと折れ曲がる線が描けるかどうかは、かなり微妙な問題です。有限次数では無理そうですが、無限次の極限で描けることもあります。とりあえず描けるカーブは、何度でも微分可能なものだと思ってください。

これでピッタリ、なんと999次式！

必殺、テイラー展開っ！
でもって、多項式っていうのは次数を大きくすれば、いくらでも精度が上がってゆくの。
２つの点があったら、両方を通る直線（=１次式の線）は１本だけ引けるよね。
同じように、３つの点を通る２次曲線は一本だけ引けます。
４つの点を通る３次曲線は一本だけ引けます。
５つの点を通る４次曲線は一本だけ引けます。
　　・・・
この調子で、もし１０００個の点があったら、それをピッタリ結ぶ９９９次曲線が計算できちゃうの。
でも、それって意味あるのかな？
９９９次曲線って、１０００個のパラメータがあるんだよ。
そんなの１０００個のデータをそのまま並べたのと、変わらないじゃない。
　９９９次曲線カンペキです、誤差が全然ありません！
・・・っていわれても、それで１００１個目の点がピッタリ予測できるかっていうと、そんなことないよね。
１０００個のデータの中には、本当に意味のある傾向と、今回たまたまそうなっただけの偶然が混じっているでしょ。
予測っていうのは、データの中から偶然を切り捨てて、意味のある傾向だけを取り出す作業。
じゃあ、どこに意味があって、どこが偶然なのか？
残念ながら、それは公式やコンピューターなんかじゃ見分けがつきません。
「この流れには、こんな力が働いてるんじゃないかな」って、元のデータの意味を考えるしか無いの。

例えば、

・モデル１：時間をかければかけるほど、経験値は上がるだろう。
・モデル２：長時間プレイすると疲れてくるから、後の方ほど経験値は上がりにくい。
・モデル３：もっとたくさんゲームをプレイすると、コツを掴んできて、経験値の上がりが早くなる。
・モデル４：大人になったら、だんだんゲームってものに飽きてくるのかな？

もしモデル３まで意味があるんだったら、上から３つで３次曲線にしよう、ってなるんじゃないかな。
モデル選びは試行錯誤。
データと意味との二人三脚で、いちばんピッタリするモデルを地道に探し出すの。
わけもわからず９９９次曲線とか作っても、なーんの役にも立たないぞ。

モデルを計るモノサシ

そうは言っても、どんな力が働いているのか、最初から分かっていれば何の苦労もないよね。
まだよく分かんないデータの中から、意味のある傾向を見つけ出すっていうのが、本当にやりたいことなんじゃないかな。
意味を見つけ出すのはコンピューターに１００％お任せってわけにはいかないけど、
だいたいこの辺まで意味があるんじゃないかなっていう、モノサシみたいな公式ならあるんだ。
中でも一番有名なのが、赤池の情報量規準(Akaike's Information Criterion)、略してＡＩＣ。
なんかスパイみたいで、ちょっとカッコイイよね（そりゃＣＩＡ！）。
ずばり答を出しますよーってものじゃなくて、モノサシだから規準なの。
ＡＩＣの考え方は、こんなの。

・パラメーターの数を増やすと、正確にはなるけど、モデルが複雑になってしまう。
・できるだけ少ないパラメーターで、そこそこ正確な、ちょうどいい具合のところを見つけ出したい。
・そのために、精度とパラメーター数の両方を合わせたポイントを付けて、
　ポイントが一番小さくなったときがベストってことにしよう。

そこで大事なのがポイントの付け方なんだけど、ＡＩＣではこんな風にしてまーす。

ＡＩＣ = -2 ln(最大尤度) + 2 (自由なパラメータ数)

たとえば多項式

y = a x^m + b x^(m-1) + c x^(m-2) + ・・・

についてのＡＩＣは、これ。

ＡＩＣ = n { ln(2π) + 1 + ln(σ^2) } + 2 (m + 2)
　　n はデータの数、
　　ちょっと気になる 2π って数は、正規分布から出てくるの。
　　　　※ この計算には、誤差が正規分布だっていう前提が入ってます。
　　σ^2 はデータとモデルのずれを二乗して足したもの、
　　σ^2 = (1/n) Σ {(データの値) - (モデルから計算で出した値)} ^ 2
　　　　 = (1/n) Σ {yi - (a x^m + b x^(m-1) + c x^(m-2) + ・・・)} ^ 2

なぜこんな計算なのか、っていうのは難しいからパス。
とりあえず、良いモデルを探すためのモノサシがありますよー、ってことでいいと思うんだ。

■	他のモノサシモノサシにはＡＩＣの他にもいくつかあります。ベイズ情報量規準（BIC）、最小記述長（MDL）などなど。

数式に書けるのがモデル

そもそもモデルっていったい何だろう？
ぶっちゃけいうと、「数式で書けるものがモデル」なんです。※

・まず数式で形を決めちゃって、
・次に実際のデータにあてはまるようにパラメータを調整しましょう、

っていうのが回帰分析の考え方。
とにかく数式で書けさえすれば、あとは最小二乗法でパラメータを決めるだけ。
最小二乗法っていうのは、こんな方法でした。

・実際のデータと、数式モデルとの食い違いを、２乗して足し合わせる。
・足し合わせた合計が一番小さくなるように、パラメータを調整する。
・具体的には、２乗して足し合わせた式を、それぞれのパラメータで微分する。
・パラメータの数だけ出てきた式を、連立方程式として解く。

詳しくは第１話を見てね。

たとえば指数モデルっていうのは、式に書くと

y = a Exp( b x )

これってパッと見にはわからないけど、うまいことすると直線と全く同じになっちゃうんだ。
そのテクニックは、両辺の対数をとること。

ln(y) = ln( a Exp( b x ) )
　　　= ln(a) + b x

これを

ln(y) = Y
ln(a) = A

って置き換えたら・・・

Y = A + b x

ほら、直線と全く同じだよ。
こんな感じに、うまく直線と同じ形に持ち込めればラッキー。
それがダメでも、直線と同じ手順で地道に計算すれば、たいていの数式で予測パラメータが調整できちゃうんです。

■	カーブが描けない数式中にはとても計算できないような数式もあります。そもそも微分できないとか。逆に考えて、微分して、連立方程式が解ければ、最小二乗法が適用できるということになります。

未来は直線だけじゃない、いろんなモデルがあるってこと。
なんとなーくわかってくれたかな？
未来予測に大切なのは、なんといってもモデル選び。
基になるモデルが違っていたら、その先の結果も別物になっちゃうんです。
でも、モデルを自動的に選んでくれるような万能公式はありません。
データの意味を考えて、試行錯誤するしかないの。
で、そのときになって、この数式にはこんな意味があるんだなーっていうイメージが無いと、こまっちゃう。
イメージには正解が無いし、教科書にも書けません。
アタリマエの人にとってはアタリマエで、知らない人にとってはぜんぜんわからない。
なので、アタリマエの人がやってるのを見て、そんなものかなーって感じ取るのが一番だと思うの。

さて、今回はいろいろ盛りだくさんだったね。
頭にぎゅう～っと詰め込んだら、なんだか眠くなってきちゃった・・・（徹夜３日目）
それじゃ、おやすみ～、、、ぐぅ。




Copyright(c) 2008 NakaNaka All Rights Reserved.