すごブロ

「好き」をブチ抜く

本、映画、科学、哲学、心理、すごい人の考え方、など。

確率の本質をイメージしやすい入門書 【プログラミングのための確率統計】

記事の内容

 

今回は、「プログラミングのための確率統計」という本を紹介する。

 

本書は、確率という抽象的な概念を理解するのを助けてくれる。具体的な算数の話に置き換えてくれるからだ。

 

そのために、「確率とは面積だ」する。

 

確率統計の初心者にも、ある程度勉強してきた人にも、とても学びが多い本だと思う。

 

今回の記事では、ある程度、確率統計を勉強したことがある私が、とても学びになったテーマをまとめたい。

 

 

 

プログラミングのための確率統計 平岡和幸・堀玄

 

 

 

本書の中心メッセージ

・確率とは面積や体積を一般化したものだ
・確率変数とは名前は変数でも正体は関数だ

 

 

 

 

神様視点と面積

 

確率というものをイメージしたい。

 

そのために、静止画として眺める。本書では、これを「神様視点」と呼んでいる。この見方によって、「確率とは面積だ」という本書のメッセージが浮き彫りになる。

発想の転換として、「一般的なサイコロによる確率のイメージ」を追放すること。


神様から見た、様々な世界のあるパラレルワールドの全体を考える。神様は全体を見ているのだから、すべては確定している。だから、パラレルワールドを塗り分けることも当たり前にできる。

 

パラレルワールド全体をΩで表し、個々の世界をωで表す。

そのパラレルワールドの塗り分けこそ面積であり、確率になる。

 

神様から見れば、確率変数とは、確定したただの関数f(ω)のこと。

世界ωを入力すれば、その面積を返してくれる関数が、確率変数。

 

しかし、人間は自分がどの世界にいるか分からない!!!!つまり、ωが不確定になるから、f(ω)の値も不明になる。

 

神様の視点・・・完全に確定した面積の問題
人間の視点・・・不確定に揺らぐ確率の問題
 
 
この両者の視点を自在に行き来できることが、確率をイメージするコツ。
 
確率変数ではどの世界でどんな値が出るかを特定している。一方、確率分布は「どの世界」までは特定していない。
 
 

 

 

条件付き確率も、ベイズも「割合」で

 

確率を面積として扱うことで、ただの算数としてイメージできる。

同時確率、周辺確率、条件付き確率の3点セットも、面積計算でイメージ。

 

条件付き確率は、割合としてイメージできる。

・p(工場|A) はA県の土地の50パーセントは工場」という意味
・p(A|工場)は国の工場の総面積のうちでA県にあるのは20パーセントという意味

 

 

ベイズ


逆問題   結果を見て原因を推測する。

 

つまり、P(原因 | 結果)を求めたい。

 

さっきの条件つき確率を面積の割合でイメージすれば、

求めたいのは、

 

(全体の中の結果の割合)の中の原因の割合

 

になる。

 

 

個人的に、本書のベイズの説明がとても分かりやすかった。

 

確率を面積として考える。神様視点からは、それらの関係は「割合」になる。だから、イメージも計算もしやすい。ベイズの原因と結果という扱いにくい概念も、担なる面積計算としてイメージできた。そして、原因、結果という概念への注意点も記載されている。

 

 

 

 

 

平均値と期待値の違い

 

大前提
・ゆらがない量たちの平均はゆらがない量 (→神様視点につながる)
・ゆらぐ量たちの平均はゆらぐ量 
 
平均にゆらぐゆらがないはあるが、期待値にはない。期待値はゆらがない量。つまり、神様視点の量が期待値。
 
期待値は、パラレルワールド全体を見渡しての平均と解釈できる。
 
神様視点で見れば全ては確定している。
期待値はパラレルワールドを横断観測する話だから、一つの世界ωに縛られた人間には本来手の届かない量のはず。
 
けれど、私たち人間にも、大数の法則のおかげで、ゆらぐはずの平均を収束させることができる。
 
 
 
 
本書含め、おすすめの本を紹介する。
 

 
 

 
 

 
 

 

 

おすすめ記事

 

interaction.hatenadiary.jp

interaction.hatenadiary.jp

interaction.hatenadiary.jp

interaction.hatenadiary.jp

interaction.hatenadiary.jp