異端の統計学ベイズ は聖典といっていい

統計検定3級の試験を先日受けてきた。その過程で色んな統計の本を読んできた。いま、読み終わったこの「異端の統計学ベイズ」はマジ聖典だった。これを読めば、いま、話題のデータサイエンティストとか、ビックデータが背景としている思想の根本が理解できる。

そして、文系で統計の勉強をしている人は、この本で歴史を理解しておくことが勉強上も超お勧め。モチベーションの維持に役立ちまくること請け合いでした。無味乾燥な数式の背景の人間的すぎる事情を理解し、かつ統計の実践的事例をここまで並べたてられて、統計をやりたくない人はいないのではないだろうか。という傑作。

 もしインターネットが関わるビジネスをやっているのであれば、基礎的な会計知識を理解するのと同じかそれ以上のレベルで理解していないといけないこと、がベイズ統計だと思う。

 何でかというと、レコメンドエンジンがつくれるとか、検索エンジンの根幹がベイズだから、というだけでなく、人間の推論がベイズ的に進んでいくらしいから。
 と、いうことは、人間の「効用」感覚、ものを選ぶときの基準もベイズ的に推論されているということで、人間の意思決定を左右する「事前確率」を推定したり、もともとの歪み部分を推定できれば、人類が何をするか、が確率的に推定できるようになる。
 これは、革命的なことで、今までの政治的なシステムや、社会的な契約概念が、人間というシステムのほぼ正しいであろう評価によって塗り替わることになる。というか、人間が人間を推測可能な集団として扱うことができるようになる、ということだ。これは、かなり大変なことだと思う・・・。今まで言語によってしか抽出されてこなかった人間理解の様々なモデル(性格とか心理学とか)が、統計的な測定可能なもので、確率分布可能なものに変わるわけで・・・。

 あと、よく、データサイエンティストはノンパラメトリックな解析手法を使うと言われるけど、それは事前確率を使わない派閥らしい、それが結果にどういうインパクトがあるのかは、まだよく分からないけど・・・。


 本文ポイントいくつか
  ・BUGS(405ページ) 無料ですぐに使えるベイズ解析ソフトウェア。「ギブス・サンプリングを使ったベイズ統計」の略。WinBUGSなど、いくつかのバージョンがある。
  ・ナッシュ均衡(422ページ) 情報が不完全だったり欠陥があったりするゲームでの「ナッシュ均衡」がベイズの法則の帰結であることを示している。
  ・学習支援システム(443ページ) カーネギー・メロン大学が1980年代末に開発したベイズのコンピュータープログラムが、毎年50万人以上の学生に使われている。認識的学習支援システム(コグニティブ・チューター)と呼ばれるこのプログラムのもとになっているのは、ベイズが我々の自然な学習の方法-すなわち漸時習得の手順を代行しているというジョン・R・アンダーソンの見解である。・・・従来のやり方で学習を進めた生徒の三分の一の時間で、同等ないしはそれ以上の内容を習得している。

 
 訳者あとがきのポイント
  ・共役事前分布(273ページ) 積分計算を可能にする方法
  ・ワルドの貢献(264ページ) 統計推論にゲーム理論の観点を導入して統計的意思決定論をまとめた。新たに許容的(アドミッシブル)という概念を作り出し、(厳密には様々な条件がつくのだが)事前確率をすべて考えたときに、それらの事前確率から得られたベイズ推測全体が、ある意味で最良な推測(アドミッシブルな推測)全体と一致していることを数学的に示した。つまり、最良な推測を考えることは、全体としてベイズ推測を考えることに等しいという事実を証明したのだ。
  


 訳者あとがきの主な参考図書
  『統計的方法と科学的推論』フィッシャー 岩波書店
  『確率・統計』 楠岡成雄 森北書店
  『ベイズ統計学とその応用』 鈴木雪夫ほか 東京大学出版会
  『ベイズ統計学概説』 松原望 培風館
  『実践としての統計学』 佐伯胖ほか 東京大学出版会
  『統計学を拓いた異才たち』 デイヴッド・サルツブルグ 日本経済新聞出版社