その数学が戦略を決める
山形浩生氏の翻訳つながりで、久々に起業に絡んだ話題も交えつつ、もう1冊。
本書は、統計学がいかに実社会で活躍しているかを熱く語った一冊。気軽に読める話題ばかりだが、参考文献も多数掲載されていて、学術的な裏づけはしっかりしてそうだ。
- 作者: イアン・エアーズ,山形浩生
- 出版社/メーカー: 文藝春秋
- 発売日: 2007/11/29
- メディア: 単行本
- 購入: 98人 クリック: 2,063回
- この商品を含むブログ (218件) を見る
本書では、「絶対計算」という変な言い回しではあるが、昔からある回帰分析、それらに加えてニューラルネットワークなども使った統計的手法が、いかに専門家の直感を上回る高い確度で予測を的中させるかという事例が多数紹介されている。
例えば、医療分野とかの典型的なデータマイニングに加えて、生産年によるワインの良し悪しを気象データから予測したり、脚本から映画がヒットする/しないを判断するという分野まで、データ解析からの予測の方が、専門家の予想結果に対して優位なのだ。
私も学生時代には、本書の一部に出てくるような計算を、IRIXとかSunOSとかの商用UNIX上でやっていたことがあるので、多少の前提知識はあるのだが、文章は単純かつ明快で万人向けにおすすめできる本だと思う。
ただ、本書を個人的に積読*1コーナーから、ネクスト読書サークルへ移動させたキッカケになった楠 正憲氏の「雑種路線でいこう」のエントリーにあった「回帰分析・無作為抽出・遺伝的アルゴリズム・ベイズ推定といった統計学のテクニックについて分かりやすく整理され」というような点については、それぞれがごく簡単に紹介されているだけなので、方法論について掘り下げて知りたい方には、物足りない面もあるかもしれない。
(私はベイズ推定に興味があったので、ちょっと物足りない)
それはさておき、本書を読んで、派生的に考えたことが2つある。
まず、何かの専門家になったり、何か事業を起こした場合に、統計計算的な手法を活用できないかを、真剣に考えた方が良いということ。
いつも読んでいる「レジデント初期研修用資料」さんの「診断学のこと」という最近のエントリーではどちらかといえば「統計学的な疾患推定」に否定的な内容となっているが、ようは使いようであって、最適にチューニングしたプログラムを使って解析し、その結果に専門的な分析を加えて、最適な運用方法で活用すれば良いという話だと思う。
同様に、本石町日記にて批判されている新銀行東京の経営悪化に伴う、金融庁のスコアリング推奨の取りやめについても似たような話で、もっと的確なスコアリングシステムを構築して、それだけに頼らずに上手く運用すればいいだけという話だろう。
こういう予測システムの開発は、普通に業者やコンサルタントを使ってシステム化をすると莫大なコストがかかると思うが、なんとか自力でシステム化できれば、相当な優位性が獲得できる可能性を秘めているので、起業を考えている人は選択肢の1つとして検討する価値があると思う。
そして、もう1つ感じたのは、最近コンピュータプログラムって言えば、APIやSQL文を使って情報を操作して、ユーザインタフェースをどうするかということばかり考えていることが多いってこと。
プログラミングで一番楽しいのは、統計計算的に作ったものでなくても、アルゴリズムを上手く計算として実装して、綺麗に条件分岐したりソートするような仕組みを構築できたときだと思う。
たとえば、ホットエントリーページの表示アルゴリズムを考えて実装するのって、きっと楽しいと思うし、Googleの検索エンジンを作って普及させたラリー・ペイジとかも、凄く楽しかったに違いない。
私はプログラミングをしなくなって久しいし、もうプログラミング能力なんて皆無に等しいと思うけど、本書を読んで、ちょっと血が疼いてきた。
こういった計算で世の中を変えれるんだ、ということを知るという意味で、特に起業家プログラマーの方には、本書はオススメだと思う。
*1:積読(つんどく)ってIMEで変換できるのねんと思ったら、三省堂大辞林にも載ってて驚いた。