データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
posted with amazlet at 14.08.15
久保 拓弥
岩波書店
岩波書店
著者は生態学者であるが、大学で学生を指導するにあたって、理科系の学生ですらまともに統計モデルを使えていない現状を憂いて、統計を指導するようになった。したがって、この本はそういった学生の指導を前提に著されているため、内容がやや「緩い」部分があるが、ゆえに読みやすくなっている。
統計は世間でそれなりに色々なところで使われている。アンケート調査等は最もよく出くわすものだが、実際にそこから得られる知見(つまりモデル)は、いったいどのように導かれているのかと考えさせられることがある。つまり、実際の世界からモデルを考えるのも正否を判断するのも人間なのだが、その判断者がきちんとした判断ができていないと、誤った結果だけがひとり歩きして世の中を混乱に陥れかねないからだ。昨今よくある、「何々を食べれば健康になる」とか「何々すれば痩せる」たぐいは、全てここに属する。
ゆえに、データを分析して無理やりモデルに合わせる(ひどい学生が多いらしいが、彼らには罪はなさそうだが、あまり学ぶ志もなさそうではある)のではなく、最適なモデルを導く技能をきちんと理解しておくことは、現代社会においてもとても重要なのである。いわんや監査においても然り。
説明は、生態学者らしく、仮想の植物(葉と花と種子がある)を用意して、これについての観測データから統計モデルを使ってその結果をどのように理解したらよいか、またそのためにどの様なモデル化をすればよいのかを、一般線形モデル、階層ベイズモデルなどを用いながら段階的に説明を加えていく工夫をしている。また実際のデータ処理とモデル化には、統計ソフトRを使っているので、自分で試してみることも可能だ。