データ解析のための統計モデリング入門

という訳で新しいPCを前に、せっかくなので何か勉強したいと思ったのでかねてから気になっていたこれを読み始める。直ちにピンポイントでどうこうしようというのはないが、多少長い目で見れば間違いなく重要になる知識だと思ったので。
ひとまず2章まで読むが、(ここまではきわめて初歩的な話とはいえ)非常にわかりやすさを心がけて書かれている、取っ付きの良い本と感じる。この調子が維持されれば本当に高校数学レベルの前提知識で読めそう。理論だけでなくRを動かしながら例題を実践して進めていくところも理解に寄与していると感じるし、本文では操作的なところでは余計なつまづきを抑えるようにさらっと書いておき、注でコマンド等の内容についての補足がなされているので、ストレスなく実習しながら本筋を学ぶことができて好感度が高い(こう書くとそれほど新規的な工夫でないように思えるが、実際にこうした気配りがなされている本はありふれているという感じではないと思う)。大変よい本だと思う。学部の頃に読んでいたかった(しかし読んでいたら志望分野が若干変わっていた気もする)。
さて、2章は中身自体はほぼ詰まる要素もなくさらさらと行くのだが、とはいえ全体感からいってもそれなりに大事なことを言っている部分という気がする。
ここまで読んだ段階での理解では、要はデータに対して「統計モデル」による記述を行うとは何なのかというと、得られたデータが有る特定の確率分布によって記述可能だと仮定して、それを決定する(「推定」の作業、実際には確率モデルのパラメータフィッティングを行うことに相当)ということで、それがうまく行けば、得られたモデルから予測も可能なりますね、ということで、一連の統計モデルに基づいたデータ解析の枠組みが提示されたように思う。これをPoisson分布による最尤推定を行いながら勉強するという話。

という訳で以降徐々に本題に入っていくのだと思うので今後が非常に楽しみ。