ここ最近、統計モデリングに関心をもって勉強しています。思い立って統計の勉強を始めてから8年経ちますが、ここにきてようやく監査の実務と統計とを結びつけるイメージが湧いてくるようになりました。それもこれも、以下で紹介するほどよいモデリングの解説本に出会ったためです。
統計の中でもモデリングは実務的な知識が要求される領域なので、モデリングの具体的な方法を解説した本はあまりありません。おそらく大学の研究室や企業内部の暗黙知として引き継がれていっているのでしょう。まして一般的にモデリング「とは」の話をしてもつまらないので、経済とか医療とか特定の領域を前提にした内容になることから、門外漢にとっては取っ付きにくくなってしまうことは否めません。
これは、監査論の書物がたくさんあってもほとんどが監査制度論や用語の解説に内容の多くが割かれ、不正の発見の方法やリスクの評価方法などの監査実務に直結した書物が意外に少ないことと共通しています。医療は人の病気を、経済は社会現象を、監査は会社の価値創造活動を対象にそれぞれ「なまもの」を扱います。共通点は対象に個別性があり同じものが一つとしてないこと、その反面、現象や事象にはやはり共通項があり、それをパラメタとして見出して一般化することができそうな領域である点です。この一般化がモデリングです。
結局、モデリングとは統計データと実務対象をパラメタでつなぎ、対象が投影されているデータから対象についての知見を得ることなのですが、観念論ではなく具体的な問題として取り組むためには、実際のデータをハンドルしながら進めていくべく何らかのツール(RとかStanなど)の力を借りなければなりません。知見と知識と技能のトライアングルが求められるわけですね。
今回改めて認識したのは、統計の勉強にはなるべく興味のある対象を扱った書物を読むと理解が進むことと、手を動かして出力を見ながら学ぶことの必要性でした。
モデリングの参考書
では、手元に置いている書物を紹介しておきます。
久保, データ解析のための統計モデリング入門, 岩波書店
https://www.iwanami.co.jp/book/b257893.html
通称みどり本。表紙が緑色です。仮想の植物を使ってモデリングの方法を段階的に解説していくもので、モデリングの勉強をする人の間では古典になっているようです。実は私が統計の勉強を始めた少し前にこの本が出たので、勇み足で購入した本です。当初は書いてあることがさっぱり理解できませんでしたが、時間を置いて読み直しているうちにだんだんとわかるようになってきました。自分の理解の進捗度を試すベンチマークとなっている本です。
松浦, StanとRでベイズ統計モデリング, 共立出版
https://www.kyoritsu-pub.co.jp/bookdetail/9784320112421
表紙にアヒルのデフォルメされた絵が入っていることから、通称「アヒル本」です。勉強している人の間で通称があるくらい定番の本のようです。以下の二書でも引用されています。
馬場, RとStanではじめるベイズ統計モデリングによるデータ分析入門, 講談社
https://www.kspub.co.jp/book/detail/5165362.html
最初に読んだStanを用いたモデリングの解説本です。Stanの使い方を交えながら、仮想のビール会社の売上データを使ってモデリングの理解を深めていくことができます。
浜田・石田・清水, 社会科学のためのベイズ統計モデリング, 朝倉書店
http://www.asakura.co.jp/books/isbn/978-4-254-12842-0/
簡単な統計をベースにモデリングを解説した内容になっていて、ブンケーを悩ます数式も上二書と比べるとたくさん出てきますが、丁寧に解説されているのでわかりやすい内容です。教養課程レベルの学生さんを意識した解説です。
McElreath, Statistical Rethinking A Bayesian Course with Examples in R and Stan 2nd. ed., CRC Press
https://xcelab.net/rm/statistical-rethinking/
英語で500頁以上ある教科書ですが、ソースコードが掲載されているので、サンプルプログラムが公開されているのを横目にひたすら手打ちをして出力を見ながらモデリングの雰囲気を感じるために用いました。結果的には習うより慣れろを実感できたことが収穫でした。
監査とモデリング
監査とモデリングがどう関係するのかと思う人もいるでしょう。近い将来の監査について私が強い信念をもって予想していることがあります。それは、従来の監査手法である紙の証跡を前提とした監査手法は、昨今のデジタルトランスフォメーションを経て、使えなくなってしまうという懸念です。簡単に言ってしまえば、取引の記録がデジタル化されすべてが自動処理されるようになると、監査人は記録されたデータからしか監査証拠が得られなくなります。従来は個々の取引を記録した「紙」から起こされた会計データの集約が決算であったわけで、辿った紙の上にいろいろな副次的情報も含まれていたので証拠が得られたのですが、取引記録が電子情報になれば、システム上の記録の整合性以上の証拠は得にくくなります。そのときにモデリングによって、会計データを始めとする諸々のデータが何を訴えているかを分析できれば、一つの証拠になるのではないかと考えています。更に発展させて考えれば、会計データとして記録されたもの以外のデータも含めて、いかにうまく知識情報を得ることができるかが監査のありかたを決めてしまうような予感があります。