データ解析のための統計モデリング入門

 

ここまでに登場した単純なGLMでは、現実のデータ解析には応用できません。その理由は、実験・調査で得られたカウントデータのばらつきは、ポアソン分布や二項分布だけではうまく説明できないからです。

人間は自然のあれこれすべてを測定できるわけではありません。しかし、「何か原因不明な個体差がある」ことは統計モデルとして表現できます。

多くの実際のデータ解析では、このGLMMを基盤とした統計モデルを使うのが適切でしょう。これはデータのばらつきは二項分布・ポアソン分布で、個体のばらつきは正規分布であらわすような、複数の確率分布を部品とする統計モデルです。 

 統計学の入門の教科書では、誤差が独立で同一の分布に従うことを仮定し、その和が中心極限定理によって正規分布で近似できるという前提のもとで、有益なツールとしての統計学の議論を進めていく。

しかし、仮に一般化線形モデルなどのツールを用いても、このようなモデルに当てはまるという前提が成り立たない場合に、より適切な統計モデリングを行うことが必要であると著者が指摘する。

その上で、GLMM(一般化線形混合モデル)を導入して統計モデリングを行うための手順を示し、作成したモデルをMCMCマルコフ連鎖モンテカルロ法)で解くことで、有益な結論を示す手順が解説される。

セイラー教授の行動経済学入門

 

セイラー教授の行動経済学入門

セイラー教授の行動経済学入門

 

重要な結論の一つは、「ギャンブル行動のモデルを作るのはなかなか面倒である」ということだ。賭け手の行動一つとっても、それは「過去の賭けの結果がどうだったか」とか「どんな賭けが結果として最も話題を作れるか」 といった、数々の要因に左右されるからである。そして、投資行動にもこれと同じ複雑な要因がついて回る。

実のところ、専門家であるファンド・マネージャーでさえもが、運用益の極大化よりも市場平均を上回る実績をあげることを目指して頑張っているように見受けられる。実際、第4四半期になっても市場の後塵を拝しているファンド・マネージャーは、言うなれば競馬レースの最終出走で勝つ見込みの少ない穴馬に山を張る、負けが込んだギャンブラーとさほど違わない行動に出かねないのではないだろうか。

 オークションの落札価格が期待収益に見合わない「勝者の呪い」、手に入れる価格と手放す価格が乖離する「現状維持バイアス」、選択と値付けで効用の順位付けが変わる「選好の逆転現象」、そして株式市場における「1月のアノマリー」や「平均値回帰」など、経済学における期待効用最大化や投資理論における効率的市場仮説に系統的に反例として現れる事象のカタログを示している。

ギャンブルの事例や株式市場の事例においても、手数料を超えて有効なアノマリーが残っているかというと、手持ち資金に限りがあることを考えるとなかなか難しいとみられることがあるけれど、日本国内の過去データがそろっている事例を調べてみたくなる。

また、本書は1992年の原著初版からの再翻訳版であって30年弱が経過した現在においても当てはまるものかというと、特に株式市場ではシステムトレードのウェイトが高まっていることからも、状況は大きく変わっている気もする。

 それでも、行動経済学以前の世界で「効率的」の前提からは起こり得ないケースが残るパターンにこそ、時間をかけて調べる価値があるという本書の提起は今でも面白いと感じる。