はじめに
ファイナンス機械学習 金融市場分析を変える機械学習アルゴリズムの理論と実践
という書籍を読み始めました
せっかくなので内容を忘れないようにメモしていこうと思います
超ざっくり要約と一言感想的な感じで
※これまでは7.1とかの節ごとに要約と感想を付けてたけど1つ1つが短いのでこの章では全体をまとめて記載します
7. ファイナンスにおける交差検証法
ざっくり要約
交差検証法の目的はオーバーフィッティングを防ぐことだよ
けどファイナンス分野だとk-分割交差検証法などの一般的な交差検証法は大体うまく機能しないよ
分割したデータは完全には独立してないからだよ
これを回避する方法として、訓練データセットから、テストデータセットの観測データのすぐ後に続く観測データを取り除くといいよ
sklearnのcross_val_score関数はバグがあるのでスニペット7.4のcvScore関数を使ってね
感想
金融データは時系列データだから、分割して未来のデータで訓練して過去のデータでテストするっていうのも少し違和感あるね
まあ分割したキワのデータは独立にならなそうなので取り除こうって考えは納得ですね
第8章はこちら