はじめに
ファイナンス機械学習 金融市場分析を変える機械学習アルゴリズムの理論と実践
という書籍を読み始めました
せっかくなので内容を忘れないようにメモしていこうと思います
超ざっくり要約と一言感想的な感じで
5. 分数次差分をとった特徴量
5.1 はじめに
ざっくり要約
データは基本的に本当のシグナルは少なくてノイズが多いよ
データを定常時系列データに変換するための方法としてよく階差が使われるけど、これは過去の情報が無視される事になるので
さらにシグナルが少なくなっちゃうよ
なので、データを定常時系列データにするもっと良い方法を紹介するよ
感想
なんか一気にレベル上がった感ある
これまでは数式は分からんかったけど日本語は頑張れば分かったけどこれは日本語すらだいぶ怪しい、、
そもそも章題の「分数次差分」が意味分からんしなあ、、
ググっても出ない言葉を使わないでくれ〜
定常時系列については以下を見たら理解できた
確かに階差取ったら定常時系列になりそう
https://www.whispon.com/entry/2019/09/19/014902
階差でも十分良さげに見えるけど、もっと良い方法があるならぜひ知りたいねえ!
5.2 定常性とメモリーのジレンマ
ざっくり要約
定常的にしようとすればするほどメモリー(過去のデータの情報)が消える
例えばそのままの価格データだとメモリーは OK だけど定常性が0
階差だと定常性は OK だけどメモリが0
なので間を取って分数次差分が良いのだよ
感想
なるほど、強そう
5.3 文献レビュー
ざっくり要約
分数次差分に言及している論文はかなり少ないし、されてても計算量が高すぎて現実的じゃなかったりする
なので、現実的な新しい手法を紹介するよ
それは差分オペレーターを非整数次に一般化する手法だよ
感想
さ、差分オペレーターを非整数次に一般化する手法!?
意味が全く分からんすぎてパニックになりかけたけど次の章で詳しい説明があるようなので落ち着いて先に進もう
5.4 手法
ざっくり要約
手法を数式で説明するよ
感想
全然分かりませんでした
本当にありがとうございました
5.5 実装
ざっくり要約
手法を実際に相場データに適用するよ
感想
なんとなくすごそうだということは分かった
5.6 最大限メモリーを保存した定常性
ざっくり要約
最大限メモリーを保存しつつ定常性も確保する方法を紹介するよ
オレンジジュース先物市場とか、差分を全くとる必要がない場合もあったよ
感想
ビットコインとかは価格変動が大きいから整数次差分に近いレベルで分数次差分をとる必要がありそうですな
(大して分かってないくせに分かったっぽいことを言いたいだけのやつ)
5.7 結論
ざっくり要約
これまでは定常を取るかメモリーを取るかの2択だったけど、この章では両方のバランスを取る手法を紹介したよ
感想
これすごい手法っぽいので本とかじゃなくてちゃんと論文で発表したら?って思ったけど
多分すでに発表しててそれを本でも紹介したって事なんだろうね
おわりに
いやー難しかった!
言いたいことは分かったけど、実際にデータに適用してって言われても無理や、、
誰か Jupyter Notebook 作ってくれ、、