トレードストラテジーを作るために機械学習を取り入れた訳ですが、
それによって、オーバーフィッティング・過剰最適化と戦っています。

上は、一例ですが、赤線の左側が学習範囲、右側が未学習範囲です。
機械学習ではいとも簡単に、学習範囲では右肩上がりのトレード結果がプロットできますが、
それは自己満足であり、未来は期待した以上に儲からないというケースが多いのです。
これがいわゆるオーバーフィッティングというやつです。

結局は堅牢な・ロバストなシステムに必要なのは堅牢な特徴量だと思っています。

堅牢な特徴量とは何なのでしょうか?
自分が考える特徴量に対して考えている事を記載してみます。

特徴量は時間と共に効果が減衰してゆく

これは基本的に必要な概念です。
決算などは特にそうで、発表直後はかなり強い特徴量として有名ですが、
時間と共に効果は減衰
この減衰については今後数学モデルで表現できないか考えて行こうと思います。

因果関係が重要

当たり前の話ですが、その特徴量と株価の関係は因果が無ければ効果が薄いと思っています。
電力会社は原油価格が上がれば不利ですし、航空会社はコロナ患者が増えれば決算には不利に働くはずです。因果を考えて、特徴量を集めて分析してみると色々とおっ!と思うことが沢山あります。

市場全体を動かすアノマリーも重要

NY逆張りアノマリーも馬鹿にはできません。
曜日アノマリー、月末アノマリーも効くものがあれば、カテゴリー特徴量として採用すべきと思います。
また、日本株は日中下げやすいアノマリーもあり、それも重要と思われます。

市場には数々のアノマリーがあり、特徴量として扱うべきです。
料理で言う、出汁みたいなものです。

特定のユニバースに効くものもあるはず

市場全体には効かずとも、特定のユニバースにはかなり効くものもあると思って、
ユニバースごとに分析するもの面白いです。

そのユニバースにおける収益の源泉はなんなのか?を考え抜き、それを特徴量にすればよいと思っています。

特に銀行などは見事に単純で、金利動向で動くことが想定される
はずです。金利情報を特徴量にすればよいのでは?と思っています。
たぶん、時間枠によってはかなり効いているはずです。

最後は独自性

金利・原油・為替・海外株・外国人動向等、その辺で簡単なものに頼らず、自分独自の特徴量を編み出すことで、聖杯に近いものが得られるのではないでしょうか。
日々、使えそうなものはスクレイピングしておいて損は無いと思いますので、データを作って、サイエンティフィックに、そして競争力を持ったシステムを開発してゆきましょう。

では。


投稿者

SHIN

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です