見出し画像

FAQ

ohlcv以外のデータは使っていますか?

使っていません。

p平均法のエラー率の根拠

2次元は(p1 + p2) / 2 < aの領域の面積がエラー率。 そこから3次元、n次元と考えました

高頻度とスイングの時間軸はどのくらいか?

よくわからない。高頻度は1秒以下という説も。私の最短は15秒足

機械学習の勉強はどうやってる?

googleとネットで見れる論文(arxivとか)やその解説記事。以前は大きい本屋が近所にあったから、毎日行って背表紙眺めながらアイデア考えてた。

talibは実戦でも使ってる?

はい

分数次差分は使ってる?

使ってない

執行の改善と特徴量の改善、どちらが寄与が大きい?

執行の改善

backtestの改良について

いろいろ考えられると思う。改良はみんなの仕事

ohlcvは他取引所も使ってる?

使ってない

bybit botのレバレッジ

今は5倍以下で証拠金分のショートもしてる。去年の年末はヘッジなしで10倍。証拠金も総資産の9割くらい入れてた気がする

時間の使い方

孔子「これを好む者はこれを楽しむ者に如かず」

日足使ってる?

使ってない。サンプル数少なくて有意なのかわからないのが課題。解決方法思いつかない。

執行のアイデアはどこから?

試行錯誤

数学的な素養はどこから?

わからない

勾配Boostingは使ってる?

使ってる

lag特徴量は?

少しだけ

botの再学習頻度

3ヶ月に一回くらい

特徴量何個?

130くらい

学習データ期間

できるだけ長く

バーの種類

タイムバー

学習させたモデルの推論結果を利用して再度yを作り再度学習はやってる?

やってないです。以前やったら不安定になりました。

回帰?分類?

両方

CV後、refitしてる?

してない

特徴量は一つずつ情報係数とかで検証してる?

していません。ざっくり思いついたのを追加して成績が上がるかとかで見ています。一つずつ検証するのも良いと思います。

損切りしてる?

していません。資産の一部(最近は50%以下。昔は90%)だけを証拠金に入れて、ゼロカットでリスクコントロールしています。損切りするのも良いと思います。

強化学習は?

使っていません。データに限りがある状況、教師あり学習が使える状況で強化学習を使う意味が無い気がします。でも強化学習で勝っている人もいるみたいです

ディープラーニングは?

使っていません

複数指値は?(i_max = argmax_i y_pred[i]でi_max番目の指値を使う)

試した気がしますが詳細を覚えていません

アンサンブルは?

使っています

TimeSeriesSplitとKFoldはどっちメイン?

気分。昔はTimeSeriesSplit使ってたけど、jquantsの1位の人がKFoldだった気がするから、最近はKFold(purge付き)

binningは?

使っていません

勾配Boostingのパラメータはどう決めてる?

デフォルト or ハイパーパラメータチューニング(optunaとかhyperoptとか)

1度に全ての特徴量を学習している?

しています。

執行戦略で特に重要なポイントは?

わからない

shuffle split cvは?

安定して勝てる戦略を見つけられないと思う。時間軸がシャッフルされるので、前半はすごい勝てるけど後半が負けてトータルで勝てる戦略と、全体的に勝ったり負けたりしてトータルで勝てる戦略を区別できないから。

ml botは何並列?

16個の指値に分散させてる。

パンプ検知してる?事故をどう防ぐか?

していません。ゼロカット口座と分散投資で防いでいます。

機械学習のモデルは何を使っている?

ridge, logistic, lgbm regressor(boosting='rf', 'gbdt', 'dart'),  lgbm classifier(boosting='rf', 'gbdt', 'dart')

運用でマイナスになるとメンタルブレイクしない?

レバレッジを下げたり、証拠金に入れる金額を調整して、メンタルに優しい戦略にしています。

指値価格を計算する教師有り機械学習モデルはどんな問題設定にしている?

モデル1

hi[t + 1] / lo[t + 1] - 1を予測して、予測値の適当な定数倍で指値を出す

モデル1の非対称版

hi[t + 1] / cl - 1と-(lo[t + 1] / cl - 1)をそれぞれ別のモデルで予測して、予測値の適当な定数倍で指値を出す

モデル2 (研究中)

適当な指値計算式でマーケットメイクし続ける戦略を複数用意する。そのリターンを機械学習で予測する。リターンがプラスな戦略のみ動かす。強化学習の行動価値関数を学習するイメージです。

future_return = f(strategy_params, features)

strategy_params: 指値距離など

features: 特徴量

学習データから外れ値を除いている?

除いていません。

talibで同じ指標の複数timeperiod使っている?

使っています

指値予測の特徴量は価格予測と同じ?

同じです

過学習対策は?

nested cvと検定

回帰モデルと分類モデルで特徴量は同じ?

ハイパーパラメータチューニングで特徴量選んでいます。

分類モデルはどういう問題を解いている?

classifier.fit(X, np.sign(y), sample_weight=np.abs(y))

classifierに限らず、regressorでも、普通に学習するのと、↑で学習するのを両方試したりしています。

カスタム損失は?

使っていません

出来高バーやドルバーを使わない理由は?

時間バーのほうが成績が良かったからです

可視化はtrading view使ってる?

使っていません

特徴量生成にカルマンフィルターや粒子フィルターは使っている?

使っていません。

メインで動かしているボットは何個?

4戦略くらい。個人/法人違いや、取引所違いでボットの数はそれ以上です。最初に億まで行った戦略はまだ使っています。