アセットマネージャーのためのファイナンス機械学習:金融データのラベリング ベットサイズの決定


 ファイナンス機械学習のラベリングの章では、サイドの決定を移動平均線のクロス、またはボリンジャーバンドの平均線のクロスから行った。移動平均線のクロスでは、ポジションのサイドの決定を行えても、ベットのサイズまでは決められない。

 ここで、メタラベルは、サイドを持っている一次モデルの予測結果であるベットした場合の損失を0、利益を1とラベリングし、これを使って訓練した二次モデルがベットするかしないかを判断し、さらに予測結果にメタラベルをフィルタリングすることで、正確率を上げた。
 ベットのサイズを決めるのは、この二次モデルの直近のパフォーマンスである。
 ある二次学習モデルが、適合率(PREC)60%、再現率(RECALL)90%のスコアを出したとする。90%の再現率は、100の真の投資機会の内90を予測できることを示し、適合率60%は、予測された100の投機機会の内60の投資機会が真であったとのことになる。
 ここで真の投資機会と判断された60の例にはサイズを大きく、偽陽性な40の例には小さくベットすれば、損をすることはない。
 利益(1)と予測されたものの確立を使って、サイズの決定を行うことができる。

期待シャープレシオによるベットサイジング

 $${\pi >0}$$の大きさを持つ対称ペイオフに対し、利益$${\pi}$$をもたらす確立を$${p}$$、損失$${-\pi}$$をもたらす確立を$${(1-p)}$$とする。
 この時の期待利益は$${\mu=p\pi + (1-p)(\pi)=\pi(2p-1)}$$である。
 よって、この投資機会の期待分散は$${\sigma^2=4\pi^2p(1-p)}$$。
 これからシャープレシオは、
$${z=\displaystyle{\frac{\mu}{\sigma}=\frac{2p-1}{2\sqrt{p(1-p)}} }}$$
この投資機会のシャープレシオが標準Gauss分布に従うとすれば、ベットサイズは、標準Gauss分布の累積分布関数である$${Z[.]}$$を使い、
$${m=2Z[z]-1}$$
と与えられる。$${m\in[-1,1]}$$で、一様分布である。

アンサンブル・ベットサイジング›

 ある投資機会が利益を生むか否かを二値予測するn個のメタラベル分類器$${y_i=\{0,1\}, i=1,\dots n}$$とし、ベルヌーイ分布に従うとする。
 利益を生む確率を$${p}$$とすれば、
$${\sum^{n}_{i=1} y_i \sim B[n,p]}$$
となり、試行回数n、確率pの2項分布となる。
 n個のメタラベル分類きの平均予測値は、
$${\bar{p}=\displaystyle{\frac{1}{n}\sum^{n}_{u=1}y_i}}$$、
$${\bar{p}}$$の標準偏差は$${\displaystyle{ \sqrt{ \frac{\bar{p}(1-\bar{p})}{n} }}}$$となる。
 帰無仮説$${H_0:p=\frac{1}{2}}$$の元で、統計量$${t=\displaystyle{\frac{\bar{p}-1/2}{\sqrt{n\bar{p}(1-\bar{p})}}}, t\in(-\infty,+\infty)}$$は自由度$${n-1}$$のスチューデントt分布に従うことから、ベットサイズは、このtの累積分布関数を使い、
$${m=2t_{n-1}[t]-1}$$
と、表される。


この記事が気に入ったらサポートをしてみませんか?