見出し画像

Numerai meetup tokyo2024参加記

こんにちは、日本爆損防止委員会です。

先日東京某所で行われた、Numerai meetup tokyo 2024というイベントに参加してきました。


爆損について話すなら、Numeraiは避けて通れませんよね!

Numeraiは米国に拠点を置くヘッジファンドです。かなり特殊ユニークなことをしていて説明するだけで誌面を使い尽くしてしまうため、ChatGPTくんのスマートな解説を置いておきます。

Numerai(ヌメライ)は、AIとブロックチェーン技術を活用した、株式市場予測を行うユニークなヘッジファンドです。Numeraiの特徴と仕組みについて、以下の点で説明します。
データサイエンティストのコンペティション
Numeraiはデータサイエンスコンペティションを開催しており、参加者は提供されたデータを使って株式市場の予測モデルを作成します。
参加者はデータにアクセスし、自分のアルゴリズムを開発・提出することができます。
匿名化データ
提供されるデータは暗号化されており、参加者が個別の株式や市場情報にアクセスすることはできません。これにより、データのプライバシーが保護されます。
NMR(Numeraire)トークン
参加者は自分のモデルに対してNMRトークンを賭けることができます。予測が成功すると、報酬としてNMRを受け取ります。
NMRトークンはイーサリアムベースのERC-20トークンであり、これを使ってプラットフォーム内でのインセンティブを管理しています。
メタモデルの構築
Numeraiは、参加者から提出されたすべてのモデルを統合して「メタモデル」を構築します。このメタモデルが実際の投資戦略に使われます。
ヘッジファンドとしての運用
Numeraiは、メタモデルを用いて実際の株式市場で取引を行うヘッジファンドです。これにより、データサイエンティストの知識とAI技術を活用した独自の投資戦略を実現しています。

ChatGPT

要はNumeraiは、ヘッジファンドとして自社にクオンツを抱えるというよりかは、株式予測コンペを開催 -> 集めた予測値をアンサンブル -> 自分たちで運用、というwisdom of crowdインスパイアなことをしています。2019-2023年頭あたりまで、右肩上がりのファンドパフォーマンスを出していました。ブル相場でもベア相場でも安定的に稼げていたため、大きな注目を集めていました。

ところが、TC (True Contribution)という謎指標の最大化をコンペ参加者に強いるようになったあたりから爆損を繰り返し、その結果、ドヤァと公開されていたファンドパフォーマンスは非公開になり、今やWebサイトを訪れても以下の簡素な説明しか見ることができません…。

https://numerai.fund/

このままNumeraiは消えて無くなってしまうのではと思われましたが、少なくとも今年は前年に引き続き、東京にてmeetupを開催できる運びとなりました。

スポンサーについて

私は今回も雑用係として会場やランチ等の手配をしていました。どちらかというと参加者側というよりは運営側です。Numeraiが、確か2021年ごろ日本でコンペ参加者のためのイベントをやりたいということで、多分こういう経験も人間大事なんだろうなというふわっとした理由で手を挙げて、以降日本でのイベント開催を手伝ってきました。

確か2022年まではNumeraiファンドそのものがスポンサーでしたが、特にファンドパフォーマンスが悪化を一途を辿るようになってから、NumeraiのDAO (Decentralized Autonomous Organization)であるCouncil of Eldersにスポンサーになっていただいています。

Council of Elders、長老会との名の通り、Numeraiコンペに初期から参加している方々を中心とした組織で、NumeraiファンドからトークンであるNMRをある程度の規模で預かっており、参加者が予測値を売買できるプラットフォームであるNumerbayをfundingしたり、Numerai本体がなかなか手の届かない参加者向けの施策をやっているらしいです。Meetupも世界各地でやっており、今回の日本の前はドイツだったみたいです。

私について

今回のイベントのようにNumeraiのコミュニティ活動を手伝ったりしている関係で、非Numerai金融系のイベントに行くとNumeraiについて詳しい人だと思われて鋭い質問を度々受けるのですが、正直私は会場を手配したりしているだけでNumeraiのことはあんまり詳しくありません…。Numeraiファンドの人ではもちろんないですし、そのDAOであるCouncil of Eldersにも入っていません。どこにでもいる非金融系のサラリーマンです。

現在3つあるNumeraiコンペ、Tournament、Signals、Cryptoのうち、TournamentとSignalsは一応毎日予測値を提出してはいます。ただ、Tournamentはcloudpickleを用いたmodel uploadsという機能があり、それを使って1度提出するとNumerai側で毎日実行して自動提出してくれるのですが、昔それを使って提出したものが今でも動いているだけで、正直ですね、何を提出したのかも忘れてしまいました。Signalsは銘柄とtargetの関係が明示されており、私自身が日本株botを嗜んでいる関係でこちらは比較的モチベ高く取り組んでおりますが、最近始まったcryptoの方はノータッチです。

あたかも当然知ってますみたいな顔をしていましたが、TournamentのデータがV5にupdateされることもイベント当日に初めて知りましたし、私自身色々と知識の更新ができた会になりました。

トークについて

午前の部

午前中は日本のNumeraiコンペ参加者3名にご講演いただきました。Nishimotoさん、Regonnさん、Habakanさん、ありがとうございました!

Nishimotoさんのトークはイベントの始まりにふさわしいものでしたね。Numerai tournamentのV5含むアップデート内容をデータ分析と共にお話いただいて、私のようにtournament今どうなってんの勢にとってはありがたかったです。V5になってユニバースが拡大したみたいということで、運用資金が減って大型じゃなくても運用できるようになったんですかね


次はRegonnさんのトークで、Google Cloudを用いた提出自動化についてでした。Numeraiはdaily submissionをやろうと思うと流石に自動化しないと厳しいので、こういった知見の共有は大いに参考になる人も多いのではないでしょうか。ほとんどの人はsubmission自動化の前に挫折してしまうと思います。でもRegonnさんはほぼ毎週Numerai Japan Discord内でもくもく会を開催してらっしゃるので、そこで聞いてみたら教えてくれると思います。


午前中最後はhabakanさんでした。Numerai Signalsについての分析結果を誤共有いただきました。私は前述の通りNumeraiはほぼSignalsしかやっておりませんので、大変参考になりました。Signalsではv1.0現在、targetと一緒にいくつかfactorが提供されていますが、target_factor_neutralと与えられたfactorのいくつかに相関が見られたという点が特に面白かったです(勝手にtarget_factor_neutralにはfactorの情報が完全控除されていると思っていた)。あと奥様が株強いみたいで、いいですね!

午後の部

午後は、Numerai-inspired系web 3プロジェクト (Yiedl, Flock.io, crunchDAO) のコアメンバーによるトークが行われました。ラーメンみたいにweb3も派生していくんですね。Numeraiの競合(?)を同日同じ会場に集められたのは、Joeさんの人望とNumeraiファンド公式ではないイベントだったからでしょう。皆さん海外からわざわざ灼熱の東京にお越しいただきまして、お疲れ様でした…。

午後1発目はYIEDLプロジェクトについて、CEOからご紹介がありました。Numeraiインスパイアweb3プロジェクトです。自身のプラットフォーム上でクリプト予測コンペを開催しており、参加者は将来の値動きを予測して、予測精度とstakeしたトークン量に比例した形で報酬トークンを受け取るのはNumerai cryptoと似ています。ただ、YIEDL運営自身がファンドを持って集めた予測値を使って運用するというよりは、投資家が欲しい予測値を見つけられるマッチングの場(マーケットプレイス)としてプラットフォーム化したいような印象を持ちました。確かに場の運営に徹して、自分たちはトレードして爆損するリスクを取らないというのはアリですね。でもじゃあどうやって投資家にとって魅力的な予測値を集められるのかというと、そこはNumeraiもそうですけど難しいですよね。実力のあるデータサイエンティストは、すでにいい会社でやりがいのあるタスクに取り組んでいい給料もらっているはずなので…なんで草コインを集めるためにextraの時間と労力を投資しないといかんの…という話になってしまうので、そこはこれ系全般の課題かなと思います。

次はFlock.ioでした。こちらもまた別のnumerai系web3かと思いきや、自分たちの論文(Dong, N., Wang, Z., Sun, J., Kampffmeyer, M., Knottenbelt, W., & Xing, E. (2024). Defending against poisoning attacks in federated learning with blockchain. IEEE Transactions on Artificial Intelligence.)の紹介からトークが始まって面食らいました。アカデミア発であることを強調されていました。Federated learning(連合学習)は、

分散しているデータを1か所に集めずに、AIモデルを分散している環境に配布しながらセキュアにモデリングする方法のことです。組織を超えたモデルを構築する際に、組織間のデータを直接やり取りすることを避け、モデルを組織間でやり取りすることで、データ利用の高度化とプライバシー保護を同時に解決する方法です

野村総研の用語解説

というものらしく、私は全く知らなかったのですが、データを集めるときに起こりがちな、プライバシーなどの課題を解決すると期待されている分野らしいです。関係ないですが、私みたいに神経科学出身だと、連合学習はパブロフを連想するので別の和訳を当てて欲しかった感。論文の内容は、連合学習の課題としてpoisoning attackという、集めたモデル予測値のうち悪意のあるものが含まれるケース(ラベルを反転させて学習させてある等)がありますよと(Numerai参加者で思い当たる人も多いのでは)。それを、peer-to-peer votingやstaking rewardといったブロックチェーンの仕組みを使うことで解決できますよ、という趣旨のようです(ブロックチェーンって解決できる課題あったんだ…)。これを社会実装するにあたり、まずはAI arenaというon-chainのAI訓練プラットフォームが開始されていて、trainingやvalidatorとして参加できるみたいです。

最後はCrunchDAOでした。マーケットは複雑系の1つであるため、精度高い予測をするためにはコミュニティの力が必要であることとお話されていました。こちらも金融市場予測コンペを主催して、参加者から予測値を集めているのはNumeraiと同じですが、Numeraiのようにstake額 x performanceで報酬が支払われるのではなく、単にperformanceに応じて支払われるのがコンペ参加者側から見た一番の違いかなと思います。草コインをどこかで買って、stakeして…とやらなくていいのは楽ですね。レバレッジを効かせるのはできませんが。
集めた予測値はどう使われているんですかというと、YIEDLと一緒で、アンサンブルしたものを投資家(おそらくYIEDLよりも金融機関等の機関投資家を想定している)に売るビジネスモデルのようです。
あと組織構造的にもNumeraiとは大きく違いますね。Numeraiはヘッジファンドとして自分たちで運用をしており、今回イベントのスポンサーであるNumerai DAO (Council of Elders)はそこから完全に独立しています。一方、こちらはCrunch Foundationというのがありますが実質的にCrunchDAOと同一の組織です。そのためDataCrunchのトークンはコンペの報酬であるだけでなく、組織の意思決定に関わる投票などにも使われます。
プレゼンの中にもありましたが、「毎日の退屈な仕事を辞めて、modelに稼いでもらって、2度と仕事しなくていいようになろう」みたいな趣旨は個人的には素直でいいと思います笑。ウェブサイトにも以下が書いてありますね。

Forget about your Labs and 9 to 5 jobs
Spend more time at the park with your dog

https://www.crunchdao.com/

おわりに

ここまで読んでいただきましてありがとうございました。特に、当日参加していただいた方、会場も昼食も至らぬところが多かったかと思いますが、積極的に手伝っていただきまして助かりました。来年は開催できるかよくわかりませんが、またどこかで機会があればお会いしましょう。

この記事が気に入ったらサポートをしてみませんか?