何かしらの誤解…からの?
えーと、xAI社のGrokがオープンソースになる、っていうニュースが先日ありまして、なおも注目を集めている「AI」とその周辺。
「Grokってなーに?」っていう方は公開時の記事とか見てみるといいとおもいます。「Grok-1」エンジンによるチャットアシスタント、といったところでしょうか。
きっかけとなったのは「オープン」を冠しているにもかかわらず「クローズド」なOpenAI社の存在も。
この「オープンソースにする」という話題に関連して「誤解」されているような発言があった様子なのでその辺を自分なりに紐解いてみようかな、とかそういう記事ですね。
「オープンソース」をNoteのAI機能に説明してもらった
そういえばNoteにも「AIによるアシスト機能」ありましたね。というわけで…
ソフトウェアとしての「オープンソース」の定義としては以下のページから辿って欲しいんですが、ソフトウェアのソースコードを公開するライセンスの下で配布することで、ソフトウェアの自由な利用と発展を促す感じでしょうか。
なお、OSIは「オープンソースAI」の定義も策定中、とのこと。
ここで一旦
ここで一旦話のキモ的なところを2つ。
Grokがオープンソース化
「オープンソース」の対象は基本的に「ソースコード」
なので「X社のGrokがオープンソースになる」という時に「ソースコードのオープン化」と考えるのが妥当ですよね。
ところが
そう解釈されず、「データセット」、かつ「画像生成AIの話題」として発言されているのをたまたま見ちゃいまして。何かしら重大な誤解があるのではないかと思うほどの。
テック系(笑)な方のアカウントではないところから出てきていたので、流石に目を疑いましたね。「これは何か皮肉めいた表現なんだろうか?」と頭を抱えてしまってお昼に寝れずに夜寝ちゃいました。ああ、とは言ってもテック系っちゃテック系か。
割と乱暴なモデルですけど、以下のような「学習のための元データがあるモデル」でちょっと説明しますね。Grokの場合はリアルタイム性を売りにしているのでデータの更新とかフィードバックとかの仕組みがあって「学習」と「生成」が綺麗に分かれているわけではないと思いますけど。
「学習」の段階では例えば学習の際には元データからデータモデルに従って学習済みデータを生成します。
「生成」の段階では、テキスト入力(プロンプト)に応じて生成するためのプログラムが学習済みデータを利用します。
こういうモデルだと仮定した時に「オープンソースの公開範囲」としては以下の赤い点線の枠内、と予想されます。「一からデータを収集して学習済みデータを作って出力するところまでができるプログラムのセット」というわけ。
プログラムのソースコードが公開されたら、環境構築して、データ用意して、学習済みデータ作ってっていうところまで全部自分で出来ちゃって夢が広がりんぐ、ってなやつですよ。
特に引用はしないんですが、「今回のオープンソース化でXに上がっている画像が学習情報として利用される」かも、的な風に読み取れる感じの言及になっちゃっているので「割と無理筋で来てるなあ」と思った次第。このタイミングじゃないでしょ?
もしかして離脱する展開狙っているとか?(以下はXの規約改訂時にアーティストが離れていったという話)
はい?
openai アカウント配下のリポジトリで公開されているですって!?
これは何の冗談なんでしょう?
追記:公開されました(xAI社のほう)
予告通り。
なるほどなるほど、ベースモデルもていきょうされるんですね。
お読みいただきありがとうございます。サポートいただいた分はおやつのグレードアップに使おうかと思います。スキ、SNSにシェアもよろしくお願いします!