何かしらの誤解…からの？

2024年3月17日 15:30

えーと、xAI社のGrokがオープンソースになる、っていうニュースが先日ありまして、なおも注目を集めている「AI」とその周辺。

「Grokってなーに？」っていう方は公開時の記事とか見てみるといいとおもいます。「Grok-1」エンジンによるチャットアシスタント、といったところでしょうか。

きっかけとなったのは「オープン」を冠しているにもかかわらず「クローズド」なOpenAI社の存在も。

この「オープンソースにする」という話題に関連して「誤解」されているような発言があった様子なのでその辺を自分なりに紐解いてみようかな、とかそういう記事ですね。

「オープンソース」をNoteのAI機能に説明してもらった

そういえばNoteにも「AIによるアシスト機能」ありましたね。というわけで…

オープンソースとは、ソフトウェアの作り方の一つであり、どんな人でもそのソフトウェアの中身を見たり、変更したり、配布したりすることができることを意味します。具体的には、ソフトウェアの作成に必要なコードが、無料で公開されているということです。
例えば、オープンソースの代表的なソフトウェアである「WordPress」を例に挙げてみましょう。WordPressは、ブログやウェブサイトを簡単に作ることができるツールです。オープンソースであるため、誰でもWordPressのコードを見たり、改造したりすることができます。つまり、自分が欲しい機能を追加したり、不具合を修正したりすることが可能です。
また、オープンソースのもう一つの特徴は、共同開発ができることです。例えば、ある人がソフトウェアの改良案を提案した場合、他の人がそれを受け入れてくれれば、みんなで協力してソフトウェアを進化させることができます。それによって、より使いやすいソフトウェアが生まれる可能性が高まります。
つまり、オープンソースは、ソフトウェアを誰でも自由に使えるだけでなく、改造したり共同開発することができるということです。これによって、より良いソフトウェアが生まれ、みんなが利益を得ることができます。

NoteのAIに説明してもらった「オープンソース」

ソフトウェアとしての「オープンソース」の定義としては以下のページから辿って欲しいんですが、ソフトウェアのソースコードを公開するライセンスの下で配布することで、ソフトウェアの自由な利用と発展を促す感じでしょうか。

なお、OSIは「オープンソースAI」の定義も策定中、とのこと。

ここで一旦

ここで一旦話のキモ的なところを２つ。

Grokがオープンソース化
「オープンソース」の対象は基本的に「ソースコード」

なので「X社のGrokがオープンソースになる」という時に「ソースコードのオープン化」と考えるのが妥当ですよね。

ところが

そう解釈されず、「データセット」、かつ「画像生成AIの話題」として発言されているのをたまたま見ちゃいまして。何かしら重大な誤解があるのではないかと思うほどの。

テック系(笑)な方のアカウントではないところから出てきていたので、流石に目を疑いましたね。「これは何か皮肉めいた表現なんだろうか？」と頭を抱えてしまってお昼に寝れずに夜寝ちゃいました。ああ、とは言ってもテック系っちゃテック系か。

割と乱暴なモデルですけど、以下のような「学習のための元データがあるモデル」でちょっと説明しますね。Grokの場合はリアルタイム性を売りにしているのでデータの更新とかフィードバックとかの仕組みがあって「学習」と「生成」が綺麗に分かれているわけではないと思いますけど。

「学習」の段階では例えば学習の際には元データからデータモデルに従って学習済みデータを生成します。

「生成」の段階では、テキスト入力(プロンプト)に応じて生成するためのプログラムが学習済みデータを利用します。

こういうモデルだと仮定した時に「オープンソースの公開範囲」としては以下の赤い点線の枠内、と予想されます。「一からデータを収集して学習済みデータを作って出力するところまでができるプログラムのセット」というわけ。

プログラムのソースコードが公開されたら、環境構築して、データ用意して、学習済みデータ作ってっていうところまで全部自分で出来ちゃって夢が広がりんぐ、ってなやつですよ。

特に引用はしないんですが、「今回のオープンソース化でXに上がっている画像が学習情報として利用される」かも、的な風に読み取れる感じの言及になっちゃっているので「割と無理筋で来てるなあ」と思った次第。このタイミングじゃないでしょ?

もしかして離脱する展開狙っているとか?(以下はXの規約改訂時にアーティストが離れていったという話)

はい？

openai アカウント配下のリポジトリで公開されているですって!?

Grok has been open sourced pic.twitter.com/ogy8arTmkh
— Aravind Srinivas (@AravSrinivas) March 16, 2024

これは何の冗談なんでしょう？

1. Elon Muskが非営利前提でOpenAIに出資
2. OpenAIが営利団体に変身、Elonは離脱
3. Elon MuskがXでGrokというAIを開発
4. Elon MuskがOpenAIに訴訟
5. Elon MuskがGrokをオープンソース化すると宣言
6. OpenAIがgrokという名前のリポジトリをオープン化 ← 今ここhttps://t.co/lQuvZ8uGbP
— Satoshi Nakajima @NounsDAO 🇺🇦 (@snakajima) March 17, 2024

追記:公開されました(xAI社のほう)

予告通り。

なるほどなるほど、ベースモデルもていきょうされるんですね。

お読みいただきありがとうございます。サポートいただいた分はおやつのグレードアップに使おうかと思います。スキ、SNSにシェアもよろしくお願いします！