ChatGPTの解説です。
公開日:2023年5月7日
※動画を再生してから読むのがオススメです。
さて、今週もまた、AIにまつわる新しい大きな出来事がありましたね。
もう勘弁してくださいよ。
どうすればいいんだ?
このビデオはChatGPT Code Interpreterを紹介するものです。
現在、ChatGPTのプラグインとして、アルファ版の段階にあります。
というのも、私は通常、自分のビデオはすぐに自分で試せるようなデモがたくさんあるハンズオン的なものが好きなのですが、残念ながら、このプラグインにはまだアクセスできていません。
しかし、残念ながら、私はウェイティングリストに入っています。
もしあなたもウェイティングリストに入りたいなら、こちらのURLにアクセスし、プラグインのウェイティングリストに参加してみてください。
なぜなら、ChatGPTで利用できるプラグインがすでにいくつかあるからです。
ここで、サポートされているものを見ることができます。
しかし、下にスクロールすると、今皆が話題にしている次の大きなことで、Twitterやソーシャルメディアでどんどん登場しているのがCode Interpreterです。
もちろん、データ解析やデータサイエンスの観点からも、これは本当に興味深いものだからです。
というわけで、このビデオではこのことに触れたいと思います。
私はまだアクセスできませんが、私がやりたいことは、これをすでに使っている他の人たちの例をいくつか持っていることです。
その事例を見ながら、私の考え、私の見解、そしてデータアナリストの仕事、データサイエンスの仕事にどのような影響を与えるかを説明したいと思います。
なぜなら、物事が変わっていくからです。
これは本当に大きなことなんです。
そして、これは本当にOpenAIのChatGPTのような大規模な言語モデルと対話する次の段階、次のレベルだと感じています。
それはなぜでしょうか?
これらの大規模な言語モデルは、私たちが言語を使ってこれらのモデルとコミュニケーションし、対話することができるという意味で、言語を理解しているのです。
何かを入力し、質問をすると、テキストの形で答えが返ってくるのです。
しかし、Code Interpreterを使えば、モデルはPythonを使い、アップロードやダウンロードを処理できるようになります。
つまり、異なる種類のファイルフォーマットや情報を扱うことができるという意味で、マルチモーダルになるわけです。
では、これは何を意味するのでしょうか?
つまり、私たちは人間の言葉や理解できる言語だけでなく、コードやデジタルファイルという形でコンピュータ言語を活用できるようになったということです。
そして、それが私たちの操作方法なのです。
それが、私たちがコンピュータとやりとりする方法なのです、基本的に。
バックグラウンドでは、すべてのコードがファイルに対して何らかの操作を行い、その結果、出力されるアクションなどがあるのです。
ですから、スマートエージェントやAGIのようなアプリケーションを考える場合、基本的にはデジタル領域にアクセスする必要があります。
コードやデジタルファイルを理解する必要があり、Code Interpreterはそれを実現するための試みのようなものです。
そして今、例えば、Baby AGIやAutoGPTのような他の試みがすでに見られますが、私がCode Interpreterから見ている例は、これまでに見たものよりもはるかに優れています。
OpenAIは、「私たちのモデルには、プログラミングのスキルを使って、コンピュータの最も基本的な機能に対して、より自然なインターフェースを提供できるようにしたい」と述べています。
ですから、これが本当に重要なポイントだと思います。
人間の言葉を理解し、一方ではコンピュータの言葉を理解する、という統合です。
私たち人間は、エージェントやAIに言語という形で指示や情報を与えますが、AIやコンピューターは、それをコンピューター上でどのように実行し、実際に動作させるかを理解するのです。
そして、指先のスピードで働く熱心なジュニア・プログラマーにアクセスすることで、まったく新しいワークフローを楽に、効率的に作ることができ、プログラミングのメリットを新しいオーディエンスに開放することができると言います。
これはまた、プログラミングを新しい聴衆に紹介したい非常に興味深いもので、すでにコーダーである必要はないし、特に将来は、これらのモデルであらゆる種類の素晴らしいことを行うことができます。
では、今、何が得意なのでしょうか?
初期のユーザー調査の結果、Code Interpreterは定量的・定性的な数学的問題の解決や、データ分析・可視化に向いていることが確認されたそうです。
データアナリストやデータサイエンティストとしての仕事の大部分は、データ分析や可視化を行い、数学的な問題を解決することです。
では、データアナリストやデータサイエンティストにとって、これはどのような意味を持つのでしょうか。
いくつかの例を挙げながら、このことが私たちの仕事にどのような影響を与えるのかについて考えてみたいと思います。
では、いくつかの例を挙げてみましょう。
ハッサン・トーのTwitterで、とても良いスレッドを見つけました。
リンクは説明文にあります。
ぜひご覧ください。
自分でこれらの例を見てみてください。
このスレッドでは、ChatGPT Code Interpreterをどのように使っているのか、ツイートがまとめられています。
最初の例では、どんなことができるのでしょうか?
ChatGPTの基本的なビデオ編集です アップロードされたGIFをスローズームで長いMP4バージョンに変換しています。
元の動画はGIFで、それをズームで動画に変換しているのがわかります。
では、ここで何をしているかというと
ファイルを変換しているのですが、そのビデオファイルに対して編集や操作を行っているのです。
では、将来的にはどうなるのでしょうか?
例えば、あなたのコンテンツ作成スタイルや編集やカットのタイプに応じて、おおよその編集の草案を非常に迅速に作成できる完全自動化されたビデオ編集ソフトウェアがあるでしょう。
それは、基本的に最初に台本を解釈するようなものです。
つまり、ビデオの中で人々が何を言っているのかを理解するのです。
そして、「これはいい話だ」と理解し、カット、ズームイン、ズームアウト、トランジションができるようになるのです。
数年後には、完全自動のビデオ編集ソフトが登場することでしょう。
私はこれを見たとき、基本的にそのようなことを思い浮かべます。
さて、次の話です。
表計算ソフトをもとに音楽市場をセグメント化し、それぞれのセグメントでビジネス戦略を考える。
こちらの動画は、基本的にアップロードのデモです。
スプレッドシートをアップロードすると、「素晴らしい、スプレッドシートがアップロードされました。
これが、インタープリタとの連携の仕方です。
ファイルをアップロードすると、このようにデータを読み込んで、それについて質問することができます。
それを理解し、そして、データ分析の観点から、これのように働き、モデルにデータへの完全なアクセス、理解を与えることは非常に興味深いです。
そして、これはもちろん、次に来るであろう大きな出来事です。
例えば、データをアップロードします。
そうすると、モデルはあなたのすべてのデータにアクセスできるようになります。
会社のデータでそんなことができるのでしょうか。今はアルファ版の段階ですし、OpenAIの設定上、機密性の高いビジネス情報を共有するのは良い考えではないかもしれません。
しかし、例えば、マイクロソフトはすでにGPTモデルの分離バージョン、分離クローンに取り組んでいます。
そのため、機密情報を共有することなく、GPTモデルと対話することができます。
このような例を紹介しながら、このことを心に留めておいてください。
さて、次は何でしょう?
Spotifyのプレイリストから音楽の好みを分析し、要約します。
ここでは、JetGPTコードインタープリターでSpotifyのお気に入りプレイリストを300時間分析しています。そして、ここにいろいろなグラフが表示されています。
ここでは、主成分分析を行っているようで、きれいなビジュアル化があります。さらにプロットがあり、解釈もここにあります。
PCAによる説明分散比とKumitlifの説明分散比です。
これは、主成分分析を理解するという高度なトピックであり、JetGPTコードインタープリターはそのお手伝いができます。
さて、他には?
あらゆる種類の可視化チャートとグラフがあります。
では、ここで何を見るのでしょうか?
これはEthan Mollickのツイートで、これらのツイートの著者に謝辞を述べます。
最新情報を入手し、もっと学びたい場合は、これらのプロフィールをフォローやチェックしてみてください。彼らはすでにアクセスを持っており、もっと多くのことを教えてくれるでしょう。
しかし、これはPythonを使って作成できる基本的なSeabornやMatplotlibのようなプロットであり、データアナリストやデータサイエンティストが仕事の大部分として行っているものであることがわかると思います。
これが何なのかはよくわかりませんが、かなり凝ったグラフになっています。
次に、画像から色を抽出しています。
こちらはどうなっているのでしょうか?
画像をアップロードして、画像を処理できるようにし、画像から最も上位の色を抽出してカラーパレットを作成することができます。
これは、デザインの助けになることができます。例えば、ブランドやプレゼンテーションのカラーパレットを考案したり、ここでコードを出力してそれを実行し、その助けになるようにしてくれます。
ここで、実際にどのように動作しているのかを見てみましょう。
まず、コードが表示され、次にreturnが表示されます。
そして、ここでコードを実行し、最後に出力ファイルを見てみましょう。
これでパレットpngを表示できるでしょうか?
ブームです!
これです。
カラーパレットです。
以上、Pietro Ciranoの例をご紹介しましたが、いかがでしたか?
Netflixのデータセットをアップロードすることで、国別のコンテンツ内訳を得ることができます。
これはKaggleのデータセットです。
このように表示され、レポートが表示されます。
Kaggleからデータセットを入手しました。
かなり大きなデータセットのようです。
12カラム、そして内訳、上位10カ国、フルレポート、フル内訳、そしてここでは、何もないところからgifを生成している様子を見ることができます。
基本的には、このサイズのGIFを作成し、緑色のマトリックスに文字が落ち、前面がないと仮定して30フレーム5fpsで表示します。
つまり、動画生成、GIF生成です。
ビットコインのデータ分析、トレンド、季節成分、残差成分、時系列分析、そして、写真をテキストファイルにすることができます。
pdfをアップロードすると、画像をOCRしてテキストファイルを生成してくれるような機能があります。
pngですからpdfではありませんが、請求書のようなものですね。
そして、OCR(光学式文字認識)により、その画像からすべてを読み取って、TEXTを出力します。
どんな感じですか?
画像からテキストに変換されます。
データアナリストやデータサイエンティストにとって これは何を意味するのでしょうか なぜ私はオランダでトレンド入りしているのでしょうか?
何だろう?
これが何なのか全然わからないんだけど、ごめん、ちょっと横道にそれたけど、これってどういう意味なの?
このようなことを考えると、私たちの仕事は間違いなく変わってくると思います。
これを見て、すでにできること: ChatGPTのコードインタープリタ。
私は、本当に、データ分析の仕事、データ分析、それは影響を与えるだろう、それは確実に、そして私はすでにかなり近いと思います。
これがどのように展開されるかというと、例えば、MicrosoftがすでにOpenAIと親しい関係にあり、Office 365スタックにCopilotを導入することを発表しているので。
これはExcelに導入される予定です。
今、多くの企業と仕事をしていて思うのは、多くの企業がデータ分析をする主な方法は、Excelを使うことだということです。
大きなスプレッドシート、会社のデータ、財務データなど、あらゆるデータを持っていて、それを使って分析を行うのです。
基本的な分析はそれでできますが、複雑になってくると、データアナリストや、より予測的な機械学習をしたい場合は、データサイエンティストの助けが必要になります。
これが、現在の一般的な仕組みです。
しかし、このような機能をExcelに組み込めば、データ分析の方法について技術的な理解がないエンドユーザーでも、あらゆる種類の洞察を得ることができるようになるのです。
ChatGPT、あるいはOpenAIの説明に戻ると、まったく新しいワークフローを提供し、より楽で効率的で、プログラミングの利点を新しいオーディエンスに開放するようなものです。
つまり、これが本当に重要なことなのです。
データ分析やプログラミングのバックグラウンドを持たない非技術的な人々が、自分たちのために分析を行うことを可能にするもので、すでに見たように、これでかなり複雑にすることができます。
つまり、ここで、しかし、データ分析の大きな部分は、もちろん、解釈であり、あなたが取り組んでいるドメイン、あなたが取り組んでいる会社に特化したものにすることです。
もちろん、データアナリストやデータサイエンティストをこのようなツールで一気に置き換えることはできませんが、それでも解釈やその根拠が大きな部分を占めているからです。
データアナリスト、そしてデータサイエンティストへの最大のアドバイスは、次のステップに進むということです。
おそらく来週には、ChatGPTの機械学習が登場するでしょうし、それも可能です。
つまり、ドメイン知識、ある分野をよく理解すること、あるビジネスをよく理解することは、すでにとても重要です。
しかし、技術的なスキルが必要な仕事、簡単な分析やデータ処理ができるだけの仕事もたくさんあります。
しかし、今見ているように、基本的な分析や基本的な変換は、すでにAIができるようになっています。
ですので、今はもっと「このツールを使って仕事を助けてくれるけれど、それを使ってデータを理解し、正しい質問を立て、会社やクライアントが抱える問題に役立つ洞察を引き出す能力が専門家としてのあなたの専門性にかかっている」ということになっています。
また、一般的には、優れたチームプレーヤーであり、自分の発見を会社やチームに効果的に伝えることができることです。
そして、すでに重要であり、良いキャリアに向けて準備を整えるスキルですが、これらのツールを使って、同じ出力、さらに多くの出力を、より少ない人々で実現できるようになる移行や変化を見るでしょう。
これは単なる事実です。
これによって、生産性が飛躍的に向上します。
つまり、基本的には、チームや企業はあらゆる分野で規模を縮小できるようになるでしょう。
基本的に、人間がコンピューターの前に座って何らかの情報を処理する必要がある仕事はすべて、AIによってスピードアップされるでしょう。
より効果的に、より効率的に情報を処理できるAIやエージェントが登場することでしょう。
では、どうなるのでしょうか?
企業は同じチームや従業員を維持したまま、10倍、あるいは100倍のアウトプットを出すだけでしょう。
しかし、多くのチームや役割では、その必要はないかもしれません。
つまり、チームの規模が縮小していく可能性の方がはるかに高いと思います。
なぜなら、最初は10人のチームが必要だったのが、今では1人か2人でできるようになったからです。
もちろん、A級プレーヤー、つまり最高のプレーヤーはそのポジションを維持し、こうしたツールやAIによってさらにパワーアップしていくでしょう。
では、AIに取って代わられないようにするには、どうすればいいのでしょうか?
私の考えでは、それは3つあると思います。
1つ目は、これらのツールを効果的に使いこなす方法を本当に理解し、今すぐ試してみることです。そうしないと、取り残されてしまうでしょう。
なぜなら、そうしなければ、あなたは取り残されてしまうからです。あなたの分野には、これらのツールを使っている人がいて、彼らはあなたのアウトプットを10倍、100倍にしてくれるでしょう。
次に、2つ目は、ドメイン知識です。
これらのモデルがまだできないギャップを埋めようとするのです。
私が言ったように、実行や実装、変換、グラフ作成に関しては重要ですが、特定のドメインに関連する解釈についてはそうではありません。
これは、関連性を保ちたいのであれば、もう1つの重要な領域です。
そして3つ目は、良いチームプレーヤーであること、そして自分の結果や発見を効果的に伝えることに集中することです。
基本的に、人間は自然に良い人と働きたいと思っているため、効果的にコミュニケーションし、対処しやすく、人間関係が良好な人たちとの接触や会話など、AIが置き換えることができない、おそらくこれからも置き換えることができない人間相互の交流が重要です。
これは仕事の大部分を占めるもので、人付き合い、助け合い、学び合いなどです。
このような仕事では、技術的なスキルが重要視されなくなるでしょう。
今、データアナリストやデータサイエンティストが必要かもしれませんが、その人はある特定の技術的なことにとても優れていますが、ちょっと嫌なやつで、一緒に働くのはあまり好きではありませんが、とても優秀な人です。
AIが技術的なことをすべてカバーできるため、そのような人はいなくなるでしょう。もし、技術的には少し劣るかもしれないが、AIのおかげで技術的なことを実装できる、でも一緒に働くのは本当に素敵で、全体的にあなたを助けてくれる、彼から学ぶことができる、そんな人がいれば、その人は仕事を得ることができるでしょう。
というわけで、以上が私の考えです。
私が言ったように、これらのツールで作業することを学び、ドメインの知識を集め、今現在これらのモデルやその能力では捉えられない特定の知識を集め、全体として良いチームプレーヤーになることです。
そうすれば、AIの新時代にふさわしい存在であり続けることができると思います。
しかし、繰り返しますが、これらはすべて推測に過ぎず、私の考えです。
もちろん、この先どうなるかは誰にもわかりません。
仕事は常に入れ替わるものですが、新しい仕事も出てくるでしょう。
ですから、全体として、もしあなたがデータアナリストやデータサイエンティストで、この分野にいて、技術的なスキルを持っているならば、まったく心配する必要はないと思います。
私たちは今、絶好の場所にいるのです。
データを使った仕事はやはりすごいし、データもたくさんあるし、データをまったく使わない会社もまだまだある。
しかし、私が言ったように、おそらく仕事は変わっていくでしょう。もっと広がって、大きな組織や巨大なチームに集中するのではなく、もっと小さなチームになって、どの会社にも最終的にはAIエンジニアがいて、エージェントを管理し、エージェントを設定し、さまざまな新しい仕事と機会を得ることになるでしょう。
ただし、グラフをいくつかプロットし、MatplotlibでPython関数を書いて上司やクライアントに感銘を与える日々は終わりを迎えるでしょう。彼らは「それをできるのはすごいけど、私はExcelがあるから」と言うでしょう。
ボタンを1つ押せば、私のビジネスに特化した解釈で、Excelを使うことができるのです。
これが、私の考えです。
エキサイティングなことで、スピードが速く、ついていくのが大変ですが、少なくとも、この私のちょっとした雑記で、ChatGPT Code Interpreterのスピードが上がっていることを願います。
私が言ったように、ウェイトリストに載って早期アクセスを試みることができますし、これで何ができるか、仕事にどのように役立つかをすでに試してみることができます。
来週はAIの世界で何が起こるのか、次の大きな出来事は何なのか、とても気になります。
ChatGPTの機械学習でしょうか?
わからないけど、本当に速く進んでいて、ワクワクするけど、ちょっと圧倒されるとも言えるね。
おい、今はこれだけだ。
このビデオが役に立ったと思ったら、「いいね!」をお願いします。「いいね!」を押していただくと、YouTubeに「もっとこういうコンテンツを見たい」という気持ちが伝わります。
AIやデータに関する最新情報は、チャンネル登録をして、今後のビデオを見逃さないようにしてください。
それでは、次回もお楽しみに。