【対談文字起こし】ラジコで大人気のラジオに出演。最新のAIの動向、オープンソースのAI、おすすめAIツールについて語ってみた《J-WAVEラジオ番組「STEP ONE」》
みなさん、こんにちは!株式会社デジライズの代表取締役、茶圓 将裕(ちゃえん まさひろ)です。この度、J-WAVEの人気番組「STEP ONE」に出演し、AI業界の最新トレンドについてお話ししてきました。
先日放送された内容が大変興味深かったので、要点をまとめてnoteにシェアすることにしました。オープンAIの一強時代に、マイクロソフトやグーグルなどの巨人たちがどのように挑戦しているのか、オープンソースの台頭と可能性とは何か、日本企業のAI活用の課題と、オススメのAIツールもご紹介しています。
音声はこちらから
私なりの視点で、AI業界の現状と未来についてわかりやすく解説してみました。AIに興味がある方、ビジネスでAIを活用したい方は必見です!
以下、番組の内容を深掘りしていきます。
番組では、マイクロソフト、グーグル、オープンAIに対抗する新AIモデル準備というニュースが取り上げられました。現在、オープンAIが一強と呼ばれるAI業界において、グーグルやマイクロソフトも負けじと小型のAIを開発するなど、激しい競争が繰り広げられています。
特に注目すべきは、マイクロソフトの動向です。マイクロソフトはオープンAIの親会社でありながら、完全にオープンAIに依存するのではなく、自社でもAI開発を進めているとのこと。具体的には、スマートフォンやウェアラブルデバイスでも動作する超小型のAIモデル「MAI1」を開発中だそうです。
大きすぎるAIモデルではハードウェアに搭載できないため、小型化が必要不可欠です。例えば、メタ(旧Facebook)のレイバン・ストーリーズというスマートグラスにも、小型のAIが搭載されているそうです。スマホのようにファンや冷却機能がないデバイスでAIを動作させるには、チップだけでなくAIモデル自体の小型化・軽量化が求められるわけですね。
1.オープンソースの台頭と可能性
もう一つ注目すべきは、オープンソースのAIモデルの台頭です。現在のトレンドは「オープンソース」だと私は考えています。誰もが情報を共有し、開発できる点が大きな魅力だと思います。
一方、ChatGPTやグーグルのPaLMなどは「クローズドモデル」であり、簡単にいじることができません。モデル自体をダウンロードすることもできないため、利用するたびにOpenAIやグーグルにお金を払う必要があります。さらに、情報が向こう側に行ってしまうという懸念もあります。
そこで、近年は超安全な環境でオープンソースのAIを各社がダウンロードし、カスタマイズして使うのが主流になりつつあります。基盤となるオープンソースモデルは皆が使えるので、そこからカスタマイズするのは社内で完結でき、セキュリティ面でも安心できるというわけです。
オープンソースといえば、誰もが編集できるウィキペディアが有名ですよね。ただ、オープンソースのAIは、みんなで同じものを編集するのではなく、基盤となるテンプレートをダウンロードして各自がカスタマイズし、アップデートしていく形です。
そうすることで、良いものだけがどんどん使われるようになり、自然淘汰されていくことになります。セキュリティ面でのリスクについて番組内で質問されましたが、基本的にエンジニアはしっかりとした企業が出したオープンソースだけをカスタマイズしているので、変なことはしないだろうと私は考えています。
ただし、今後はオープンソースのAIモデルをダウンロードして一般の方々が使うようになるかもしれません。その際にどうなるのか、まだ未知数ではあります。現状、オープンソースを使うのは上位0.何%の技術者に限られており、一般の方はWebで公開されているモデルを使う傾向にあります。
実は先週、番組内で面白い話題が出ました。それは、オープンソースとクローズドモデルの戦いについてです。基本的にクローズドモデルの方が性能が良いため、仕方なくそちらを使っていたそうです。しかし、最近オープンソースのLLaMA3というモデルが登場し、オープンソースでも意外と良いのでは?という話題で盛り上がったとのこと。
そこへ、さらにOpenAIからGPT-4が登場し、再びクローズドモデルが優位に立ったという流れです。まさに、日々移り変わるAI業界の最前線。無料版で使うのか、それともお金を払う価値があるのか。私たちユーザーとしては、無料で高性能のAIを使えることを願っています。
GPT-4は今回、ほとんどの機能を無料で公開してくれました。課金しなくても、画像生成やインターネット検索、エクセルやパワーポイントの解析などができるようになったのです。
一方で、開発者としてOpenAIのAPIを使ったプロダクトを作る際は、文字一文字ごとに課金が発生します。そこは無料モデルとは大きく異なる点ですね。盛り上がりすぎてしまったので、ここで一旦CMを挟みますね。
2. 日本企業のAI活用の課題とオススメツール
後半は、私自身もよく使っているAIアプリの話題から始まりました。私は様々なAIアプリを横断的に使っていますが、最近はChatGPT-4に集約されつつあります。とはいえ、用途に応じた使い分けは重要だと考えています。
ChatGPT-4は基本的に万能ですが、画像や動画の解析においては、GoogleのGemini 1.5 Proという別のモデルが非常に優れています。動画を解析できるのはGeminiだけなので、動画関連の用途ではこちらを使っています。この機能は、5月30日まではAIスタジオという開発者画面から無料で使えるそうなので、ぜひお試しください。
1時間のセミナー動画を入れた瞬間に、Geminiがその内容を読み取ってブログを作ってくれるんです。セミナーが終わったらすぐにブログができているなんて、本当に楽ですよね。今まで動画の文字起こしで終わっていたものが、Geminiなら映像の中身まで理解してくれるので、投影した資料の内容も把握できるようになりました。
また、日本語のメールを書くならAnthropicのClaudeがオススメです。日本語の自然さが抜群なので、メールや文書の作成にはClaude 3とOAPSというモデルをメインで使っています。ただし、これらは有料版での話で、無料版だとそこまでの性能は期待できません。
いろいろなAIがある中で、全てに課金するのは大変だと思います。正直なところ、ChatGPT-4の登場以降は、かなり精度が上がったので、GPT-4だけで十分という個人的な意見もあります。唯一の欠点は動画解析ができないことですが、そもそも動画を解析する機会はそう多くないですからね。
ちなみに、GeminiをGoogleのWeb検索に使用していない人でも、検索結果にAIが出てくるようになるでしょう。裏で使われているものはたくさんあり、基本的に今後はAIが勝手に動いているのが普通になると思います。
iPhone18のiOS18からはAI機能が標準搭載されるとも言われています。使い勝手としては、例えばボイスレコーダーで録音して終わった瞬間に要約されるようなイメージです。こういった機能がどんどん使えるようになるでしょう。
一方で、日本ではいまだにChatGPTが強い印象です。これはなぜなのでしょうか。私が現地で聞いた話では、日本人は右向け右が好きな傾向にあるそうです。iPhoneを皆が使っているように、同じものを使う傾向が強いのかもしれません。
また、ChatGPTのマーケティングが非常に上手いというのも理由の一つでしょう。OpenAIの代表であるサム・アルトマン氏は開発者ではなくビジネスサイドの人物で、以前は世界最強のVCであるYコンビネーターのトップでもありました。日本でのプロモーションにも力を入れており、記者に会ったりしながらしっかりと働きかけているあたり、ビジネスマンとしての手腕を感じます。
でも実は、ChatGPT以外にも優秀なAIがたくさんあるんです。例えば、同じ文章を複数のAIで翻訳させて、一番優秀な結果を選ぶという使い方もできます。AIによって得意不得意があるので、用途に応じた使い分けが重要ですね。
3. これからのAIの広がりに備えて
まだまだお話ししたいことはたくさんありますが、そろそろお時間です。AI業界は日々移り変わっているので、定期的に最新情報をお届けできればと思います。今回お話しした内容が、皆さんのAI活用の一助となれば幸いです。
最後に、日本企業のAI活用についてお話ししたいと思います。残念ながら、日本は海外と比べてAIの導入が遅れているのが現状です。私自身、全国各地で啓蒙活動を行っていますが、まずはChatGPT-4を業務で使ってみることをオススメしています。使うことで、AIのポテンシャルを実感していただければと思います。
これからは、一人一人がAIを上手に活用し、ビジネスや日常生活の効率化を図っていくことが大切です。ぜひ、AIについて学び、活用方法を考えてみてください。
今回お話しした内容が、皆さんのAI活用の一助となれば幸いです。ぜひ、皆さんからのコメントや感想をお待ちしています。一緒にAIの可能性について語り合いましょう。
それでは、今後ともよろしくお願いいたします!
ここから先は
AIニュースマガジン
毎月10記事以上のマガジンが届いて、たったランチ1回分の料金です👀 (1日換算ですと、約50円程度の破格の料金です🔥) 最新のAI情報…
この記事が気に入ったらサポートをしてみませんか?