『ChatGPTがついに｢見る｣｢聞く｣｢話す｣を習得。世界中のモノの品質が上がる革命』～【新しいweb3ビジネスのアイディアのタネ】2023.9.27

2023年9月27日 11:07

■ChatGPTがついに｢見る｣｢聞く｣｢話す｣を習得します

OpenAIが、ChatGPTでの音声・画像認識機能提供を発表しました。つまりChatGPTに画像を送ってその中身を見てもらったり、それに関連する欲しい情報をもらったりできるってことなんです。さらには合成音声のChatGPTと会話したり、音声からテキスト、テキストから音声への変換も可能になるようです。

このタイトルにあわせて言うなら、今までは「読む」「書く」しかできなかったわけですね。

ChatGPT が「音声認識」「画像認識」「合成音声出力」に対応することを発表しました。公式サイトでデモ動画を載せています。

この機能は、ChatGPT PlusかChatGPT Enterpriseサービスを使っている人限定で提供されます。
今後iOSとAndroidでは、2週間以内に提供開始され、Webバージョンでも近々、画像認識機能が使えるようになるとのこと。

つまりChatGPT の有料ユーザー限定です。
BingChatでGPT-4を無料で使う、GoogleのSGEで検索しながらAIを使うなど、本家ChatGPT の有料版のありがたみが薄れてきたところでカンフル剤を注入してきました。

「音声認識→合成音声出力」で電話応対の自動化も

約3カ月前に、レストランの電話による応対をAIで自動化する「Slang.ai」が2000万ドル（約30億円）を調達したニュースをお伝えしました。

コールセンター業務をAIで自動化する際の、まず標準的に必要になる「音声認識」「合成音声出力」をChatGPT はデフォルトで備えることになるため、あとの必要なことは「お店の情報」だけになります。

お店ごとに違うメニュー、座席数、予約状況などをChatGPT とつなぎ込めば、「Slang.ai」がやっていることを実現できます。

このつなぎ込みの部分の開発も簡単ではありませんが、これまでは音声認識AIとText to Speechサービスを組み合わせ、それぞれのソリューションベンダーに費用を払ってやっと実現できたものがChatGPT だけで完結するようになります。

「画像認識」×ChatGPT

動画では、ユーザーがChatGPTに自転車のサドル調節の仕方を聞いてます。自転車サドル調節初心者と見られるユーザーは、サドルの下のパーツ部分を丸で囲んだ画像をChatGPTに投げ、さらに詳しいアドバイスを求めます。

するとChatGPTは、丸の中のボルトの型を認識し、六角レンチが必要だと教えます。ChatGPTは、マニュアルの画像を認識したり、工具箱の画像を見てそこから適切なサイズのレンチを見つけたりもできるようです。

百聞は一見に如かず。
ChatGPT に言葉で100回説明しても、画像を見せて判断してもらった方が早くて楽です。

上記は写真を見せていますが、いずれは動画を見せることもできるようになるでしょう。

動画に対応できるようになれば、リアルタイムにカメラ越しの映像を見せて助言を求めることもできるようになるはずです。

工場の品質管理にもChatGPT が食い込むか

工場では画像認識技術や各種センサーとAIのディープラーニングを組み合わせて、主に不良品の発見などの品質管理に使用しています。

カメラやセンサーを使って不良品を発見するため、不良品の定義データの多くは「画像」として存在します。

この「画像」に今回ChatGPT が対応できたことで、製造業向けの品質管理AIを比較的ライトに導入できるようになるかもしれません。

たとえばスマホを工場のラインに設置して、内蔵カメラで映像を見せ続けるだけで不良品を自動検知するとなれば、これまで何億円もかけて大がかりに導入されていた不良品検知AIが一気に中小のメーカーまで広がることになります。

そうなれば、世界中の「モノ」の品質がChatGPT によって一定以上に高まるという効果をもたらします。

自転車のサドルの調整方法を気軽に尋ねられるのも便利ですが、「世界中のモノの品質を上げる」ことに寄与するなら、今回のChatGPT の画像認識対応の効果は絶大です。

「品質管理データ」の学習と漏洩が課題

ただし、「不良品」の定義データは各メーカー独自のノウハウですので、この部分をChatGPT が汎用的に学習できないことは課題です。

勝手に情報収集し他社に応用されることが真っ先に懸念されるでしょうから、大企業はこれまで通り自社開発の画像認識AIを使った品質管理を続けるのだろうと思います。

コンシューマーが不良品をSNSやECのレビューで投稿するものを学習するかたちで情報を集めるなどの方法もあるかもしれません。

AIはデータが命。ChatGPT も、ユーザーを中心に幅広い情報を集めるか、個別企業が独自の情報を情報漏洩の心配なく簡単に組み込めるかどうかが次のステップの課題になるでしょう。

この記事が気に入ったらサポートをしてみませんか？