![見出し画像](https://assets.st-note.com/production/uploads/images/142624106/rectangle_large_type_2_1324a4ed6516eef91f56baa56418650a.png?width=1200)
ChatGPT-4oの衝撃(1) まるで友達と話すような感情豊かな生成AI [動画付き]
こんにちは。まさ@アップデートする情シスです。
OpenAIが、5月13日のイベント「Spring Update」で「GPT-4o」と、ChatGPTのデスクトップ・アプリを発表したのは記憶に新しい出来事です。
「聞いてください、これ凄いんですよ!」
その数日後、グループ会社の役員にして、天才変態プログラマーのS氏が興奮気味にこう話しかけてきました。
彼とは生成AIのプロジェクトを一緒にやっているので、このあたりのニュースにはお互いに敏感なのだが、いつもと少し様子が違います。
ワシ →「で、どんな感じに凄いの?」
S氏 → 「自分でやってみて下さい」
という事で今回は、「ChatGPT-4oの衝撃」と題し、何が凄いのか、本当に凄かったのかを実際に試してレポートします。
1.アプリをインストール
まず最初にやったのは、アプリのインストール。今まではブラウザで使っていましたが、今回は気合を入れてアプリをインストールしました。
![](https://assets.st-note.com/production/uploads/images/142625957/picture_pc_1b1b5504809e507329767a97c1966b53.png?width=1200)
2.課金
続いては「課金」
無料版ユーザーでもGPT-4oを利用できますが、無料ユーザーは1時間に入力できるプロンプトの数が制限されているので、今回は有料版の「GPT Plus」に加入しました。
さらに、音声対話モードなどの最新機能はGPT Plusのユーザのみに開放されるという事で、月額20ドルのサブスク加入が即決定したのであります。
3.スマホで撮影した画像を認識
さて、何をお願いしようか。S氏に相談したところこんな答えが返って来ました。
画像を雑に読み込ませるだけで
いい感じに認識してくれるみたいですよ
早速、そこら辺にあった医療費の通知書を読み込ませてみて、控除が貰えるかどうかを聞いてみることにしました。
![](https://assets.st-note.com/production/uploads/images/142631639/picture_pc_78ef6b169f911a7f0065636907bba2dd.jpg?width=1200)
アプリを起動してログイン。会話をする前にいきなりスマホで通知書の項目と金額が分かる部分を撮影します。
画像をアップしたら、🎤のアイコンを押して音声入力。
友達にお願いする感じで、これも雑に
「今年の医療費控除額がいくらか教えて」
とだけ指示をします。
動画⬇️
4.会話してみる(女性バージョン)
こちらの雑な質問にも、GPT-4oはいつも通りいい感じで答えてくれました。
GPT-4oの回答は、読み取った画像をテキスト化した内容を読み上げました。さらに、医療費控除の計算方法まで解説してくれたのです。
しかしそれに満足せず、🎧のアイコンを押して音声会話モードに切り替え、追加の指示を与えました。
動画⬇️
会話の途中で変な英語が混ざるのと、数字の読み方が一部おかしかったのですが、AIの会話としては十分なクオリティでした。
※会話してみる(男子バージョン)
声質が4種類から選択できるので、次はイケメン男子風の声を使ってみました。
5.CSVファイルを作ってもらう
GPT-4oは、人間のような会話ができるだけではなく、画像を認識してデータ化することも得意なのです。
今回は、医療費の表(っぽい)画像から、CSVファイルを作ってもらう事にしました。
かなり雑に撮影した画像をアップします。
動画⬇️
6.なんだこのスムーズ感は
ここでまた衝撃が走ります。
「データ化しようと思ったら、
ちゃんとスキャンしないといけない」
という先入観は脆くも崩れ落ちます。
かなり雑に撮影した画像に加えて「これをCSVファイルにしてくれ」という雑な指示でも、見事にCSVファイルに変換してくれました。
しかも、最後にファイルのダウンロードリンクまで作ってくれるのです。
そして特筆すべきは、この一連のやり取りが非常にスムーズであることなのです。
コンピューターやソフトを操作するために、手順書と教育が必要だった時代は、もう過去のことですね。
7.近づくAIとの距離感
今回の体験で、人間とAIとの距離が一気に縮まったと感じました。
企業における業務利用では、パソコンのキーボードをたたいて、生成AIに指示(プロンプト)を出す方法が主流になると思います。
但し、このインターフェースでは、人間と生成AIの距離は縮まりません。
しかし、個人利用においては、スマホと音声入力だけで完結する簡単でカジュアルな使い方が主流になると思われます。
アプリに組み込まれたAIが、友達や恋人、親や先生などのキャラクターになり、まるで人間と会話をするような対話型コミュニケーションしながら、指示された通りにアウトプットを生成するようになるのです。
これは、人間にとって生成AIがさらに身近な存在になることを意味します。
この急速な変化に恐れを感じるのではなく、楽しみながら生成AIと歩んでいきたいと思いませんか?
未来の技術に心を開き、その可能性を最大限に活用することで、自分の生活や仕事がますます豊かになっていくのだから。
![](https://assets.st-note.com/img/1717250519742-bBQoHRFIXG.jpg)
——————
共感頂けたら❤️を押してください
また読みたいと思ったら、フォローをお願いします🙇
——————
この記事が気に入ったらサポートをしてみませんか?