「OpenAI、大規模言語モデルGPT-4を来週発表予定」
GPT-3がトランスフォームします
OpenAIから驚きのニュースが入っています。
GPT-3がGPT-4にバージョンアップします。
現ChatGPTの500倍のパワーを持つとも言われているAIが
来週にも登場するようです。
GPT-4の詳細は、以下のようなものがあります。
GPT-4は、2022年11月に発表されたOpenAIの最新の言語モデルです。OpenAIは、人類に有益な人工知能を開発する非営利団体です。
GPT-4は、インターネット上の約1000億ページ分のテキストを学習しました32。これは、GPT-3が学習したテキスト量の10倍です。GPT-4は、さまざまな言語やドメインに対応できます。
GPT-4は、自然な会話や文章を生成するだけでなく、画像やコードや音楽なども生成できます43。GPT-4は、DALL-E(テキストから画像の変換)やCodex(コーディング)のような専門的なシステムと統合されています。
GPT-4は、高密度モデルと呼ばれるタイプのモデルです。高密度モデルとは、すべてのパラメータを使ってタスクを遂行するモデルです。高密度モデルは、精度が高い反面、計算コストが高いです。
また、GPT-4をBingに搭載するという話も入ってきました。
より一層AIでの情報収集に拍車がかかりそうです。
GPT-4で変化することとは
GPT-4の登場で予想される変化は、以下のようなものがあります。
AIが、より人間らしい自然な会話をするようになります1。
関連アプリケーションのトレーニングコストが大幅に削減されます。
人工知能との付き合い方が変わります。
マルチモーダルAIが可能になり、画像や音楽、動画のテキストを翻訳できるようになります。
GPT-4は、以下のようなことができると予想されています。
音声通話を録音して、自動的に会話内容を文章化できる文字起こし機能
画像や音楽、動画のテキストを翻訳するマルチモーダルAI
文章だけでなく視覚的なコンテンツの理解が可能なAI
マルチモーダルAIとは、複数のモード(例えば、テキスト、画像、音声など)を組み合わせて情報を処理するAIのことです。GPT-4は、マルチモーダルなデータセットを用いて学習することで、画像や音楽、動画のテキストを翻訳できるようになると言われています 。
例えば、ある動画の日本語字幕を英語に翻訳したい場合、GPT-4は動画の映像や音声も考慮して最適な英語字幕を生成できるかもしれません。また、ある音楽の歌詞を別の言語に翻訳したい場合、GPT-4は音楽のメロディーやリズムも考慮して最適な歌詞を生成できるかもしれません。
GPT-4は、OpenAIが提供するAPIを通じて利用できます。APIの利用には、料金が発生します。料金は、使用するモデルの種類やトークン数(文字数)によって異なります。
例えば、GPT-3.5系のモデルを使うと、1000トークン(約750文字)あたり、0.002ドルになります。GPT-4のモデルは、GPT-3.5系よりも高価になる可能性があります。
※APIとは、アプリケーションプログラミングインターフェースの略語で、ソフトウェア同士が情報をやり取りする際に使用されるインタフェースのことです。例えば、あなたがスマートフォンで天気予報のアプリを使うとき、そのアプリは天気予報のサービス提供者のAPIに接続して、最新の天気情報を取得します。そのように、APIは異なるソフトウェアやサービス間でデータや機能を共有するための仕組みです。
APIで有料になるようですが、できれば無料で利用したいですね。
来週の発表を待ちましょう。
【マガジン】レベル60から稼ぐためのヒント
【マガジン】情報書籍
【㏚】読書嫌いなあなたのための新読書法