gpt4o mini 無料 ┃openAI公式リリース┃gpt4o mini 徹底解説

IT＆AI収益化研究所┃AI副業・起業・投資について発信

2024年7月19日 12:47

◆youtube動画

◆今回の動画の目次

●今回の「CHATGPTミニは何が変わった？」
●他のClaudeやgeminiとの比較
●GPT-4o miniはどんな使い方が想定されるか６選

❒各社のAIの性能比較（CHATGPT公式HP）

●MMLUとは
AIの知識と理解力を評価

●GPOAとは
質問応答能力

●MGSAとは
数学的推論

●Humaneval
プログラミング能力

●MMMU
異なる分野の問題を解決する能力

◆今回の「GPT4o ミニは何が変わった？」┃変更①

●コスト効率の向上
GPT-3.5 Turboと比較して60%以上のコスト削減を実現
※APIを使った場合
※GPT-4o miniは無料ユーザーも使えます。
入力トークン100万個あたり15セント、出力トークン100万個あたり60セントという低価格設定
※APIを使った場合　※１５セント＝２１円（GPT3.5turboは50セント140円）

●マルチモーダル対応
テキストと画像の処理に対応し、将来的にはテキスト、画像、動画、音声の入出力をすべてサポート予定
長文処理能力の向上
128Kトークンの入力コンテキストをサポート　※128,000トークン＝日本文字122,880文字
最大16Kトークンの出力が可能　　※15,360文字

変更②
●知識の更新
2023年10月までの情報を学習
多言語処理の効率化
非英語テキストの処理がより効率的に

●安全性の向上
新たな「instruction hierarchy」手法により、ジェイルブレイクやプロンプトインジェクション攻撃への耐性が向上
※「指示階層」手法（直訳）
※AIの制限を解除しようとする攻撃を防ぎます。
※悪意のある指示を混ぜ込む攻撃を無効化します。

◆他のClaudeやgeminiとの比較┃比較①

●推論タスク(MMLU)

GPT-4o mini: 82.0%
GPT-4o: 88.7%
Gemini Flash: 77.9%
Claude Haiku: 73.8%
Gemini 1.5 Pro: 85.9%
Claude 3.5 Sonnet: 88.7%
※Claude 3 Opus (最高性能)　
Claude 3 Sonnet (中間)
Claude 3 Haiku (最速・最小

比較②┃数学的推論(MGSM)
GPT-4o mini: 87.0%
GPT-4o: 90.0%
Gemini Flash: 75.5%
Claude Haiku: 71.5%
Gemini 1.5 Pro: 87.5%
Claude 3.5 Sonnet: 91.6%

比較③┃数学的推論(MGSM)
GPT-4o mini: 87.0%
GPT-4o: 90.0%
Gemini Flash: 75.5%
Claude Haiku: 71.5%
Gemini 1.5 Pro: 87.5%
Claude 3.5 Sonnet: 91.6%

比較④┃コーディング(HumanEval)

GPT-4o mini: 87.2%
GPT-4o: 90.2%
Gemini Flash: 71.7%
Claude Haiku: 75.9%
Gemini 1.5 Pro: 84.1%
Claude 3.5 Sonnet: 92.0%

比較⑤┃マルチモーダル推論(MMMU)
GPT-4o mini: 59.4%
GPT-4o: 69.1%
Gemini Flash: 56.1%
Claude Haiku: 50.2%
Gemini 1.5 Pro: 62.2%
Claude 3.5 Sonnet: 68.3%

◆GPT-4o miniはどんな使い方が想定されるか６選

❒安い費用で高性能なAIアプリ作り
小さな会社でも使いやすい値段
GPT-3.5 Turboより60%以上安い

❒ 画像と言葉を一緒に理解するアプリ
写真を見て説明したり、商品をおすすめしたりできる
将来は音声や動画も扱える予定

❒ 長い文章を理解するアプリ
128,000文字分の情報を一度に扱える
長い本の要約や難しい会話の理解に使える

❒ すぐに返事をするアプリ
チャットボットやお客様サポートに便利
人との会話のようにスムーズにやりとりできる

❒色々な言葉を扱うアプリ
英語以外の言葉も上手に処理できる
翻訳アプリや多言語対応のサービスに使える

❒ 安全性の高いアプリ
悪い人が勝手にAIを操作するのを防ぐ
会社の大切な情報を守るのに役立つ