2024年9月24日の最新の活躍AI、大規模言語モデル(LLM)の概要
2024年9月24日現在の最新のAI技術を簡単におさらいしましょう。
ここでは、一般の個人が使える範囲でもっとも有名なものだけを取り上げます。
今現在で、一番有名な大規模言語モデル(LLM)を扱う企業は、OpenAIというAIの研究と開発を行う企業です。GPTシリーズやDALL·Eなど、多くの革新的なAIモデルを開発しています。
ChatGPT-Plusという有料契約では、以下の5つのモデルと自然言語から画像を作成できる、DALL-E3が使えます。また、専門に特化型のGPTsを作成することもできます。DALL-E3は無料でも使えますが、制限があります。
OpenAI o1(軽量版のminiもあります)
OpenAIの最新モデルで、より効率的な学習プロセスと高度な自然言語処理能力を持っています。研究や専門分野で使われる、推論やプログラミングが得意と言われています。
GPT-4o
GPT-4の進化版で、より複雑なタスクをこなす能力が向上しており、特に文脈理解が強化されています。
GPT-4o mini
軽量版のGPT-4oで、リソースが限られた環境でも動作可能。迅速な応答が求められるアプリケーションに適しています。
GPT-4
GPT-4oの前のバージョン
ChatGPTアプリ(Android、iPhone・iPad)
音声のやりとりが簡単にできますので通訳にもなります。お出かけ時やちょっとした質問は、これが便利かもしれません。WebサイトのChatGPTとデータが同期しているところは使いやすいですね。スマホで写真を撮って文字化、翻訳してもらったり、何か質問するときも便利です。
DALL·E 3
画像生成AIで、テキストから高品質な画像を生成する能力がさらに向上。ユーザーの意図をより正確に反映します。
【その他の言語モデル】
OpenAI以外の会社のAIには、下記のものが有名です。
下記の4つは無料で使えます。
Claude3.5 Sonnet(通称クロード)、Gemini(ジェミニ、ジェミナイ)、Perplexity(パープレキシティ)、Genspark(ジェンスパーク)
Claude 3.5 Sonnet
Anthropicのモデルで、特に倫理的な配慮が強化されており、ユーザーとの対話において安全性が高まっています。
Gemini
Googleが開発したAIで、マルチモーダル機能を持ち、テキストと画像の両方を扱う能力が向上。検索エンジンやアプリケーションでの情報取得が効率的です。
Perplexity
自然言語処理の性能を測る指標の一つで、モデルの複雑さや予測精度を評価するために用いられます。検索に強いと言われています。出典のリンクも教えてくれるので、とても便利です。
Genspark
広告を排除します。複数のWebサイトの検索データの要約をまとめ、それらの情報からファクトチェックし、出典の確認もできます。多い場合は、150ぐらいのサイトを比較して、文章をまとめて、さらにそれを要約してくれますので、リサーチが大幅短縮できます。
でも、私の隠れたお気に入りはPoeです。
このサイトに行くと、上記に紹介した、OpenAIのものやClaude3.5 Sonnet、Geminiなども選択して使えます。ほかにもいろいろなAIがあります。
私は下記のリンクからログインしてすぐに使えるのですが、アプリをダウンロードしないと使えないような表示が出る場合があります。その時は、どこかにダウンロードを拒否する選択肢があるようなので、そうしたらリンクをクリックするだけで使えます。
有料のものも並んでいてちょっと気になることもありますが、クレジットカード番号を入れない限りは無料で使用できる筈です。ただし、無料の場合は、回数制限などがあります。いろんなAIを使いたい人は、こちらも良いと思います٩( 'ω' )وヨー
👇Poeはここから
自分のBotを作成してキャラクターを定義したり、画像・ビデオを作成することもできます。その他、画像や動画のAIもありますが、ここでは割愛させていただきます。
この記事が良かったら、スキよろしくね💗
サポート感謝します💞☀️大切に使わせていただきます(^^)