見出し画像

Appleは、GPT-4を超える新しいAIシステム「Realm」を発表(AI Siri)

Appleは、GPT-4を超える新しいAIシステム「Realm」を発表しました。
これは、Siriの会話理解、画面内容の解釈、周囲の音の認識を向上させることに特に優れています。Realmの革新的なアプローチは、これらの入力をテキストに変換し、言語モデルが処理しやすく理解しやすくすることで、Appleデバイス上でのAIインタラクションの新基準を設定しています。
Realmは、OpenAIのGPT-3.5およびGPT-4と比較し、その最小バージョンでも優れた性能を示しました。4つのサイズがあり、最小のものは画面関連の情報処理でGPT-4を5%以上上回り、はるかに少ないパラメーターを持ちながら性能が向上しています。これは、AI駆動アプリケーションの効率と効果の飛躍を示唆しています。

Appleは「ReALM」(Reference Resolution as Language Model、言語モデルによる参照解決)の論文をを発表した。
これは自然言語理解、情報検索、対話システムにとって重要な技術です。
参照解決は、テキストや会話内での代名詞、名詞、「それ」とか「うしろ」とかが指し示す対象を特定する。
これは、デジタルアシスタントとのやり取りをより自然で直感的にする。テキストのみのモダリティに容易に変換できないタイプの参照もできる。

0) Appleの研究は、ReALMが以前の方法を上回り、GPTのようなモデルよりも少ないパラメータで効率的に動作することを示しています。、画面上のエンティティをその空間位置を保持しながら新しいテキスト表現にエンコードすることが含まれ、これによりLLMがユーザーの画面からのコンテキストを理解できるようになります。これは特にモバイルデバイス上の音声アシスタントにとって重要です。

1) Appleは「言語モデリングとしての参照解決」(REALM)と名付けられたプロジェクトの詳細を論文にしました。これにより、Siriの機能性を向上させる計画を明らかにしました。このプロジェクトは、空間認識や画面上および画面背後の要素との相互作用を含む、大規模言語モデルの制限に対処することを目的としており、Siriをより機能的で、消費電力を少なくし、データをプライバシーとセキュリティのためにデバイス上で処理する能力を持たせることを意図しています。

2) REALMは、画面上のコンテンツを視覚的に認識できるビジョンベースのAIアシスタントを提案しており、これによりユーザーの環境に対する音声アシスタントの文脈認識を向上させ、様々なAppleデバイスとのユーザーインタラクションを改善することができます。これには、スマートホームコントロールを含みます。
3) REALMによる進歩は、ユーザーの要求の文脈と関連性を理解するAIを導入することにより、誤りを減らし、手動入力なしで自然な相互作用を向上させることによって、音声コマンドと書き起こしを革新する可能性があると文書では示唆されています。
これには、音声コマンドを通じて他のアプリや機能を制御する能力が含まれ、異なるアプリケーション間のギャップを埋めます。

4) 文書は、スマートホーム技術、文法訂正、およびユーザーインターフェース体験の向上など、これらの進歩がAppleの株式およびエコシステムに及ぼす潜在的な影響について憶測します。

AIをAppleの製品ライン全体に統合することの重要性を強調し、より直感的でシームレスなユーザー体験を作り出すことを目指しています。

5) REALMプロジェクトで詳述された有望な進歩にもかかわらず、文書はまた、AI開発に追いつく上でのAppleの課題と、これらの革新の憶測的な性質を認めています。これらのAIの強化が成功裏に実装された場合に、増加したサービスを通じて収益を増やすことや、市場予想を大幅に上回る可能性を含む、Appleにとっての潜在的な財務的意義についての議論が含まれています。

この記事が気に入ったらサポートをしてみませんか?