見出し画像

🤖 Google I/O 2024: AIの新時代に向けた21の発表

Google I/O 2024は、AIを中心に大きく進化したイベントとなりました。チャットボットの新しい輝き、より鋭敏な検索、そしてAndroidのスマート機能に焦点を当てた発表が目白押しでした。

以下に、I/O 2024での21の重要な発表を紹介します:

Gemini Flash 1.5: リアルタイムチャットの新スタンダード

Googleは、新しいAIモデル「Gemini Flash 1.5」を発表しました。このモデルはリアルタイムチャットに最適で、Nanoよりも速く、Proよりも軽量です。テキスト、画像、ビデオ、音声を扱うことができ、開発者はこれを使ってチャットアプリやその他のインタラクティブなエクスペリエンスを統合することが可能です。Flashはコスト効果が高く、AIを活用したチャットイノベーションの波を引き起こす可能性があります。

LearnLM: 教室にAIが登場

GoogleはGeminiを基盤とした新しいAIモデル「LearnLM」を発表しました。これは、検索、Android、YouTubeに統合され、学生に多様な学習資料、インタラクティブな体験、および教育的な質問に対する個別の支援を提供します。教育に特化したタスクに焦点を当てているため、LearnLMの回答は常に関連性のあるものになります。

TalkBackのマルチモーダルリニューアル

AndroidのTalkBackがGemini Nano AIを統合し、大きなアップグレードを受けました。これにより、視覚障害者向けにテキストだけでなく、画像、音、音声言語も認識できるようになりました。オフラインでラベルのない画像を説明するためのオンデバイスAIを使用し、インターネット接続がなくてもユーザーエクスペリエンスを向上させます。

プロジェクトAstraでARゴーグル再登場

プロジェクトAstraのプロトタイプゴーグルが、GoogleのARへの新たな関心を示しています。これらの分厚いメガネは、ディスプレイとハンズフリーのインタラクションを備えており、プロジェクトIrisからの進化を示唆しています。曲がった鼻ブリッジはさらに改良が進んでいることを示唆しています。

AIが即興演奏をサポート

Googleの基調講演では、ミュージシャンのMarc Rebilletが登場し、AIツール「MusicFX」の新しいDJモードを披露しました。テキストプロンプトを音楽に変換し、シンプルなフレーズが多様なトラックを生み出しました。この融合は、開発者にとって記憶に残るハイライトとなりました。

AIスタジオでの実験が可能に

Google AI Studioは、ビデオフレーム抽出とコンテキストキャッシングという2つの重要な機能を強化しました。これにより、AIモデルのトレーニングが効率化され、ワークフローが最適化されます。Vertex AI Studioを通じて、ユーザーはGoogleのモデルを実験し、自分のプロジェクトに適しているかどうかを確認できます。

SynthIDが偽情報対策を強化

Googleは新しいAIモデルと共に、SynthIDのアップグレードを発表しました。これにより、AI生成のテキストやビデオの偽造を防ぐためのツールが強化されました。DeepMindの取り組みにより、誤情報や不要なコンテンツに対する対策が強化されます。

Gemini Gemsによる遊び心のあるAIバディ

Googleは、Character.AIに触発されたGemini Gemsを導入しました。ユーザーはバーチャルトレーナーやシェフのようなチャットボットをデザインし、そのスキルや個性を定義できます。Gemsは、ユーザーがボットの専門分野や性格を指示するだけで、完璧なデジタルアシスタントを提供します。

AndroidのGeminiがさらに賢く

Android版Geminiは、マルチメディアの解析能力が強化されました。動画やPDFを分析し、キャプションに基づいて質問を提案し、PDFの洞察を提供します。さらに、画像を他のアプリにドラッグアンドドロップする機能も追加され、生産性が向上します。

Chromeが賢くなる

Gemini NanoがChrome 126に登場し、テキスト生成などのオンデバイス機能を提供します。Chrome内で直接ソーシャルメディアの投稿やレビューを書くことができます。また、開発者向けには、エラーメッセージの説明やコード修正の提案を行います。

Androidの詐欺電話警告機能

Gemini Nanoを使用して怪しい電話を識別する新機能が開発中です。個人情報の要求や緊急の金銭取引など、赤旗となる要素をフラグします。詳細はまだ不明ですが、Pixel 8 ProやSamsung S24ユーザー向けの初期展開が予想されます。

AIが映像制作を支援:Veo

Google I/Oで発表されたVeoは、テキスト、画像、ビデオプロンプトから1080pの高品質ビデオを作成するAIです。映画制作者向けに早期アクセスが提供され、YouTube Shortsとの統合も計画されています。

プロジェクトAstra: AIが未来を見据える

GoogleはプロジェクトAstraを通じて、OpenAIのGPT-4oに対抗します。リアルタイム処理を通じて、コードの説明やオブジェクトの識別などのタスクを行います。リリース日は未定ですが、Geminiのような既存ツールへの統合が進んでいることが示唆されています。

検索に「AIマジック」が追加

Googleの検索に新しい機能「Overviews」が追加されました。AIを活用して要約、ビデオ検索、旅行計画ツールを提供します。複雑な検索を強化し、情報の質を向上させることを目指しています。

Gemini 1.5 ProがWorkspaceを強化

Googleの強化されたGeminiは、Docs、Drive、Gmailなどと統合され、データの検索や整理をサポートします。「Help me write」機能など、生産性を向上させる機能が追加されています。

Gemini Liveでの音声チャット(限定アクセス)

GoogleはGemini Liveを通じて、リアルタイムでの音声チャットを提供します。これにより、自然な会話が可能になり、音声による手の自由な操作が可能です。

Lensがビデオ検索に対応

Google Lensが静止画像だけでなく、ビデオや音声を活用した検索に対応します。複雑なクエリをビデオで簡単に解決できます。

Ask Photos: AIによるメモリーディテクティブ

Google I/Oで発表された「Ask Photos」は、Gemini AIを搭載し、よりスマートなPhotos体験を提供します。ユーザーの思い出を整理し、必要な情報を簡単に見つけることができます。

FirebaseがオープンソースのAIツールキットを発表

Googleは開発者向けに「Genkit」を発表し、AI機能を簡単に統合できるオープンソースのフレームワークを提供します。

Google's Trillium ChipがAIパフォーマンスを向上

Googleの次世代AIチップ「Trillium」は、前世代と比べて4.7倍のスピード向上を実現しました。データセンターでのスケーラビリティを高めるために、性能ボトルネックを解消します。


これらの発表は、AIが私たちの生活にどのように影響を与えるのか、その可能性を示しています。Google I/O 2024は、AIの未来に向けた大きな一歩となりました。ワクワクしながら、これからの進化を見守りたいと思います。

この記事が気に入ったらサポートをしてみませんか?