見出し画像

GoogleAIのイベントGoogleI/O視聴後感

筆者はGoogleIOのライブを途中からしか見て居なかったのですが、技術力てんこ盛りでおなか一杯になるほどこれでもかと新技術が詰め込まれていましたのでイベントのポストを紹介していきます。

その前に一言、今に始まった事ではありませんがGoogleに、センスはないんですよ。非常にダザいんです。致命的な位にダサい。

何でしょうかね。この統一感のない色使いのステージに響き渡るロック!この登場に続いて、グッズを発射して配りました。

ただし、やはりGoogleはすごいのです。

GoogleAIにもやはりライブ認識がある

これは、ライブビジュアルクエリと言われる技術でリアルタイムストリーミングとニューラルコーデックの組み合わせにより、スマホのカメラを使って物を映しながらそれが何かをAIに尋ねることが可能になります。具体的には、以下のようなプロセスです:

  1. 発信側: スマホのカメラで映像をキャプチャし、リアルタイムで圧縮してストリーミングします。

  2. 受け取り側: ストリーミングされたデータをニューラルコーデックでデコードし、AIが映像を解析して応答を生成します。

この技術により、ユーザーはリアルタイムでインタラクティブな体験を享受でき、さまざまな用途に応用することができます。

この技術は、OpenAIのスプリングアップデートでGTP-4oの音声アシスタントも示してくれました。違いは何かと言うとAI自体の音声ですね。こちらはより、音声アシスタントらしい機械っぽさがあります。OpenAIは映画「her」を理想としているので声さえも、herのAIアシスタントであるサマンサに非常に似ている肉声さながらな音声を使用しています。

昨日、OpenAIの人間さながらなAIとの会話を聞いちゃったらこんな感想もでますね。

素晴らしい分析。声をより人間らしくするために、加工する必要があるかもしれません。

くそ。確かに、音声と遅延の点では Open AI デモほど優れていませんが、それ以外は優れています。

Project AstraでOpenAIのGTP-4o操作の実況を見る

これは面白い試みでしたね。友人同士なのでしょう。二人は同じ中華系でもありAI界では非常に入れ替わりが激しく、Google deepmindから来た人がOpenAIに移動、あるいはその逆、あるいはteslaに行くteslaから来ると言う事が頻繁にあります。

emini と Google DeepMind の素晴らしいチームと一緒に Project Astra に取り組めることは、本当に光栄です。 #GoogleIO
基調講演が行われている間、私たちは Project Astra で基調講演を視聴するという土壇場のアイデアを思いつきました。ぜひご覧ください。

”Gemini と私は、Project Astra を使用して、gpt4o の@OpenAIライブ発表を見る機会もありました。OpenAI チーム、おめでとうございます。とても素晴らしい仕事です!”

これは面白い試みでしたね。友人同士なのでしょう。二人は同じ中華系でもありAI界では非常に入れ替わりが激しく、Google deepmindから来た人がOpenAIに移動、あるいはその逆、あるいはteslaに行くteslaから来ると言う事が頻繁にあります。

今日発表の3つの技術

本日のGoogleIOの発表を動画付きでまとめいるポストがありました。

  • Project Astra: AI アシスタントのビジョン

  • Imagen 3 & Veo: 新しい画像およびビデオ生成モデル

  • Gemini 1.5 Flash: ロングコンテキストと 2M トークンを備えた軽量マルチモーダル モデル 1.5 Pro


GoogleIOを阻止する右翼たち

イーロン・マスクがX上でGoogle GAMINIを「woke レイシストAI」といって徹底的にGEMINIをやっつけ、画像生成機能を停止させた事件が思い出されます。

今起こっていること 何十人もが入り口を塞いでいます#GoogleIO同社の旗艦カンファレンス、イスラエルとの12億ドル契約に抗議 数百人が列に並んで入場を阻止 「ニンバスが降ろされるまで止まらない」と叫びながら

イーロン・マスクの徹底的な批判についは下記のNoteに解説していますので合わせてご覧ください。

ちなみに、サム・アルトマンもこのステージのダサさに感想を述べていますので、ここに共有しておきますね。

そして残念ながらこういう結果になっています。

OpenAIの「GPT-4o」紹介動画は、約26分の放送時間で3,516,592回再生されているのに対し、Google I/O '24の基調講演は約1時間52分の放送時間で1,000,000回再生されています。この比較から、OpenAIの動画が短時間で多くの視聴者を引き付けたことがわかります。

この記事が気に入ったらサポートをしてみませんか?