GoogleAIのイベントGoogleI/O視聴後感

Zun-Beho

2024年5月15日 08:16

筆者はGoogleIOのライブを途中からしか見て居なかったのですが、技術力てんこ盛りでおなか一杯になるほどこれでもかと新技術が詰め込まれていましたのでイベントのポストを紹介していきます。

その前に一言、今に始まった事ではありませんがGoogleに、センスはないんですよ。非常にダザいんです。致命的な位にダサい。

this wasn’t what I expected #GoogleIO pic.twitter.com/kD2cjZIvxB
— Jason Lengstorf (@jlengstorf) May 14, 2024

何でしょうかね。この統一感のない色使いのステージに響き渡るロック！この登場に続いて、グッズを発射して配りました。

グッズ撃ち込まれてます#GoogleIO pic.twitter.com/xxwryrKwLM
— ギズモード・ジャパン (@gizmodojapan) May 14, 2024

ただし、やはりGoogleはすごいのです。

GoogleAIにもやはりライブ認識がある

これは、ライブビジュアルクエリと言われる技術でリアルタイムストリーミングとニューラルコーデックの組み合わせにより、スマホのカメラを使って物を映しながらそれが何かをAIに尋ねることが可能になります。具体的には、以下のようなプロセスです：

発信側: スマホのカメラで映像をキャプチャし、リアルタイムで圧縮してストリーミングします。
受け取り側: ストリーミングされたデータをニューラルコーデックでデコードし、AIが映像を解析して応答を生成します。

この技術により、ユーザーはリアルタイムでインタラクティブな体験を享受でき、さまざまな用途に応用することができます。

For a long time, we’ve been working towards a universal AI agent that can be truly helpful in everyday life. Today at #GoogleIO we showed off our latest progress towards this: Project Astra. Here’s a video of our prototype, captured in real time. pic.twitter.com/TSGDJZVslg
— Demis Hassabis (@demishassabis) May 14, 2024

この技術は、OpenAIのスプリングアップデートでGTP-4oの音声アシスタントも示してくれました。違いは何かと言うとAI自体の音声ですね。こちらはより、音声アシスタントらしい機械っぽさがあります。OpenAIは映画「her」を理想としているので声さえも、herのAIアシスタントであるサマンサに非常に似ている肉声さながらな音声を使用しています。

昨日、OpenAIの人間さながらなAIとの会話を聞いちゃったらこんな感想もでますね。

Awesome analysis. You may need to work on the voice to make it more human like.
— Martin Varsavsky (@martinvars) May 14, 2024

素晴らしい分析。声をより人間らしくするために、加工する必要があるかもしれません。

Damn. It's certainly not as great as the Open AI demo in terms of the voice and latency but otherwise it's 🔥😮
— Philippe Tremblay (@philtrem22) May 14, 2024

くそ。確かに、音声と遅延の点では Open AI デモほど優れていませんが、それ以外は優れています。

Project AstraでOpenAIのGTP-4o操作の実況を見る

これは面白い試みでしたね。友人同士なのでしょう。二人は同じ中華系でもありAI界では非常に入れ替わりが激しく、Google deepmindから来た人がOpenAIに移動、あるいはその逆、あるいはteslaに行くteslaから来ると言う事が頻繁にあります。

Gemini and I also got a chance to watch the @OpenAI live announcement of gpt4o, using Project Astra! Congrats to the OpenAI team, super impressive work! https://t.co/yxmJt2xL8v pic.twitter.com/p5BqHjc1xQ
— Michael Chang (@mmmbchang) May 14, 2024

emini と Google DeepMind の素晴らしいチームと一緒に Project Astra に取り組めることは、本当に光栄です。 #GoogleIO
基調講演が行われている間、私たちは Project Astra で基調講演を視聴するという土壇場のアイデアを思いつきました。ぜひご覧ください。

”Gemini と私は、Project Astra を使用して、gpt4o の@OpenAIライブ発表を見る機会もありました。OpenAI チーム、おめでとうございます。とても素晴らしい仕事です!”

今日発表の3つの技術

本日のGoogleIOの発表を動画付きでまとめいるポストがありました。

Project Astra: AI アシスタントのビジョン
Imagen 3 & Veo: 新しい画像およびビデオ生成モデル
Gemini 1.5 Flash: ロングコンテキストと 2M トークンを備えた軽量マルチモーダルモデル 1.5 Pro

Today at #GoogleIO we've announced:

🤖 Project Astra: our vision for AI assistants
🎨 Imagen 3 & Veo: our new image and video gen models
♊ Gemini 1.5 Flash: a light-weight multimodal model with long context & 1.5 Pro with 2M tokens...

"Tuesday" as we call it @GoogleDeepMind pic.twitter.com/XgYn3kYaU5
— Alexandre Moufarek (@amoufarek) May 14, 2024

GoogleIOを阻止する右翼たち

イーロン・マスクがX上でGoogle GAMINIを「woke レイシストAI」といって徹底的にGEMINIをやっつけ、画像生成機能を停止させた事件が思い出されます。

HAPPENING NOW

Dozens are blocking the entrance to #GoogleIO the company’s flagship conference, protesting the $1.2 billion contract w/Israel

Hundreds are waiting in line & BLOCKED from entering

Shouting “We won’t stop till Nimbus gets dropped” pic.twitter.com/xxka32I8Vz
— Jewish Voice for Peace Bay Area (@JVPBayArea) May 14, 2024

今起こっていること何十人もが入り口を塞いでいます#GoogleIO同社の旗艦カンファレンス、イスラエルとの12億ドル契約に抗議数百人が列に並んで入場を阻止「ニンバスが降ろされるまで止まらない」と叫びながら

イーロン・マスクの徹底的な批判についは下記のNoteに解説していますので合わせてご覧ください。

ちなみに、サム・アルトマンもこのステージのダサさに感想を述べていますので、ここに共有しておきますね。

i try not to think about competitors too much, but i cannot stop thinking about the aesthetic difference between openai and google pic.twitter.com/hRFYhzm5K8
— Sam Altman (@sama) May 16, 2024

そして残念ながらこういう結果になっています。

Not only aesthetic difference pic.twitter.com/jcZ5Fs0Ysv
— Tibor Blaho (@btibor91) May 16, 2024

OpenAIの「GPT-4o」紹介動画は、約26分の放送時間で3,516,592回再生されているのに対し、Google I/O '24の基調講演は約1時間52分の放送時間で1,000,000回再生されています。この比較から、OpenAIの動画が短時間で多くの視聴者を引き付けたことがわかります。

この記事が気に入ったらサポートをしてみませんか？