![見出し画像](https://assets.st-note.com/production/uploads/images/140658194/rectangle_large_type_2_75a22eb27051d53c2dcefd88cf404298.png?width=1200)
GoogleAIのイベントGoogleI/O視聴後感
筆者はGoogleIOのライブを途中からしか見て居なかったのですが、技術力てんこ盛りでおなか一杯になるほどこれでもかと新技術が詰め込まれていましたのでイベントのポストを紹介していきます。
その前に一言、今に始まった事ではありませんがGoogleに、センスはないんですよ。非常にダザいんです。致命的な位にダサい。
this wasn’t what I expected #GoogleIO pic.twitter.com/kD2cjZIvxB
— Jason Lengstorf (@jlengstorf) May 14, 2024
何でしょうかね。この統一感のない色使いのステージに響き渡るロック!この登場に続いて、グッズを発射して配りました。
グッズ撃ち込まれてます#GoogleIO pic.twitter.com/xxwryrKwLM
— ギズモード・ジャパン (@gizmodojapan) May 14, 2024
ただし、やはりGoogleはすごいのです。
GoogleAIにもやはりライブ認識がある
これは、ライブビジュアルクエリと言われる技術でリアルタイムストリーミングとニューラルコーデックの組み合わせにより、スマホのカメラを使って物を映しながらそれが何かをAIに尋ねることが可能になります。具体的には、以下のようなプロセスです:
発信側: スマホのカメラで映像をキャプチャし、リアルタイムで圧縮してストリーミングします。
受け取り側: ストリーミングされたデータをニューラルコーデックでデコードし、AIが映像を解析して応答を生成します。
この技術により、ユーザーはリアルタイムでインタラクティブな体験を享受でき、さまざまな用途に応用することができます。
For a long time, we’ve been working towards a universal AI agent that can be truly helpful in everyday life. Today at #GoogleIO we showed off our latest progress towards this: Project Astra. Here’s a video of our prototype, captured in real time. pic.twitter.com/TSGDJZVslg
— Demis Hassabis (@demishassabis) May 14, 2024
この技術は、OpenAIのスプリングアップデートでGTP-4oの音声アシスタントも示してくれました。違いは何かと言うとAI自体の音声ですね。こちらはより、音声アシスタントらしい機械っぽさがあります。OpenAIは映画「her」を理想としているので声さえも、herのAIアシスタントであるサマンサに非常に似ている肉声さながらな音声を使用しています。
昨日、OpenAIの人間さながらなAIとの会話を聞いちゃったらこんな感想もでますね。
Awesome analysis. You may need to work on the voice to make it more human like.
— Martin Varsavsky (@martinvars) May 14, 2024
素晴らしい分析。声をより人間らしくするために、加工する必要があるかもしれません。
Damn. It's certainly not as great as the Open AI demo in terms of the voice and latency but otherwise it's 🔥😮
— Philippe Tremblay (@philtrem22) May 14, 2024
くそ。確かに、音声と遅延の点では Open AI デモほど優れていませんが、それ以外は優れています。
Project AstraでOpenAIのGTP-4o操作の実況を見る
これは面白い試みでしたね。友人同士なのでしょう。二人は同じ中華系でもありAI界では非常に入れ替わりが激しく、Google deepmindから来た人がOpenAIに移動、あるいはその逆、あるいはteslaに行くteslaから来ると言う事が頻繁にあります。
Gemini and I also got a chance to watch the @OpenAI live announcement of gpt4o, using Project Astra! Congrats to the OpenAI team, super impressive work! https://t.co/yxmJt2xL8v pic.twitter.com/p5BqHjc1xQ
— Michael Chang (@mmmbchang) May 14, 2024
emini と Google DeepMind の素晴らしいチームと一緒に Project Astra に取り組めることは、本当に光栄です。 #GoogleIO
基調講演が行われている間、私たちは Project Astra で基調講演を視聴するという土壇場のアイデアを思いつきました。ぜひご覧ください。
”Gemini と私は、Project Astra を使用して、gpt4o の@OpenAIライブ発表を見る機会もありました。OpenAI チーム、おめでとうございます。とても素晴らしい仕事です!”
これは面白い試みでしたね。友人同士なのでしょう。二人は同じ中華系でもありAI界では非常に入れ替わりが激しく、Google deepmindから来た人がOpenAIに移動、あるいはその逆、あるいはteslaに行くteslaから来ると言う事が頻繁にあります。
今日発表の3つの技術
本日のGoogleIOの発表を動画付きでまとめいるポストがありました。
Project Astra: AI アシスタントのビジョン
Imagen 3 & Veo: 新しい画像およびビデオ生成モデル
Gemini 1.5 Flash: ロングコンテキストと 2M トークンを備えた軽量マルチモーダル モデル 1.5 Pro
Today at #GoogleIO we've announced:
— Alexandre Moufarek (@amoufarek) May 14, 2024
🤖 Project Astra: our vision for AI assistants
🎨 Imagen 3 & Veo: our new image and video gen models
♊ Gemini 1.5 Flash: a light-weight multimodal model with long context & 1.5 Pro with 2M tokens...
"Tuesday" as we call it @GoogleDeepMind pic.twitter.com/XgYn3kYaU5
GoogleIOを阻止する右翼たち
イーロン・マスクがX上でGoogle GAMINIを「woke レイシストAI」といって徹底的にGEMINIをやっつけ、画像生成機能を停止させた事件が思い出されます。
HAPPENING NOW
— Jewish Voice for Peace Bay Area (@JVPBayArea) May 14, 2024
Dozens are blocking the entrance to #GoogleIO the company’s flagship conference, protesting the $1.2 billion contract w/Israel
Hundreds are waiting in line & BLOCKED from entering
Shouting “We won’t stop till Nimbus gets dropped” pic.twitter.com/xxka32I8Vz
今起こっていること 何十人もが入り口を塞いでいます#GoogleIO同社の旗艦カンファレンス、イスラエルとの12億ドル契約に抗議 数百人が列に並んで入場を阻止 「ニンバスが降ろされるまで止まらない」と叫びながら
イーロン・マスクの徹底的な批判についは下記のNoteに解説していますので合わせてご覧ください。
ちなみに、サム・アルトマンもこのステージのダサさに感想を述べていますので、ここに共有しておきますね。
i try not to think about competitors too much, but i cannot stop thinking about the aesthetic difference between openai and google pic.twitter.com/hRFYhzm5K8
— Sam Altman (@sama) May 16, 2024
そして残念ながらこういう結果になっています。
Not only aesthetic difference pic.twitter.com/jcZ5Fs0Ysv
— Tibor Blaho (@btibor91) May 16, 2024
OpenAIの「GPT-4o」紹介動画は、約26分の放送時間で3,516,592回再生されているのに対し、Google I/O '24の基調講演は約1時間52分の放送時間で1,000,000回再生されています。この比較から、OpenAIの動画が短時間で多くの視聴者を引き付けたことがわかります。
この記事が気に入ったらサポートをしてみませんか?