新しいiPhoneの機能がリーク!10月のリリース日
8,219 文字
ほな、アップルのハロウィーンソフトウェアリリースがもうすぐやで。
みなさん、ようこそ「オール・フューチャー・ポッドキャスト」へ。ここでは、テクノロジーの未来について面白くてワクワクする、時には怖い話をしてるんや。今日は、ほとんど全部網羅しそうやな。ちょっとした消費者向けテクノロジーの話から、iPhoneに搭載されるAI機能の話までや。
いつもの通り、話がどんどん脱線しそうやけど。ノート見たら、AIで生成した動画の話とか、純粋なAIコンテンツの話とか、AIが我々全員を置き換える話とかあるみたいやし。でも、まずは始めよか。
みんな、この日付を確信してるみたいやけど、10月28日にアップルインテリジェンスが一般公開されるらしいな。ベータ版を使う勇気のある人だけやなくて、みんなが使えるようになるんや。
お前さんはもうベータ版使ってるみたいやけど、みんな興奮すべきなんか?これは面白そうか?
ほんまに面白いと思うで。段階的なリリースやから、ある意味ではあんまりええことやないかもしれんけど、でもこれのおかげで、みんなが一気にどっと新機能を押し付けられるんやなくて、少しずつ理解できるかもしれんな。
ワイは文章作成ツールはあんまり使ってへんけど、一回試してみて書き直させたら、相手に言わんでも「これAIっぽいな」って言われてもうた。
新しいSiriのUIはなかなかええと思うで。特に通知とテキストの要約がお気に入りや。スマホ開いたら30個くらい通知あって、それを2文くらいで要約してくれるんや。
お前さんみたいに、音楽とかテスラの仕事とか、このポッドキャストとか、プライベートとか、いろんなことをこなしてる人にとっては、テキストの要約機能はめっちゃ便利そうやな。
ほとんどの人がある程度は気に入ると思うで。「信用できるかわからん」って文句言う人もおるけど、さっと見て「今すぐ開く必要あるか、それとも後回しでええか」判断するだけやからな。
大事な人からのメッセージやったら、ちゃんと全部読むべきやけどな。
そうそう、ワイもそうしてる。「よっしゃ、今開こう」って思えるし、クリックする前に大体の内容がわかるからな。
ベータ版を使うのはあんまり好きやないって?
ほんま、ベータ版は使いたないわ。面倒くさいし、スマホは絶対使えんとあかんからな。
最近は「このベータ版でなんか壊れた」みたいな大きなニュースはあんまりないけど、昔はあったからな。
アップルの純正アプリが壊れるんじゃなくて、他のアプリが新しいOSに対応してへんから使えへんくなるとかあるんや。
いつも一番悪いタイミングで起こりそうで怖いわ。本当に必要なアプリや機能が動かんくなったりしたらアカンからな。
お前さんは勇気あるな。ベータ版使ってるみたいやけど、今のところ安定してるんか?
今のところは大丈夫や。カメラのシャッターボタン押したら画面真っ黒になって再起動せなあかんかったことが1回あっただけやな。
「写真撮ろう」と思ったら「おっと、再起動や」みたいな。
そう、急にアップルのロゴ出てきて、「なんで再起動したんか報告して」みたいなプロンプト出てくるんや。
でも、昔に比べたらずっとマシになってる。アップルが上手くなったんか、それとも変更点が少なくなって大きな変更がないからなのか、わからんけどな。
でも、やっぱりちょっとしたリスクは伴うからな。10月28日にiOS 18.1がリリースされるみたいやで。さっき言った機能が全部入ってるで。
写真の思い出作成機能とかもあるんや。今でもある程度自動でやってくれるけど、これからは文章でプロンプトを与えられるようになるんや。今までよりスマートになるな。
そして18.2は12月にリリースされるらしいで。これにはChatGPTのサポートが含まれるんや。これはめっちゃ気になるわ。我々みたいにスマホでChatGPT使ってる人間からしたら、これをどう使うんやろ?
アカウントとリンクするんか?アップルのOSを通じて使う方が、ChatGPTのショートカット押すより簡単になるんかな?
めっちゃ興味あるわ。アカウント作らなあかんのかな?ある程度記憶持たせたいやろうし。オフにもできるんかな?いろいろ疑問があるな。
18.2には他にもGenEmojiとか、Image Playgroundっていう背景除去とか静止画加工ができる機能も入るらしいで。
12月リリースっていうのは理にかなってるな。クリスマスにiPhone開けた人が遊びたくなるような機能やからな。新しいスマホを手に入れた感じがするやろ。
ほんまそうや。みんなこういうの欲しがるやろうな。だから、12月中旬くらいのアップデートになると思うわ。遅くても12月20日までには来るやろうけど、もっと早くなるかもしれんな。
これらはアップルインテリジェンスの目玉機能やからな。画像生成とか、すぐに人に見せられるものやし。
AIの会社が芸術的なAIに投資するのもそういう理由やな。「このAIモデルでタンパク質とDNAを分解しました」とか言われても、すぐには理解できへんやろ。
「このエッセイ全部読んで、AIが書いたのに上手いって理解して」って言うより、写真を見せる方がずっと簡単やからな。
そうやな。だからこそこれはホリデーシーズン向けの賢い選択やと思うわ。
でも、次の話題はちょっと残念なニュースかもしれんな。
18.2にはChatGPTとGenEmojiが入るけど、18.3は2025年の初めくらいになりそうで、何が入るかはまだはっきりしてへんのや。
18.4でSiriが来るんかもしれんけど、これもまだわからんな。
ちょっと陰謀論っぽくなるけど、アップルが超クールな新しいHomePodを作ってるとしたらどうや?画面付きで、A37チップ搭載で、ロボットアームまで付いてるような、あらゆる噂が現実になったようなやつや。
そんなん出すなら、新しく改良されたSiriと一緒に発表するのが最高やろ?
春くらいにスマートホーム関連のアップルイベントがあって、そこで「新しいSiriめっちゃすごいで!今まで言うてへんかった機能もあるで!絶対理解してくれるし、二度と間違えへんで!」みたいな感じで発表するんちゃうかな。
実際のところ、単にまだ準備できてへんだけやと思うけどな。アップルはAI関連の準備ができてへんかったからな。でも、製品と一緒に発表すれば、マーケティング的にはええシナジー効果が出るやろな。
お前さんはMacのベータ版は使ってるんやろ?macOS Sonomaは入れてるんか?
いや、Macのベータ版は使うけど、今回は入れてへんわ。Sonomaは入れてるけど、Macにはまだアップルインテリジェンス機能入ってへんのや。
なるほどな。メインのコンピューターには入れへんのや。音楽録音とかするから、それが壊れたらアカンしな。でもラップトップには入れてて、通知の要約とか使えるんや。スマホで慣れてきたから、ラップトップでもiMessageの通知が来るのはええな。
これから面白いことが起こりそうやな。デバイスを混ぜて使ってる人、例えばIntel MacとiPhone 14使ってる人とか、新しいiPad Pro持ってる人とかな。
通知の要約みたいな機能に慣れてきて、突然それがないデバイス使うことになったら、「アップグレードしたほうがええんかな」って思うやろ。そこでティム・クックがニヤリとするわけや。
アップルストアの誰かが羽ばたくんやな。めっちゃ喜ぶやろ。
ほとんどの機能はかなりクールに見えるな。ゆっくりリリースされていくのを見てるわ。
一つ文句言うとしたら、新しいSiriのインターフェースはあるのに、まだ賢くなってへんのがおかしいわ。めっちゃ期待してたのに。
画面全体に広がるようになったけど、まだアホなSiriやねん。
「おっ、アップルインテリジェンスのSiriや!」って思ったら、「あれ?まだめっちゃ間違えるやん」みたいな。
でも、これ全部見てると、AIの競争がどんどん激しくなってるのがわかるな。いいことやけど、ちょっと怖くもあるな。
芸術的なAIの話をしてたけど、その前に、iOS用のGeminiで検索できるGmailの話があったな。これは基本的にGmailにGeminiを統合したってことやろ?
そうや。GoogleのLLMであるGeminiをGmailだけやなくて、Google フォトにも統合してるんや。
つまり、スマートなLLM検索ができるようになるってことやな。これはめっちゃ必要なことやと思うわ。特にメールや写真には。
今までやったら、探してるメールがあっても、送信者とか件名とか本文の中の何かしらのテキストを知ってないと見つけられへんかったやろ。
曖昧な記憶しかなかったら、まず無理やったな。
「テスラから買った商品の発送メールどこやったっけ」って思っても、実際にはTech Shippers.comから送られてきてたりするしな。
これからは「黄色いドレス着てる写真全部見せて」みたいなこともできるようになるんや。今の写真検索システムやと、そんなの見つけるの難しいやろ。
今やったら「ペットの写真見せて」くらいならできるけど、「ダイナミックなペットの写真で、青空が背景で、この場所で撮った、このアスペクト比のやつ」みたいな複雑なリクエストはできへんかったからな。
これからはLLMを通してそういう入力ができて、ちゃんと見つけてくれるようになるんや。めっちゃクールやと思うわ。
明らかに、今のところGoogleの方がアップルより進んでるな。アップルのはベータ版でもまだ使えへんけど、Googleのはもうすぐ使えるようになるし、普通にGmailアプリ開いたり、gmail.comにアクセスしたり、Google フォト使ったりするだけで使えるようになるんやからな。
ほんま、Googleがアップルより一歩リードしてるっていう例やな。
ほな、仮想の状況を考えてみようか。これ、昔からテックのYouTube動画作ってる友達のジョン・リーダーが言い出したことなんやけど、多分最初期のテックYouTuberの一人やと思うわ。
オリジナルのテックYouTube動画を作ってた3人くらいの一人やな。
彼が最近こんな仮説を立てたんや。「もし今まで世界から消えてて、今日突然戻ってきて、スマートフォン選ばなあかんくなったとしたら、iPhoneを選ぶか?」って。
誰かが2つの携帯を渡して、全部の機能を説明してくれたとして、今すぐ選ばなあかんとしたら、ほとんどの人がGoogleベースの携帯を選ぶと思うんや。
そのエコシステムに慣れてへんし、使ったこともないからな。今の機能セットを紙の上で見比べたら、Googleの方が優れてて、今すぐ使えるからな。
せやな。アップルもきっと追いつくやろうけど、皮肉なことに、アップルユーザーでもGmailとGoogleフォト使えば全部使えるってことやからな。だからその議論をするなら「ちょっと待て、全部使えるやん。やっぱりiPhone使うわ」ってなるかもしれんな。
そう考えたらおもろいな。よく「アップルのエコシステムがどうのこうの」って言うけど、まだエコシステムに入ってへん人からしたら関係ないもんな。
まあ、話を戻そか。Googleの話が出たついでに、先週ちょっと話題に出たノートブックLMってやつ、試してみたんや。これでポッドキャストを生成できるんやけど、これがめっちゃ怖いわ。
ノートブックLMのええところは、ソースを全部入力できて、それを元に何か作り出せるところやねん。何か書いてる途中で補完してもらったり、何かを書いてもらったり、ポッドキャストを生成してもらったりできるんや。
ワイはドラマーやから、自分のバイオと、あるレビューされたギグについての記事をいくつか入れてみたんや。そしたらこんな感じになったわ。ちょっと再生してみるで。
(音声再生)
「大事なプレゼンがあるとします。一発勝負みたいなやつです。そしたら、信頼してた
ラップトップが突然休暇モードに入っちゃうんです。ああ、想像するだけで冷や汗が出てきますね。完全な悪夢ですよ。」
「そうそう、でもね、テクノロジーの失敗が許されない人たちがいるんですよ。ライブミュージシャンとかね。」
「おお、いい切り替えですね。完全な即興ですよ。」
これ、ギグの話をしてるんや。ピアノ弾いてた人のRhodesのキーが一つ壊れたんやけど、もちろんそのまま弾き続けたっていう話や。他に選択肢がないからな。
もうちょっと先に進めてみるわ。ワイのバイオを話してるところやな。
「メリッサ・モーガン、デイヴ・ダマニ、リストは延々続きますね。彼は明らかにファーストコールドラマーです。どんな音楽シーンにもシームレスに馴染める
タイプの。LAのアイコニックなジャズスポット、ブルーホエール、カタリナ・バー&グリル、ヴィテロズ、基本的にLAで素晴らしいジャズを見たことがあれば、ライアン・ショーがリズムセクションを支えていたはずです。」
「音楽の世界はつながりが全てですからね。彼は多くのつながりを作ったみたいですね。それと、これ聞いてください。彼はApple TV+の新しいチャーリー・ブラウンスペシャルにも参加しているんです。『スヌーピーとスペース』を含めてね。マジで凄いですよ。ピーナッツの名曲を演奏するなんて、夢のようなギグじゃないですか。」
うわ、これマジで怖いわ。全部聞いてみると、なんかただ事実を言い合ってるだけみたいに聞こえてくるんやけど、お互いに割り込んだり、話をつなげたりするのがめっちゃ自然やねん。
何百万ものポッドキャストを学習させて、こんなリズムと間ができたんやろうな。
女性の声、全部AIやで。男が言ったことにちょっと笑ったりするんやけど、ワイもよくそんな風に笑うわ。現実ではそんなに面白くないことでも、ポッドキャストの世界では少し大げさに反応するもんな。
これ、めっちゃ上手くやってるわ。これをそのままApple Podcastにアップロードしても、みんな本物のポッドキャストやと思うやろな。
そうやな。この声、NPRの二人組ホストみたいな感じやな。スミソニアンの「サイドドア」っていうポッドキャストあるやろ?あれにそっくりや。
あれも事実ベースのポッドキャストで、いつも変な小話から始まって、本題に入っていくからな。
この技術、すごいと思うわ。ちょっと怖いけどな。さっき言うたみたいに、発音の間違いさえなければ、100%本物の人間やと思うやろ。
「ジェフ・ゴールドブラム」を「ジェフ・ゴールドブラム」って発音してたりするんやけど、そういうのがなければ完璧やな。
これが怖いところやけど、ノートブックLMの本来の目的は学習やからな。
例えば、何かのプレゼンの準備をせなあかんかったら、めっちゃ便利やと思うわ。お前さんを紹介せなあかんくなったとして、これらの記事を入れて、イベントに向かう車の中でこの偽のポッドキャストを聴いたら、すぐに情報が頭に入るやろ。
何を強調すべきか、どんな注目を集める話をすればいいかとか、全部盗めるわけや。
これ、多くの人にとってめっちゃ役立つと思うわ。今勉強中の人とかは、全部の資料をこれに入れてポッドキャストを作らせてみるといいかもな。
でも、これ、我々みたいなポッドキャスターやアーティストにとっては、まさに棺桶に釘を打ち込まれるようなもんやな。
ポッドキャストはAIで偽造するのが一番簡単やと思うわ。特に従来型の音声だけのポッドキャストやったら、もう区別つかへんやろ。
きっと今でも偽のポッドキャストを作って、ポッドキャストプラットフォームにアップロードして、収益化しようとしてる人おるやろな。
これはマジで怖いわ。今の技術でここまでできるんやから、将来はもっとすごいことになるで。区別がつかなくなるし、説明の部分も上手くなるし、発音も完璧になるし、脱線の仕方も自然になるし。
11Labsっていうボイスクローン系のAI使ったことあるか?声をクローンするのめっちゃ上手いんやけど、プロフェッショナルに聞こえるようにするスライダーがあってな。それを極端な方に振ると、このポッドキャストみたいに言葉に詰まったり、変な間ができたりするんや。
人間らしい話し方になるわけや。よく聞いてみると、「あのー」とか「えーっと」とか言い始めて、途中で言葉に詰まったりしてるんや。
これ全部一つのパッケージにまとめたら、多分1、2年以内に実現するやろうけど、このショーの2、3エピソード入れるだけで、勝手に作れるようになるんちゃうかな。
突然、ワイがUBIについて熱弁振るい始めて、お前さんが次の話題に切り替えたりするんやろな。
はい、コンテンツクリエイター終了のお知らせや。
その一方で、ビデオポッドキャストなら大丈夫かもって思ってたけど、メタが今週、ビデオ生成技術のソフトウェアを発表したんや。かなり良さそうやで。
メタ・ムービー・ジンって呼んでるわ。変な名前つけんと、そのまんまの名前やな。
生成から動画への変換がかなり良さそうや。今まで見てきた中でも良いほうやな。
Googleのはヴォっていうやつやったと思うし、OpenAIにはソーラっていうのがあるし、他にもいくつかあるな。
今すぐログインして使えるのもあるけど、大体短いクリップで、リアルさはそんなにないんや。
でも、これはかなりしっかりしてるな。これらの動画、ちょっと注意して見たらAIって分かるかもしれんけど、TikTokでスクロールしてたら気づかんかもしれんな。
低解像度の画面で見たり、ちょっと画質落としたりしたら、多分本物に見えるわ。
このメタの製品には、他にも二つ面白い特徴があるんや。
音も作れるんや。環境音を同期させたり、BGMつけたりできるんや。
自然のB級のようなショットがかなり説得力あるように作れるな。ナショナルジオグラフィックのドキュメンタリーにあるような繋ぎのショットみたいなんが、もうできてるって感じや。
それに、既存の動画を読み込んで、AIで音を追加することもできるんや。
フォーリーアーティストとか、映画業界でそういう仕事してる人はやばいな。これ、そういうことができるし、さらに一歩進んでるんや。
既に撮影した動画を読み込んで、AIで操作できるんや。映画でよくある陰謀論チックな変な編集、これでできるんや。
例えば、誰かが風船みたいなランタン飛ばすシーンがあって、それを魔法の泡に変えて、ポンって割れるようにするみたいな。かなり自然に見えるで。
他にも、VRヘッドセットつけた女性がおって、多分メタクエストやと思うけど、それをプロンプトで変えていくんや。
「スチームパンクな眼鏡にして」とか言うたら、そうなるし、「ヘッドセット外して」って言うたらそうなるんや。これもかなり自然やで。
他にも、今まで見てきたAI生成動画の多くはスローモーションが多かったけど、これはリアルタイムのが多いから、もっと自然に見えるんや。
いくつか見てるけど、カボチャ畑でコーヒー飲んでる女性のやつがあるな。顔のリファレンスを読み込んで女性の見た目を作ってるみたいやけど、かなりうまくできてるわ。
髪の毛にエアブラシかけたような感じはあるかもしれんけど、これはすごいな。
そうやな。オンラインの動画の世界では、みんなフィルターかけまくってるから、そういうのに慣れてる人からしたら、これでも「本物や」って思うかもしれんな。
今見てるコーヒー飲んでる女性のショットに、フィルムグレインのオーバーレイかけて、偽のレンズフレア入れたら、ほとんどの人は気づかへんやろな。
これ、スターウォーズで亡くなった俳優を復活させるのに使った従来のCGIよりずっと上やで。
たった2文のプロンプトで、誰かが10秒くらいで入力して作ったんやで。
ほんま、すごいな。ウェブサイトに行けば、いろんな映像見れるし、音のついたやつも聴けるで。
これと、さっきのノートブックLMの偽ポッドキャストを組み合わせたら、もう一般の人には何が本物で何が偽物か全然わからんようになるな。今でもわかりにくいのに、もっとわからんくなるで。
でも、少なくともアップルからは思い出の通知が来るから完璧やな。