CHMライブ | フェイフェイ・リーのAIの旅

2024年9月22日 06:50

22,147 文字

みなさん、ようこそ。ほんまにええ感じやね。ええもんが来るさかい、そこはちょっと取っておこか。ほな、始めましょか。わたしのこと知らへん人もおるやろけど、ダン・ルーインいうて、このミュージアムのCEOやねん。ここで働き始めて6年半くらいになるわ。今日のプログラムには特に期待しとるんや。うちの新しいミッションにぴったりやからね。それについてはあとで話すわ。
まずは会員の皆さん、理事の方々、サポーターの皆さん、ボランティアの方々、プログラムを作ってくれるスタッフの皆さんに感謝したいんやけどな。皆さんのサポートと助けがなかったら、こんなことできへんかったわ。ほんまにありがとう。
今日はほぼ満席やし、オンラインでも配信しとるさかい、遠くから見てる人にもようこそやで。
皆さんご存知かもしれへんけど、このミュージアムは6年前くらいにミッションを変えたんや。これからもコレクション機関として、後世のために収集と保存は続けるけど、人間のことにもすごく興味があるんよ。最初は人間がコンピューターやったけど、そのあとコンピューターいうもんを発明して、今じゃコンピューターなしの生活なんて考えられへんようになってもうた。だから、このミュージアムのミッションも変わってきたんや。
テクノロジーを解読すること。過去のコンピューティングについては、うちのコレクションがあるから詳しいし、現在のデジタル技術については、どんどん変わっていくから追いかけるのが大変やけど、それもやってる。そして、これからの人間社会にどんな影響があるかってことも考えてる。今日のプログラムは、個人的な視点からこの問題について深く考えるええ機会になると思うわ。
フェイフェイ・リー博士をお迎えできてほんまに嬉しいんや。彼女の本「The World I See」の話は、人間としての深い経験と、世界トップクラスの専門家としての視点から、コンピューティングが人間社会に与える影響について語ってくれとる。
うちは、こういったテクノロジーが世のため人のために使えると信じとるんや。そして、このミュージアムの目標は、テクノロジーを良い方向に使うにはどうしたらええかを考える手助けをすることなんや。
今日のスポンサーのパトリック・J・マクガバン財団にも感謝したいわ。こういった大規模なプログラムは、マクガバン財団のサポートなしでは実現できへんかったんや。パトリック・マクガバン・シニアは、このミュージアムの創設理事の一人やったんよ。ボストンで始まって、20年以上前にベイエリアに移ってきたんやけどな。AIと人間社会についての連続講座をサポートしてくれて、ほんまにありがたいわ。
さて、お待たせしました。皆さんはAIと人間社会について知りたいとか、もっと学びたいと思って来てくれたんやろ。フェイフェイを紹介させてもらうで。
彼女はスタンフォード大学のコンピューターサイエンスのセコイア教授で、スタンフォード人間中心AI研究所の共同所長や。スタンフォードのAIラボの所長もしてたし、休暇中にはGoogleのAIとML部門の副社長兼チーフサイエンティストもやってた。そこで膨大な研究もしたんや。今は議会と大統領府が設置した全米AI研究リソースタスクフォースのメンバーでもある。
じゃあ、リー博士をステージにお迎えしましょう。
トム・カリルさんも来てくれて、会話のモデレーターをしてくれるんや。トムとは昔、彼がオバマ政権の科学技術政策局で働いてた頃に会うたんよ。クリントン政権とオバマ政権で働いてて、政策の分野でめっちゃ経験がある。全米ナノテクノロジーイニシアチブとブレインイニシアチブにも積極的に関わってた。今は、ルネサンス・フィランソロピーのCEOをしとって、これは新しい組織で、今起こっとる新しいルネサンスについて考えるんや。
トムとフェイフェイに感謝して、ステージに迎えましょう。ありがとう。

トム: みんな、この本買わなアカンで。友達や親戚にもプレゼントしたらええよ。めっちゃ面白いで。
フェイフェイ、このお客さんがどれだけオタクかテストしてみようか。確率的勾配降下法とバックプロパゲーションがどう動くか、他の人に説明できる人、手を挙げてみて。
ほな、フェイフェイ。本の中で、ちょっとAIの歴史について触れてたと思うんやけど、1956年に何が起こったんか、そん時の研究者たちが人工知能を解決できると思うまでどれくらいかかったんか、その辺から話してもらえるかな。

フェイフェイ: まず、コンピューター歴史博物館のみなさん、ダニエルさん、トムさん、お招きいただきありがとうございます。そういえば、旧暦のカレンダーでお祝いしてる人もいると思いますが、今日は中秋節ですね。おめでとうございます。
さて、1956年の話に戻りましょうか。あれはダートマス会議やったんでしたっけ?
トム: そうです。
フェイフェイ: あ、1959年やと思ってました。記憶が曖昧になってきたみたいですね。ここにはほんまの歴史家もおられるんでしょうね。
1956年の暑い夏、ダートマス大学で、AIの創始者たち、ジョン・マッカーシー、マービン・ミンスキー、クロード・シャノン...もう一人おったんですけど、誰やったかな...ごめんなさい、思い出せません。
ジョン・マッカーシーが、たぶんDARPAの小さな助成金を使って、コンピューターサイエンティストのグループを集めはったんです。コンピューティングの未来について議論するためにね。そん時、ジョン・マッカーシーが初めて「人工知能」っていう言葉を作ったんです。
その夏のワークショップで、人工知能とは何か、何ができるのか、どうやってこの問題を解決するのか、っていうホワイトペーパーを書いたんです。特に推論、演繹的推論に焦点を当てて、機械に人間のように考えさせる、質問に答えさせる、決定を下させる、そういうことを目指してたんです。
それから70年以上経って、いろんなことがありました。今はバブルの真っ只中やと思うかもしれませんが、70年代にも専門家システムについてバブルがありました。一次述語論理と専門家システムを使ったAIの実用化が始まったんですが、そのバブルはかなりひどく崩壊しました。期待通りの成果が出なかったからです。
70年代には、ロボットが社会を支配するみたいな雑誌の表紙もあったんですが、そんなことにはなりませんでした。資金も枯渇して、学術界も産業界も研究資金が減りました。軍事関係の資金は残ってたと思いますが、研究者の中にはそういう資金源を避ける人もいました。
結果的に、この分野全体が縮小しちゃったんです。でも90年代になると、AIの分野で静かな革命が始まりました。一般の人から見ると、まだAIの冬が続いてるように見えたかもしれませんが、個人的には、これは早春だったと思います。雪がまだ完全には溶けてないけど、新芽が出始めてる感じですね。
これを牽引したのは一次述語論理じゃなくて、統計モデリングとコンピュータープログラミングの組み合わせでした。これを機械学習って呼び始めたんです。AIと機械学習の分野が自分たちの言語を見つけて、その言語を通じて、自然言語処理、コンピュータービジョン、音声認識といった個別の分野を開拓し始めたんです。研究者たちはこれらの分野でかなり深い研究を始めました。
私自身は、2000年にカリフォルニア工科大学の博士課程でAIの研究を始めました。一般の人からするとまだ冬の時代だったかもしれませんが、私の世代のAI研究者にとっては、二つの重要なことが起こりました。
一つは統計的機械学習です。大学院で最初に受けた授業は「ニューラルネットワークとパターン認識」でした。バックプロパゲーションの論文を読んだり、サポートベクターマシン、ベイジアンネット、ブースティング法、カーネル法なんかも勉強しました。これらのツールを使ってコンピュータービジョンのような AI の問題に取り組み始めたんです。
もう一つは、研究室や大学の外で起こったことで、後にAIに決定的な役割を果たすことになるインターネットの登場です。GoogleはたしかⅠ999年か2000年に設立されましたが、インターネットがデータを提供し始めたんです。
もちろん、その約10年後にはGPUも登場し始めて、いろんな要素が静かに集まり始めました。2010年から2012年くらいには、少なくともシリコンバレーでは、AIが公に注目されるようになりました。GoogleやほかのIT企業が、ImageNetチャレンジで優勝したトロント大学発のまだ名前もない小さなスタートアップを買収しようとしてたんです。
それ以来、現代AIの時代、AIの再生、AIのホットな時代に入ったんです。
トム: そうですね。あなたが関わったプロジェクトが、AIの可能性に対する人々の見方を変えるのに重要な役割を果たしましたね。ImageNetのことです。5000万枚の写真を集めてラベル付けしましたよね。なぜそれが現代のAIブームの火付け役になったんでしょうか?
フェイフェイ: そうですね。ImageNetを知らない人のために説明すると、これは2006年に始まったデータセットプロジェクトで、数年かけて2009年に公開されました。当時、AI分野で最大のデータセットになりました。
1500万枚のインターネット画像を、人の手で分類、キュレーション、整理して、22,000の自然物のカテゴリーに分けたんです。ImageNetを公開した直後に、研究コミュニティーを巻き込んで、毎年ImageNetチャレンジを開催しました。世界中の機械学習と画像処理の研究者に、物体認識のコンペに参加してもらったんです。
このチャレンジは2010年に始まって、2012年に画期的な瞬間を迎えました。その年の優勝者が、今では誰もが知るAlexNetで、トロント大学の研究者たち、ジェフ・ヒントン、イリヤ・サツキヴァー、アレックス・クリジェフスキーらの作品でした。
この瞬間は AI の世界にとって象徴的で、現代AIの3つの基本要素が初めて融合したんです。一つ目はニューラルネットワーク。これがトムが皆さんにバックプロパゲーションについて聞いた理由です。ニューラルネットワークの基礎となる数学ですからね。二つ目は大規模データ。ImageNetを使いました。三つ目はGPUコンピューティング。当時は2つのGPUを使ってました。
ImageNetの重要性は、今から見ると当たり前かもしれません。AIがデータ駆動型だってみんな知ってますからね。でも、ImageNet以前は、人々はデータを信じてなかったんです。みんな全然違うパラダイムでAIに取り組んでいて、ほんのわずかなデータしか使ってなかったんです。
トム: 手作業で特徴量を設計してたんですよね。
フェイフェイ: そうそう、まさにそれです。私たちの斬新なアイデアは、そういうのは全部やめて、モデルにデータを大量に与えて、データ駆動型の手法で高性能なモデルを作り、AIの汎化性能を高めることやったんです。でも、これは多くの人から疑われました。
トム: なるほど。ニューラルネットを普遍関数近似器として考えて、十分な例を与えれば入力と出力の間の関数を学習できるっていう見方は、主流じゃなかったんですね。
フェイフェイ: そうそう、そうじゃなかったんです。
トム: 面白いのは、あなたの本を読むと、年上の同僚たちがなんでこんなことをしてるんだろうって思ってたみたいですね。これは、データを信じれば何かを信じられるっていう良い例やと思います。時には同僚から愛されてないように感じても、続けるべき時があるんです。明らかに大きな影響がありましたからね。
フェイフェイ: そうですね。でも、私はそれを否定的に書いたわけじゃないんです。これは科学の進歩なんです。年上の同僚でも、年下の同僚でも、学生でも、誰かに挑戦されるのは当たり前のことです。私も学生たちにしょっちゅう挑戦されてます。たぶん毎日99個のアホなアイデアを出して、たまに1個だけ良いアイデアが出るくらいです。だから、挑戦されるのは全然構わないんです。未検証のアイデアだったんですから。
でも、特に若い人たちに伝えたいのは、挑戦されたからって諦める必要はないってことです。そこが大事なんです。
トム: そうですね。じゃあ、2012年から2024年までの間に、どんな重要な進歩がありましたか?
フェイフェイ: AIの分野でってことですよね。信じられないかもしれませんが、2012年はジェニファー・ダウドナらがCRISPRを発見した年でもあるんです。すごい年やったんですね。彼女と話したら、同じ年に二つの大きな科学技術のブレイクスルーがあったって。
さて、2012年から12年経ちました。何が起こったんでしょうか。いくつかのことが起こりましたね。
研究の分野では、AlexNetとImageNetは大きな転換点でした。Google みたいな技術企業がディープラーニングに本腰を入れ始めるきっかけになりました。ディープラーニング時代の始まりです。
そして、一般の人々にとっての転換点は2016年1月に訪れました。AlphaGoが囲碁の世界チャンピオンのイ・セドルに勝った時です。これは、機械が人間特有の能力だと思われていたタスクで人間に挑戦できるほど強くなったことを、一般の人が初めて知った瞬間でした。また、ディープラーニングに加えて強化学習という新しいアルゴリズムも紹介されました。
2016年から2022年の間は、AIへの投資が徐々に増えていきました。大手テック企業、起業家たちがどんどん参入してきました。でも同時に、テクノロジーへの反発も少し見られ始めました。多くの人にとって、ケンブリッジ・アナリティカ事件と2016年の選挙の後にテクノロジーへの反発が起こったと思います。機械学習のバイアスが指摘され始めたのもこの頃です。自動運転車による最初の死亡事故が起きたのも2017年くらいでしたね。
テクノロジーへの期待と懸念が社会的な議論を呼び起こし始めました。そして、こういったことが全部積み重なって、2022年10月末にChatGPTが登場したんです。
研究者の立場からすると、ChatGPTが来るのは見えてたんです。「嘘つき」って思われるかもしれませんが、本当なんです。なぜかって言うと、スタンフォード人間中心AI研究所の共同所長として、2021年に世界初の基盤モデル研究センターを設立したんです。GPT-2の結果を見て、一般の人はまだ気づいてなかったけど、私たちみたいな研究者は「これはヤバい」って気づいたんです。同僚のパーシー・リャンやクリス・マニングと「これは世界を変えるぞ」って。だから急いでこのセンターを作ったんです。
だからChatGPTが出た時は、このセンターを作っておいて良かったって思ったけど、同時に世間の反応の大きさにはびっくりしました。AlphaGoの時とChatGPTの時の一般の人の反応の違いは、単に人数が違うだけじゃないんです。ChatGPTは初めて、AIが個々のユーザーの手の中に入ったんです。AlphaGoは囲碁のプロ以外は触れなかったけど、ChatGPTは誰でも指先で使えるんです。これは個人にとっても、政府にとっても目覚めの瞬間でした。
ChatGPT以前は、「これやろう、あれやろう」って感じだったんです。うちの研究所のミッションの一つは、テクノロジー界と政策立案者の架け橋になることで、私もワシントンに飛んでは会話を続けてました。でも ChatGPT 以降は、ワシントンの方から呼び出しがかかるようになったんです。
トム: 「一体何が起こってるんだ?」って感じですね。
フェイフェイ: そうそう、まさにそんな感じ。この10年間、一般の人から見ると個別の出来事の連続に見えるかもしれませんが、私たちから見ると、投資がどんどん増えていく連続的な流れに見えるんです。
トム: 対数グラフみたいな感じですね。
フェイフェイ: その通りです。投資がどんどん増えていってる感じです。
トム: 研究者の間で、この大規模言語モデルが「確率的オウム返し」なのか、それとも実際に推論が行われてるのか、まだ議論があるんでしょうか?
フェイフェイ: 「確率的オウム返し」って言葉を使ったのは、大規模言語モデルを批判した論文からきてるんですよね。モデルの能力、エネルギー消費、限界、バイアスなど、いろんな角度からこれらのモデルを批判することは大切だと思います。
でも、科学的な観点からは、神様とかオウムとか呼ぶんじゃなくて、もっと中立的な言い方をした方がいいと思います。これは単にパターンマッチングやパターン学習をするだけじゃなくて、予測もできる大規模なモデルなんです。かなり高性能なモデルで予測もできるんです。
ある程度の推論能力があることも示されてると思います。物事を説明できるからです。1月1日に新しいバージョンがリリースされたばかりで、私もまだ試せてないんですが、推論能力がさらに一歩進んだみたいです。
だから、パターン認識能力はもちろんあるし、オウム返しみたいな能力もあるけど、ある程度の推論能力もあると言っていいと思います。
でも、特に教育者として、一般の人に正直に伝える責任があるので、この推論能力を過大評価しないように気をつけてます。意識があるとか、自我があるとか、そういう誇張した解釈には特に注意してます。
トム: これから3〜5年で何が起こりそうだと思いますか? 現在のシステムの最大の限界は何で、性能を向上させるためにどの分野で本当の進歩が見込めると思いますか?
フェイフェイ: トム、言語モデルに限定した話をしてるんですか? それともAI全般の話ですか?
トム: AI全般の話です。例えば、GPUをもっと買えば信じられないほど進歩すると信じてる人もいます。2枚のGPUじゃなくて200万枚のGPUを買うとか。もっとデータ、もっと合成データとか。「Transformer、注意機構さえあれば十分」みたいな。
今の技術をスケールアップするだけで信じられないほど改善できると信じてる人もいれば、今のAIには根本的な限界があって、ニューロシンボリックアプローチみたいな新しいアプローチを探る必要があると言う人もいます。この議論についてどう思いますか?
フェイフェイ: まず、どれも良い指摘です。実際、私たちは本物のAIデジタル革命の真っ只中にいると思います。だから、これから3〜5年は技術的にはすごくワクワクする時期になると思いますが、社会的には緊張も伴うでしょう。政策面でもね。
あなたが挙げたのは主に技術面の話ですね。まず、人類の歴史上のどの時点でも、技術と科学には限界があって、常にその限界を押し広げることができると信じてます。
個人的には、言語を超えた空間知能にすごくワクワクしてます。人間や動物の知能を見ると、言語は知能の一部分に過ぎません。高度な知能でさえ、言語以外のものに基づいて文明を築いてきました。ピラミッドの建設から、第一次産業革命の複雑な機械の設計、DNAの構造の発見、映画製作まで、これらの多くは言語を超えた空間知能に基づいています。だから、言語以外にも新しい扉が開かれつつあるんです。
技術的に言えば、データのスケーリング則はまだ健全な証拠が見られます。でも同時に、データの限界、特にインターネット上のテキストベースのデータの限界に近づいてるんじゃないかという話も聞こえてきてます。
でも、高等教育の現場にいる立場から見ると、まだデータが適切に収集されてない科学的発見の分野がたくさんあります。これらのデータのデジタル化からモデリングまで、まだやることがたくさんあるんです。
だから、これからの3〜5年間は、大規模基盤モデルの商業化だけでなく、AIや機械学習によって様々な分野で科学的発見が花開くと思います。空間知能もどんどん発展すると思います。私自身もそれに関わってて、とてもワクワクしてます。
これからの3〜5年は、技術の年であるだけでなく、これらのモデルをどう展開し、どう統治するかを考える年にもなるでしょう。ここカリフォルニア州でもAI法案が議論されてます。個人的には、安全対策や政策措置には賛成ですが、良かれと思ってつくられた法案が、科学やオープンソースコミュニティに意図せぬ悪影響を与える可能性も心配してます。
これらのことが全部、これからの3〜5年で展開されていくでしょうね。
トム: 政策の問題には後で戻りたいと思いますが、空間知能についてもう少し詳しく説明してもらえますか? コンピューターが見たり、行動したり、学んだりできるようになるってどういうことですか? 空間知能が進歩してるってどうやって分かるんでしょうか?
スタンフォードの同僚のチェルシー・フィンは、まだ一度も行ったことのない家に行って朝食を作れるロボットを作るのは、まだまだ遠い未来だって言ってましたよね。
フェイフェイ: そうですね、まだまだ遠いです。早く実現してほしいですけどね。
人間の言語の発達を遡ると、これはまだ研究中の分野ですが、最も初期の原始言語は人類の祖先で100万〜200万年前くらいに現れたと言われてます。今日使ってる言語は過去30万年以内に発達したって人も多いです。
でも、3D空間を見る能力、何が起こってるかを理解する能力、障害物や食べ物を見る能力、どう動くかを考える能力を遡ると、5億4000万年前まで戻ります。これは、水中の動物が初めて光センサーを発達させた時期です。
知覚能力が始まったんです。知覚能力が始まると、動物は意識的に動き始めました。それまでは、ただ漂ってるだけで、たまに何かに触れるくらいでした。おそらく初期の触覚センサーはあったと思いますが、とてもゆったりした感じでした。でも文字通り「見える」ようになると...
トム: それ、子どもたちから聞いたんですか?
フェイフェイ: はい、まあ、若い学生たちと一緒に仕事してるんで。「見える」ようになると空間知能を発達させ始めるんです。人生を計画し始める。食べ物を見つけ始める。誰かの食べ物にならないように隠れ始める。そこから知能の進化プロセスが始まったんです。
空間知能は、こういった能力全てを含む言葉です。今日的に言えば、3D世界を理解し、推論し、生成し、相互作用する能力のことです。私たちは今、物理的な世界とデジタルな世界の両方に同時に生きてるので、この空間知能は両方の世界に適用されます。
これは、朝食を作りに家に来てくれるロボットの話にも繋がります。そういうロボットに最も必要なのが空間知能なんです。冷蔵庫はどこにあるのか、コンロはどこか、卵はどこにあるのか、卵を割ってフライパンに入れるにはどうすればいいのか、こういったことは全て空間知能の一部なんです。
トム: なるほど。人工汎用知能（AGI）という概念についてよく議論されてますが、これは有用な概念だと思いますか?
一般的に、AGIは経済的に有用な人間の仕事を全てこなせるAIのことを指します。ロボットは置いておいて、リモートワーカーのようなAGIがあれば、人間がやっている経済的に有用なことは何でもできるようになるという考え方です。
まず、これは有用な概念だと思いますか? そして、3年以内にAGIが実現するという人もいますが、それは楽観的すぎると思いますか?
フェイフェイ: いい質問ですね。でも、これはほんまにシリコンバレーらしい質問やなあ...
トム: そうですね、フェイフェイ。ここはシリコンバレーですから。
フェイフェイ: わかってます。時々、AIの先駆者たち、ジョン・マッカーシーやマービン・ミンスキー、アラン・チューリングなんかと頭の中で対話することがあるんです。チューリングは自分のことをAIの先駆者とは呼ばなかったでしょうね。彼が「考える機械」という人類への挑戦的な問いを投げかけた時、後にチューリングテストとして知られることになりますが、まだAIという言葉は発明されてなかったですからね。
でも、こういった巨人たちと対話すると、彼らのAIの定義は今のAGIにかなり近いんじゃないかと思うんです。一般的な知能の能力ということですね。
だから、学者として、AIとAGIを区別するのは難しいんです。深く重なり合ってると思うからです。
AGIという言葉が出てきたのは、たぶん10年も経ってないと思います。どちらかというと産業界のマーケティングから生まれた言葉です。
別に悪いことじゃないんですが、学者、科学者、技術者、研究者、教育者の立場から見ると...本を読んでくれた人は知ってると思いますが、私はよく「北極星」という言葉を使います。科学者として、私たちは自分の人生では解決できないかもしれない難しい問題を追い求めます。でも、それが私たちを奮い立たせるんです。
AIという分野の「北極星」は、常にその一般的な能力だったんです。
だからAGIという言葉についてどう思うかって? 正直、誰も私に聞いてこなかったんです。別にいいんですけどね。でも、私たちが愛し、信じ続けてるAIという分野は、ほぼこの定義と重なってるんです。
では、3年で実現するのか? ベンチャーキャピタリストの前なら「はい」って言うでしょうね。でも、ここにはそういう人はいないでしょう? だから、責任ある態度を取らないといけません。
それって何を意味するんでしょうか? 機械が重要なタスクで人間を超えるってこと? それはもう部分的には実現してます。2006年のDARPAグランドチャレンジでは、同僚のセバスチャン・スランとそのチームが、ネバダの砂漠で138マイルを自動運転で走破しました。これはすごい能力です。
それに、何十もの言語を翻訳できる機械もあります。これは明らかに超人的な能力です。他にもたくさんのタスクで人間を超えてます。
トム: AlphaFoldとかね。
フェイフェイ: そうそう、AlphaFoldやAlphaGoもそうです。ImageNetだって1000種類もの珍しい物体クラス、例えば星鼻モグラとか、たくさんの犬種とかを識別できます。これらは全て超人的な能力です。
だから、ある意味では既に実現してるし、これからもどんどん実現していくと思います。でも、明確な定義がない中で、3年以内に人間の全体的な能力、人間と同じくらい知的で、人間と同じくらい複雑になるってことなら、それは信じられません。
トム: わかりました。スタンフォードで取り組んでる人間中心AIのイニシアチブについて話しましょう。まず、人間中心AIって何を意味するんですか?
フェイフェイ: いい質問ですね。今の私にとって、人間中心AIは自分のAI研究を考えるためのフレームワークです。AIは人間が作り、人間が使い、人間の生活に影響を与えます。だから、このテクノロジーを考えるための指針となるフレームワークが必要なんです。
2018年3月、まだGoogleのチーフサイエンティストだった頃、ニューヨークタイムズに記事を書いて、「人間中心AI」というフレームワークを提唱しました。Googleでの仕事にすごく刺激を受けたからです。
日本のキュウリ農家からフォーチュン50の大企業まで、AIを使って事業モデル全体を革新しようとしてる人たちと接する機会がありました。そこで気づいたんです。このテクノロジーは、私が想像していたよりもずっと大きなものだって。私たちの生活やビジネス、世界に深い影響を与えるんだって。
その認識に、正直背筋が凍りつきました。こんなに強力なツールがあるって考えるのは怖いことです。だから、その影響について考えなきゃいけない。そして、その深い影響は、人間への影響に基づいて考えるべきだと思ったんです。
そう考えた時、スタンフォードの同僚たちと「人間中心」というフレームワークでAIにアプローチする必要があると宣言したんです。
スタンフォードHAIでは、AIの人間への影響を3つの同心円で考えています：個人、コミュニティ、社会です。
例を挙げましょう。個人というのは、一人一人が大切だということです。このテクノロジーはどう機能するのか? あなたにどんな影響を与えるのか、どんな利益をもたらすのか? アーティストなら、AIをどう使って自分の能力を高められるのか? それとも知的財産を奪われてしまうのか? 患者さんなら、このテクノロジーで人間の尊厳を損なわずに治療できるのか? 学生なら、このテクノロジーを使って興味のあることをどう学べるのか?
次にコミュニティへの影響です。AIをどう使えば、リソースの少ないコミュニティを助けられるのか? 例えば、AIと遠隔医療を組み合わせれば、病院や医師が十分にいないコミュニティにとってすごく良い使い方になります。一方で、AIのバイアスが特定のコミュニティに悪影響を与える可能性もあります。実際にそういうことが起きてますよね。
最後に社会です。今日、AIが民主主義プロセスに与える影響について議論しない日はありません。AIやディープフェイク、情報戦がどう変化をもたらすのか。仕事の話も避けられません。ソフトウェアエンジニアからトラック運転手、放射線科医まで、AIは社会全体に影響を与えています。
これら全てが人間に関わる問題です。数学はきれいですが、人間の世界は複雑です。AIはもう、きれいな数学やプログラミングの世界から出て、複雑な人間の世界に入ってきたんです。
トム: そうですね。誰かが「テクノロジーは簡単、人間は難しい」って言ってましたね。
フェイフェイ: そうそう、特に小さい人間はね。
トム: AIの潜在的な利点や応用で、あなたが最も期待してるのは何ですか? アンビエントヘルスとか?
フェイフェイ: ありがとう、それは私の本の10章に書いてあるんですよ。本当に可能性は無限大です。
個人的には、長年病気の親の看病をしてきて、プライマリケア、救急外来、手術室の外、外来診療所でたくさんの時間を過ごす中で、大きなインスピレーションを受けました。
母の世話をしてて気づいたんですが、私たちの医療システムは人間が人間の世話をすることでいっぱいです。でも、看護師から医師、介護者まで、これらの医療従事者には十分な時間がありません。十分な助けもありません。
だから、ヘルスケア現場でのアンビエント知能というアイデアは、スタンフォード医学部の同僚たちとの共同研究から生まれました。テクノロジーを使って、医師や看護師、介護者を助ける追加の目と耳を提供し、患者の安全を確保したり、状態が急速に悪化していないかを確認したりすることができるんです。
例えば、手を挙げてもらいたくはないんですが、きっと多くの方が家族や友人の転倒を経験されたと思います。特に高齢者にとって、これはとても痛ましく、コストのかかる怪我です。でも、どうやってそれを予測し、警告し、助けるのか? 高齢者や患者さんをどう助けるのか?
人間の知能だけでは24時間見守るのは難しいですが、コンピューターとカメラなら手伝えます。あるいは、アンビエント知能がCOPD患者の状態を監視し、酸素レベルが急激に変化したり、状況が変わったりした時に医師に警告することができます。
これは、AIがほぼ守護天使のように、介護者を補助して人々の世話をする一例に過ぎません。
教育分野でも面白い使い方が見られます。パーソナライズド・ラーニングとかね。AIがチューターになったり、ティーチングアシスタントになったり、様々な学習環境で教師を補助したりできるのは明らかですよね。
トム: あなたの元学生のアンドレがそういった研究をしてるんじゃないですか?
フェイフェイ: そうそう、数日前に会ったばかりです。農業分野でも多くの使用例があるんですよ。ディープラーニング革命が始まる前、昔の学生が、コンピュータービジョン技術を使って畑の雑草を検出し、作物を健康に保つスタートアップを共同設立したんです。
サーモン養殖にAIを使ってる人の話も聞きました。AIの前向きな使用例は本当に数え切れないほどあります。
トム: そうですね。どうすれば、あなたの同僚のダフネ・コラーのように、機械学習の背景を持ちながら、ヘルスケアや創薬についても詳しい人材をもっと育成できるでしょうか?
計算科学の専門知識と特定の分野の専門知識の両方を持つ人が、より魅力的な使用例を生み出せる立場にいると思うんですが。
フェイフェイ: その通りです、トム。私は学際的・多分野的なアプローチを強く信じています。
AIと計算神経科学の交差点、AIと計算生物学の交差点、AIと政治学の交差点といった分野で博士号を取得しなくても、学生時代に、コンピューティングやSTEM分野と、生物学やアート、政策、化学など、あなたが情熱を持っている分野の両方を学ぶことには大きな価値があります。
学生の皆さん、まだ学校にいる人、大学進学を考えている人、大学生の人、トムの言ったことは本当に価値があります。学際的なアプローチを取り入れてください。
もう少し広い視点で見ると、AIはコンピューティングの新しい言語です。よく「チップがあるところには、AIがある、あるいは将来AIが来る」と言われてます。電球くらい小さなものから、ロボットや車くらい大きなものまで、どこにでもAIがあるんです。
このテクノロジーがこれほど重要なら、子どもたちを若いうちから教育し、あらゆる背景を持つ学生たちを教育し、一般の人々を教育する必要があると思います。コーディングができなくても、少なくともこのテクノロジーが何なのかを知ることは大切です。
最後に、コンピューティングに情熱がない人でも、コミュニティの一員になることは良いことだと思います。コンピュータープログラミングやAIの技術的な詳細に興味がなくても、アートや政治学、法律、医学に情熱がある人にも居場所があります。なぜなら、AIを使って自分の分野で違いを生み出すのは、その分野の専門家だからです。自分の視点からAIを取り入れ、それを使って前向きな変化を起こすことを恐れないでください。
トム: 人々は多くの潜在的なリスクを挙げています。既に話したものもありますね。仕事を失う、ディープフェイクで選挙を混乱させる、既存のバイアスを強化する、など。もっと推測的な懸念もあります。例えば、「道具的収束」という考え方。AIシステムに目標達成のための目的関数を与えると、自己複製や計算能力の増強といった副次的な目標を持つようになるという考え方です。
人々が話すリスクの中で、あなたが最も真剑に受け止めているのはどれですか?
フェイフェイ: そうですね、リスクはたくさんありますね。どんな強力な技術でも、害を生み出したり、害のために使われたり、良かれと思ってやったことが意図せぬ結果を招いたりします。それは認めなければなりません。
でも、一つのリスクを選べと言われたら、教育者として、AIの新時代を迎えるにあたって最大のリスクは無知だと言いたいです。
単に「AI」のスペルが分からないという基本的な無知だけじゃなくて、深い知識を持った人でも、細部やニュアンス、詳細を無視してAIを誇張して伝えてしまうこと、それが社会にとってのリスクなんです。
無知だと、このテクノロジーを自分たちの利益のために使う機会を逃してしまいます。無知だと、実際のリスクを指摘したり認識したりすることができません。無知なメッセージを広めると、一般の人々や政策立案を誤った方向に導いてしまいます。
これらの問題の多くは、実は理解不足から生まれているんです。リスクを正しく評価できなかったり、誇張して伝えてしまったり、完全に見逃してしまったり。そういう意味で無知が最大のリスクだと考えています。
トム: 今、人々が言っていることで、あなたが完全に的外れだと思うことの例を挙げてもらえますか?
フェイフェイ: そうですね、例えば「AIは全て良いものだ」と言う人がいます。「テクノロジーは全て良いものだ」「良いことしかない」「悪いことは絶対にない」と言うようなものです。これは過去の無知だと思います。
人類の道具との歴史を見れば、どんな道具も有害な方法で使われてきました。データセットにバイアスがあれば、公平性の面で本当に悪い影響が下流に出てきます。AIがどうやって作られているかを知らなければ、知らないうちにディープフェイクを使ってしまう可能性もあります。これらは全て良くないことです。
でも、もう一方の極端もあります。「これは悪魔だ」「存在論的な危機だ」「自己増殖して、電力網を切断する」といった類の主張です。これも誇張されていて、AIが抽象的な概念ではなく、実際には物理的なシステムの中に存在していることを無視しています。
仮想のソフトウェアやデジタルプログラムであっても、物理的なシステム、データセンター、電力網の中に存在し、人間社会の中に存在しているんです。多くの要素が絡み合っていて、文脈依存なので、そういった誇張的な仮定は強すぎると思います。
トム: でも、ジェフリー・ヒントンのような、テクノロジーをよく理解している人たちが、こういった推測的な懸念を提起しているんですよね。なぜ、テクノロジーに深く関わってきた人たちが、ここ数年でより懸念を強めているんだと思いますか?
フェイフェイ: まず、ジェフのことは本当に尊敬しています。大学院生の頃からジェフを知っています。実は去年、トロントでジェフ・ヒントンとこの問題について公開討論をしました。YouTubeで見られます。おそらく、ジェフが誰かとこの問題について公に議論した数少ない機会の一つだと思います。
彼の話をよく聞くと、彼は懸念を表明し、潜在的なリスクを指摘しています。でも、彼の懸念が誇張されて伝わっている面もあります。それは区別する必要があります。
ジェフとの議論は全面的に尊重しますし、彼に同意します。このテクノロジーを無責任に使えば、本当に深刻な結果を招く可能性があります。彼には彼なりの「無責任な使用」の定義があり、私にも私なりの定義があります。
個々の人がそれぞれの方法でこれらのリスクを指摘することは尊重します。でも、私も責任ある伝達者、教育者でありたいと思っています。一般の人々に、このテクノロジーを活用し、統治するのは私たち人間一人一人の責任だということを伝えたいんです。
まだ時間はあります。絶対にあります。全てが私たちの手の中にあって、それを諦めるべきではないんです。
トム: そうですね。ガバナンスの話をしましたが、あなたは国立研究クラウドというアイデアを政治的なアジェンダに乗せるのに重要な役割を果たしましたね。
もし次期大統領にブリーフィングする機会があって、「フェイフェイ、私は何をすべきだ?」と聞かれたら、どんなアドバイスをしますか? アメリカ政府がAIの利益を促進し、リスクを理解・管理するために取るべき最も重要な施策は何だと思いますか?
フェイフェイ: たぶん、昨年6月にバイデン大統領に言ったのと同じことを言うと思います。今年初め、一般教書演説の時にも会いましたが、私は国に健全なAIエコシステムが必要だと信じています。
エコシステムというのは、公共部門、学術界、起業家、今は小規模テック企業と呼ばれるもの、そして大手テクノロジー企業を含みます。私たちの国は危機の真っ只中にありますが、非常に強い民主主義を持っています。この民主主義の価値を信じています。
健全なAIエコシステムを持つことは私たちの強みを生かすことになり、非常に前向きな役割を果たせると信じています。
トム: でも、具体的に何かできることは? 公共投資とか?
フェイフェイ: 公共投資は本当に重要です。今は部分的に民間セクターにいるので、AIへの民間投資と公共投資の格差があまりにも大きいことを痛感しています。
私のスタンフォードのコンピュータービジョンラボは他の教員と共有していますが、H100は1枚もありません。A100も1枚もありません。まだA6000や他の古いチップを使っています。一方で、大手テック企業は何十万、何百万ものチップを持っています。
公共部門への投資こそが、アイデアの庭、花が咲く場所なんです。今日の私たちがここにいるのも、公共部門がなければあり得なかったことです。私自身もそうです。
トム: そうですね。ジェフリー・ヒントンが人工ニューラルネットワークの研究を始めたのは何十年前ですか?
フェイフェイ: そうですね、CMUにいた頃か、もっと前かもしれません。ImageNetも公共部門から生まれました。これから3〜5年で見られる科学的発見の多くは公共部門から出てくるでしょう。
そして、公共部門や学術界から生まれる最高のものは何か知ってます? 学生たちです。人材です。だから公共部門への投資が必要なんです。
トム: そうですね。さて、ここにはとても賢い聴衆がいるので、きっと素晴らしい質問がたくさん出てると思います。
ここに一つあります。「あなたの新しい会社では、リアルタイムの位置特定をサポートするために、世界の空間マップを作るのに十分なデータをどうやって集めるんですか?」
この質問の前提について触れてもいいですし、明らかにデータがなければ空間知能の進歩はできないので、そのあたりについて話してもらえますか?
フェイフェイ: そうですね。データについては公には議論していません。まだ詳細を発表する準備ができていないからです。準備ができたら発表します。
この人が既に私たちが何を作っているか知っているみたいで少し面白いですね。それは彼らの解釈ですが、コメントは控えさせてもらいます。
でも、おっしゃる通り、AIはデータ駆動型です。それは重要です。うちの会社の空間知能は確かにピクセルベースです。だから、多くのピクセルデータがこの技術を動かすことになります。
トム: そうですね。エイミーからの素晴らしい質問があります。あなたが取り組んだAI for Allプロジェクトに関連してますね。
「私は12歳の中学生です。もっと多くの女の子がAIを学び、AI時代に備えるよう奨励するには、どうしたらいいでしょうか?」
フェイフェイ: いい質問ですね。12歳の子供たち全員に、女の子も男の子も、田舎に住んでいても、シリコンバレーに住んでいても、AIを受け入れるよう奨励すべきだと思います。好きなら、どんどん取り組んでください。
エイミーに、そして12歳の頃の自分に言いたいのは...私が12歳の頃はまだAIはありませんでした。少なくとも、AIがあることを知りませんでした。数学が大好きで、物理学が大好きでした。
今、私が両親や先生たちに感謝していること、そして、エイミーや他の学生たちに言いたいことは、自分の情熱に従いなさい、ということです。好奇心に従いなさい。そして、粘り強くありなさい。
否定的な声があっても、それは無視しなさい。両親、先生、友達、ロールモデルなど、たくさんの人があなたを支援してくれます。ただ続けていけばいいんです。頑張り続けてください。
トム: 空間知能で解決すべき最も重要な人間の問題は何でしょうか? 朝食作り以外で。
フェイフェイ: お昼ご飯作り? 冗談です。空間知能は本当に多くのことを可能にします。創造からデザインまで。
例えば、家具の配置を想像できるアプリが欲しいと思ったことはありませんか? ロボット工学、AR、VR、そして特定の分野、教育、学習、医療、工場での製造など、様々な分野に影響を与える可能性があります。
本当に広範囲に適用できる横断的な技術で、これらの全ての分野に影響を与える可能性があります。
トム: 小型モデルとARグラスの組み合わせについての質問がありますが、これについて考えたことはありますか?
フェイフェイ: 新しいメディアにはとてもワクワクしています。まだ初期段階ですよね。シリコンバレーにいるので、きっと多くの人がVision Proを買うために夜更かししたと思います。
実は、Appleが「空間コンピューティング」と呼んだことにすごく興奮しました。その時、私はもう何年も空間知能のことを考えていたからです。空間コンピューティングには空間知能が必要だと思ったんです。
グラスやヘッドセットのようなフォームファクターにはとてもワクワクしています。エッジコンピューティングや小型モデルもとてもエキサイティングです。
ただ、小型モデルはグラスやヘッドセットだけでなく、エッジコンピューティング、スマートデバイス、ロボット、特に家庭用ロボットにも非常に強力です。トランクにサーバーを積んで走り回るわけにはいきませんからね。
小型モデルには多くの用途があります。
トム: そうですね。マルチモーダルモデルとスマートグラスが労働力開発で果たせる役割にとても興味があります。
例えば、電気技師が足りないですよね。イヤホン、AI、スマートグラスを組み合わせて、見習い制度の一環として、必要な時に必要なだけのトレーニングを提供できるかもしれません。
英語以外の言語が十分に代表されていないという事実に対して、研究コミュニティや企業は何ができるでしょうか?
フェイフェイ: いい質問ですね。これはデータのバイアスの問題にも関係します。
まず、AIへの公共投資について話しましたが、全ての国がAIに公共投資をするべきだと思います。それ自体が、その国の文化や言語に関連しています。
個々の研究者が注意を払うことも重要ですが、政府や大きな組織が大規模なリソースを投入して注意を払うことも重要です。
確かに英語が支配的になっていて、それを認識する必要があります。これは公共投資の重要性に戻ってきます。この国でも、きっと素晴らしい研究者や学生たちが他の言語について考えていると思います。でも今のところ、データセットが不足しています。計算リソースも不足しています。それを修正する必要があります。
トム: 聴衆から哲学的な質問もいくつか来ています。スタンフォードで人文科学や社会科学の人々とどのように関わってきたか、そして彼らがコンピューターサイエンティストであるあなたにとって興味深い洞察を提供した例を教えてください。
フェイフェイ: 実は、この5年間で研究所を設立し運営してきた中で、これが一番楽しい部分でした。キャンパス全体に手を伸ばすことです。
スタンフォードには、法学部、ビジネススクール、医学部、新しくできたサステナビリティスクール、人文・自然科学部、工学部など、8つくらいの学部があります。
キャンパス全体の同僚や学生、研究者、学者たちと話をすることは、とても楽しく啓発的です。
何を学んだか? 例えば、学生たちや人文科学の同僚たちと話すことで、人間の表現と創造性についての理解が深まりました。AIと深く創造的な人々との関係をどう考えるべきか、理解が深まりました。
特に、ChatGPTやSoraが登場した時、ハリウッドの脚本家ストライキから、声優の懸念、個人の著作権の問題、そしてこのツールを先進的に取り入れているアーティストまで、本当に複雑です。
正式な教育を受けてなかったので、これらのことを理解するのは難しかったんですが、彼らが教えてくれました。
一つ学んだことは、おそらくこの聴衆はとても技術的な人が多いと思いますが、技術者が人文科学者や社会科学者の話を聞き、彼らに手を差し伸べることはとても重要だということです。
自分の職場環境でも、法務かもしれないし、製品開発かもしれないし、マーケティングかもしれません。いろんな機能があると思います。技術は真空の中に存在するわけではありません。技術を善良で有益なものにするには、複雑な人間の努力が必要なんです。
そういう謙虚さと敬意を持って接し、相手の尊厳を認めることが、これらの架け橋を築く最も基本的なことだと思います。
トム: 説明可能AIや解釈可能AIなどの分野で進歩することは、どれくらい重要だと思いますか?
フェイフェイ: いい質問ですね。全体的に見れば、重要だと思います。でも、ここでもニュアンスが必要です。
例えば、説明可能性にもいろんなレベルがあります。例えば、タイレノールが熱や頭痛に効くことは誰でも知っています。でも、タイレノールの分子レベルでの作用経路を説明してください、と言われたら? 実際、今日でも科学者でさえ全ての詳細を知りません。
でも、タイレノールが説明不可能な薬だとは誰も言いません。なぜなら、薬の開発、規制措置、承認プロセスなど、十分な説明があって、あなたや一般の人々を納得させ、信頼させる全体的なシステムがあるからです。
これが説明可能性の一つの形です。
もう一つの形は、例えばトムがラファイエットからここまで車で来たとしましょう。Google マップを使えば、選択肢が表示されます。この経路なら有料だけど4分速い、この経路は景色がいい、とか。ラファイエットからマウンテンビューまで景色のいい経路があるかどうかは知りませんが。
正直、これはAからBへの経路を見つけるアルゴリズムを説明しているわけではありません。でも、人間のユーザーとしては、選択肢について十分な説明があると感じるわけです。
医療の例に戻ると、医者でない限り、ほとんどの人は治療法を理解していません。それでも、医者は人間の言葉を使って、その治療法が何なのかを説明してくれます。
この例を使って時間をかけて説明したのは、ケースバイケース、使用例を考えることが重要だということを共有したかったからです。説明可能性の定義を考えることも重要です。その特定の定義、特定の使用例が本当にマッチしている必要があります。
時には、分子レベルのメカニズム的な説明可能性は必要ありません。時には異なる説明可能性が必要です。
質問に答えると、説明可能性は重要です。でも、使用例によって異なります。様々な方法で重要なんです。
トム: 会場には、World Labsのビジネスプランについてもっと詳しく知りたい人がたくさんいますが、その質問はスキップしましょう。
あなたは AI だけでなく神経科学も研究したと言いましたね。AI が神経科学から学べることは何か、という質問がありました。
畳み込みニューラルネットワークは、人間の視覚システムの仕組みからゆるく着想を得ていますよね。ドーパミン報酬回路を研究して、強化学習のヒントを得た人もいます。
神経科学とAIの間で、他に潜在的な協力の余地がある分野はありますか? 明らかに自然は低消費電力のコンピューティングについて何かを理解しています。私たちの脳は20ワットしか使わないわけですから。
フェイフェイ: そうそう、この部屋のどの電球よりも暗いですよね。
スタンフォードHAIを設立した時、3つの主要な研究の柱の一つが神経科学です。神経科学とAIの学際的な共同研究です。
私にとって、これはAI分野の進歩にとっても、両分野の将来の進歩にとっても基礎的なものです。スーリヤ・ガングリー、マイク・フランク、ノア・グッドマンなど、多くの同僚たちと一緒に仕事ができて本当に幸運です。スタンフォードの多くの同僚がこの学際的研究の最前線にいます。
例えば、幼児の発達について。幼い子供たちは好奇心に駆動された学習をたくさんします。これをAIシステムにどう翻訳するか? これは一つのインスピレーションです。
また、バックプロパゲーションは脳内の二つのニューロン間で起こっていることの非常に単純化された翻訳に過ぎないことも知っています。シナプス接続に加えて、樹状突起接続もあり、それらは深く電気的、化学的で、とても微妙なものです。
今日の機械学習アルゴリズムは、これらの複雑な新しい面白いシナプスやニューロン間のコミュニケーションチャンネルを全く取り入れていません。
逆も同じく真です。動物モデルや細胞モデルを使っている神経科学者の同僚たちは、膨大な量のデータを収集しています。機械学習やAIを使うことは、彼らが科学的発見をするのを助ける魅力的な方法です。
最後に、私のラボでも心理学者と協力して、非侵襲的な方法を使っています。彼らは非侵襲的な方法で人間の脳波を使ってロボットを動かすことができるんです。これは完全に非侵襲的な方法です。
つまり、これら二つの分野には多くの相互作用があり、私にとっては最もエキサイティングな学際的研究分野の一つです。
トム: そうですね。フェイフェイ、質問は22時までかかりそうなくらいたくさんありますが、素晴らしいインタビューをありがとうございました。みなさん、フェイフェイに拍手をお願いします。そして、「The World I See」を忘れずに。
ダン: そうですね。お二人とも本当にありがとうございました。個人的に多くの学びがありました。特に公的支援の重要性は本当に基本的なことだと思います。トム、あなたも政府でそういったことに関わってきましたよね。この段階で公的支援がないと、社会への影響が大きいだけに、我々は損失を被ることになると思います。
ところで、ダートマス会議の4人目の人物を探していましたが、ナサニエル・ロチェスターでしたね。当時IBMで働いていました。
最近展示を見ていない方に言っておきたいのですが、1階にホレリス機があります。これはハーマン・ホレリスが、アメリカ政府が抱えていた問題を解決するために作った機械なんです。1890年代の国勢調査を集計する問題でした。
当時の加算技術では、人口増加のため、期限内に国勢調査を集計することができなくなっていたんです。公的な呼びかけと民間の取り組みが組み合わさって、パンチカードを使った機械が生まれました。このパンチカードは、産業革命時代のジャカード織機で、織物や壁掬の柄を記録するために設計・製作されたものがベースになっています。
DARPAの資金提供にしろ何にしろ、社会からの要請が必要なんです。今でなければ、いつそれが必要になるのかわかりません。舞台で素晴らしい考えを示してくれてありがとうございます。
もう一度お二人に感謝の拍手をお願いします。そして、まだ帰らないでくださいね。ありがとうございました。

この記事が気に入ったらサポートをしてみませんか？