見出し画像

アップル WWDC 2024は「絶対的な」ものになるMIT、30倍高速な画像生成AIツールを発表


この記事は以下の方に特におすすめです

  • ✅ AI技術の最新動向に興味がある方

  • ✅ Appleの製品やサービスのアップデートに注目している方

  • ✅ 高速で高品質な画像生成ツールに関心がある開発者やデザイナー

  • ✅ MicrosoftとGoogleのAI戦略について理解を深めたい方

要約

AppleのWWDC 2024がAIに焦点を当てて開催。MITは従来の30倍速い画像生成AIツールを発表。MicrosoftはAIの新リーダーを任命し組織再編。これらの動きがAI技術とその応用領域の将来にどう影響を及ぼすかを解説。

サイード・エザティ
2024年3月27日翻訳記事

AI検索エンジンが本当にグーグルを殺すことができない理由がここにある。

友人: 一回の充電で24時間以上使えるオープンソースのAIウェアラブル

このビデオについてどう思いますか?AIかAIでないか?

AIを搭載した11の新しいツールとリソース。ツールの全リストはオンライン版をご確認ください。


アップル WWDC 2024、6月10日~14日に開催、「A(bsolutely) I(ncredible)」になることを約束

アップルは、世界開発者会議(WWDC)を6月10日から14日まで開催すると発表した。このイベントでは、iOSとiPadOS 18、macOS 15、watchOS 11など、アップルのエコシステム全体のメジャーアップデートが披露される見込みだ。また、Apple Siliconの進化や、おそらく新しいMacも紹介されるだろう。このカンファレンスでは、特にアップルのAIへの意欲にスポットが当てられ、重要なイノベーションが発表される予定で、特にマイクロソフトやグーグルといった競合他社のジェネレーティブAIの進歩に匹敵するアップルの取り組みを考慮すると、AIが中心的なテーマになると予想される。

Vision Proの発表から1年を迎える今年のWWDCでは、ヘッドセットとそのOSであるvisionOSに興味を持つ開発者がかなり集まると予想されている。噂によると、iOS 18はプラットフォーム史上最も大幅なアップデートのひとつとなる可能性があり、日常生活管理の強化を目的としたAIツールが組み込まれる。この動きは、サムスンがGalaxy S24シリーズでAIを重視し、グーグルのGeminiプロジェクトを活用しているように、業界のトレンドを反映している。

このカンファレンスでは、初日にアップルパークで対面イベントも開催され、ニュース満載の基調講演の伝統が受け継がれる。クパチーノのイベントには50人の「勝者」から選ばれたグループが招待され、パンデミック以前の時代から縮小されたアプローチが維持される。WWDCの発表は、iPhoneに関連する独占的慣行を主張する司法省のアップルに対する訴訟の直後に行われ、同社の今後の展開に一層の陰謀を加えている。

MIT、高解像度画像を30倍速く生成するAIツールを発表

MIT CSAILの研究者たちは、Stable DiffusionやDALLE-3のような既存のモデルの品質を維持、あるいはそれ以上に維持しながら、画像作成プロセスを劇的に加速させる画期的なワンステップAI画像ジェネレーターを開発した。DMD(ディストリビューション・マッチング・ディスティレーション)と名付けられたこの手法は、従来多段階であった拡散プロセスを単一段階に簡略化し、より複雑なシステムの機能を模倣する教師-生徒モデルを活用している。この技術革新により、高品質な画像を迅速に生成することが可能になり、AIが生成する芸術の分野における効率性と有効性の大幅な飛躍が実現しました。

DMDフレームワークは、安定した空間マッピングのための回帰損失と、生成された画像の頻度を実世界の出現頻度と一致させるための分布マッチング損失を組み込んだ、二成分戦略を利用している。このアプローチは、2つのガイド拡散モデルからの洞察に支えられ、ワンステップの生成プロセスを容易にし、必要な時間と計算資源を削減する。DMDは、その速度にもかかわらず、様々なベンチマークで印象的な性能を示し、フレシェのインセプション距離スコアで示されるように、画質と多様性の点で従来のモデルとほぼ同等を達成した。

AI画像生成におけるこの進歩は、デザイン、創薬、3Dモデリングなど、迅速なコンテンツ作成を必要とするアプリケーションに新たな可能性をもたらす。今後開催されるカンファレンスで発表される予定のMITチームの研究は、計算コストの削減、高品質な画像生成のアクセシビリティとスピードの向上に向けた大きな前進であり、クリエイティブおよび産業領域におけるAIの統合における新時代の到来を告げるものである。

スレイマンがAIリーダーに指名された後、マイクロソフトのBingチーフはその役職を退く

マイクロソフトのミハイル・パラヒンが、消費者向け人工知能の取り組みを指揮するムスタファ・スレイマンを任命した後、ビングと広告の責任者から退くことになった。これまで広告、ウェブサービス、ウィンドウズの一部を統括していたパラキンは、マイクロソフト社内で新たな機会を模索しながら、ケビン・スコット最高技術責任者(CTO)に報告することになる。パヴァン・ダヴルリはウィンドウズとSurfaceのハードウェア事業を担当する。

この組織変更は、マイクロソフトのサティア・ナデラ最高経営責任者(CEO)が、ディープマインドの共同創業者であるスレイマンの下でAIイニシアチブを統一するという決定を下したことに続くものだ。この動きは戦略的な転換を示しており、マイクロソフトが高度なAI機能で検索やオフィスツールなどの提供を強化することを目指していることから、AIの進展を加速させたいというナデラCEOの意向が反映されている可能性がある。

BingやOfficeを含む様々な製品にAIを統合しているにもかかわらず、マイクロソフトは検索市場におけるグーグルの優位性に大きく挑戦していない。今回の再編は、急速に進化するAIの展望におけるマイクロソフトの地位を強化するためのナデラ氏の広範な戦略の一環であり、この重要な分野におけるイノベーションと競争力へのコミットメントを示すものと見られている。

グーグルがGPT-3に失敗した理由+マルチモーダル・エージェントがAGIへの道である理由

AI分野の著名人であるDavid Luan氏は、OpenAIでの在職期間と、人間と同じようにコンピュータ上でタスクを実行できるエージェントの作成に特化したAI企業であるAdept社でのリーダーシップから得た知見と経験を披露した。ルアン氏は、エージェントに焦点を当てることの重要性と、アデプト社が純粋な基礎モデルの開発よりも信頼性と実用的な応用を優先することで他社との差別化を図っていることを強調した。また、AI開発を顧客のニーズに合わせることの重要性を強調し、ユーザーからの直接的なフィードバックがAGIへの道を加速させることを示唆した。

対談の中でルアン氏は、AI業界、特にエージェントの領域における競争状況についても触れた。同氏は、この分野は広大であり、さまざまな企業が貢献し成功する余地は十分にあると強調した。ルアン氏は、顧客からのフィードバックと最先端のAI研究を組み合わせたアデプト社独自のアプローチは、AGIに向けた競争においてアデプト社を有利に位置づけていると主張した。また、AIとのインタラクションが進化していることを指摘し、エージェントが主要なインターフェースとなり、ユーザーのソフトウェアへの関わり方が変化すると予測した。

最後にルアン氏は、より広範なAIエコシステムについての見解を述べ、AIの急速な産業化に適応するようコミュニティに促した。彼は、研究に重点を置いた取り組みから、現実世界の課題に直接取り組むアプリケーションへの移行を強調し、AI能力の向上におけるコンピューティングとデータの極めて重要な役割を強調した。ルアンの洞察は、AIの状況に対する深い理解を反映しており、AIの開発を実用的なアプリケーションとユーザーのニーズに合わせることの重要性を強調している。

この記事が気に入ったらサポートをしてみませんか?