マガジンのカバー画像

AIニュース

559
AIに関する英語解説と日本語訳で、英語とAIの世界が広がります。
運営しているクリエイター

2024年7月の記事一覧

【人間を超えた?NVIDIAの最新AI、驚異の身体能力を獲得】英語解説を日本語で読む【2024年7月27日|@Two Minute Papers】

【人間を超えた?NVIDIAの最新AI、驚異の身体能力を獲得】英語解説を日本語で読む【2024年7月27日|@Two Minute Papers】

現在のテキストから画像生成AIシステムには、キャラクターの一貫性という根本的な問題がありますが、NVIDIAの新しい論文はこの課題に対する解決策を提示しています。この技術により、同一人物を異なる状況で生成することが可能になり、さらにControlNetを使用することで、スティックフィギュアから詳細な人物像を生成することもできます。これにより、一貫したキャラクターを維持しながら完全なストーリーを作成

もっとみる
【マット・ウルフのAIニュース:】英語解説を日本語で読む【2024年7月27日|@Matt Wolfe】

【マット・ウルフのAIニュース:】英語解説を日本語で読む【2024年7月27日|@Matt Wolfe】

AIの世界で過去最大規模の進歩が見られた1週間について報告します。まず、MetaがLlama 3.1を発表し、8B、70B、405Bパラメーターの3つのモデルを公開しました。これらは多くのベンチマークでGPT-4oやClaude 3.5 Sonnetを上回る性能を示し、オープンソースモデルとしては画期的な成果です。Mistral AIもMistral Large 2を発表し、特にコード生成において

もっとみる
【マット・ウルフのAIニュース:ハリウッド級AIビデオの公開!】英語解説を日本語で読む【2024年7月13日|@Matt Wolfe】

【マット・ウルフのAIニュース:ハリウッド級AIビデオの公開!】英語解説を日本語で読む【2024年7月13日|@Matt Wolfe】

AIの世界では夏に一時的な停滞が見られたものの、注目すべき新技術が続々と登場しています。まずは「Odyssey」という新しいAIビデオツールに注目します。これはハリウッド級の視覚効果を提供することを目指しており、ドローンショットや島々の映像などを生成できると主張しています。次に紹介するのは「Live Portrait」というツールです。これはドライビングビデオと画像をアップロードし、画像をビデオの

もっとみる
【OpenAI、新たなAI分類システムを発表】英語解説を日本語で読む【2024年7月12日|@Wes Roth】

【OpenAI、新たなAI分類システムを発表】英語解説を日本語で読む【2024年7月12日|@Wes Roth】

OpenAIは人間レベルのAIに向けた進捗を追跡するシステムを開発しました。同社は、人工汎用知能(AGI)への道のりで5段階中の第二段階に差し掛かっていると考えています。この新しい分類システムは、社員に対して全社ミーティングで共有され、従来のシステムに比べてより詳細な進捗を追跡できるものです。具体的には、OpenAIは現在、第一段階のチャットボットレベルに位置しており、まもなく第二段階である「推論

もっとみる
【マシュー・バーマンのAIニュース:イーロンの巨大GPUファーム、AppleとMicrosoftのOpenAI離脱】英語解説を日本語で読む【2024年7月13日|@Matthew Berman】

【マシュー・バーマンのAIニュース:イーロンの巨大GPUファーム、AppleとMicrosoftのOpenAI離脱】英語解説を日本語で読む【2024年7月13日|@Matthew Berman】

AIに関する大量のニュースをお届けします。Apple、Tesla、イーロン・マスク、任天堂までもがアップデートを発表しています。まず、AppleとMicrosoftはOpenAIの理事会を離れることにしました。規制当局がビッグテックのAIに対する影響力を懸念しているためです。次に、Anthropic社のClaudeが新機能を発表しました。Claude 3 Haikuのファインチューニングが可能とな

もっとみる
【Moshi:リアルタイム会話を実現する音声AI】英語解説を日本語で読む【2024年7月4日|@TheAIGRID】

【Moshi:リアルタイム会話を実現する音声AI】英語解説を日本語で読む【2024年7月4日|@TheAIGRID】

Kyutaiという企業が発表した音声AI「Moshi」は、リアルタイムでの会話能力と応答の質が最先端レベルであり、AI業界全体に衝撃を与えました。Moshiは70以上の感情や話し方のスタイルを表現でき、ささやき声、歌声、海賊の口調、フランス語なまりの英語など多様な音声表現が可能です。従来の音声AIの限界を克服するために、Kyutaiは「オーディオ言語モデル」を開発し、複雑なパイプラインを単一のディ

もっとみる
【無料で使える!Claude 3.5 Sonnetの驚異の21活用事例】英語解説を日本語で読む【2024年7月5日|@The AI Advantage】

【無料で使える!Claude 3.5 Sonnetの驚異の21活用事例】英語解説を日本語で読む【2024年7月5日|@The AI Advantage】

Claude 3.5 Sonnetは無料で利用でき、多くのカテゴリーでChatGPT-4oを上回ります。特に、コード生成では比類なく、コードを生成するだけでなく、その動作をリアルタイムで確認できる点が画期的です。例えば、データ可視化のエキスパートとして病気の拡散を国別にリアルタイムで表示するダッシュボードを作成するプロンプトがあります。リアルタイムでデータを更新するAPIにも接続可能です。また、エ

もっとみる
【マット・ウルフのAIニュース:Gen-3公開/ElevenLabsの新機能/Metaの研究発表】英語解説を日本語で読む【2024年7月6日|@Matt Wolfe】

【マット・ウルフのAIニュース:Gen-3公開/ElevenLabsの新機能/Metaの研究発表】英語解説を日本語で読む【2024年7月6日|@Matt Wolfe】

今週のAIニュースとして、まずRunwayのGen-3が一般公開されました。ElevenLabsも今週いくつかのアップデートを行い、有名な声を追加しました。音楽制作アプリSunoもリリースされましたが、現在はiOSのみで利用可能です。Metaは、テキストから3D画像を生成する新しい研究を発表しました。Hugging Faceでは、新しいオープンソースの大規模言語モデルIntern LLM 2.5が

もっとみる