《Chrome、Geminiを搭載したAIライティングツールで進化》Googleは、人物の画像を生成するAIツールGeminiの機能を一時停止【Stable Diffusion 3】

2024年2月26日 15:03

この記事は、下記の方に特にお勧めです

AI技術の最新動向に興味がある方
Redditやその他のSNSの未来に関心がある方
AIによるコンテンツ生成に関わる法的・倫理的課題について学びたい方
ディープフェイクやAIライティングツールの教育への応用に興味がある方
データプライバシーとAIの責任ある使用に関心がある方

要約

OpenAIのサム・アルトマンがRedditの大株主に。ChromeはGeminiを搭載したAIライティングツールを導入。Gen-Zは微積分学習にディープフェイクを活用し、Googleは歴史的不正確さを理由にGeminiの機能を一時停止。Stable Diffusion 3がAIイメージリー市場に新たな挑戦を投じる。AIの最前線を追いたい方必見。

また、本日のニュースには以下のような内容が含まれています：

OpenAIのサム・アルトマンがRedditの最大株主の一人であることが明らかにされました。
ChromeにGeminiを動力源とする組み込みAIライティングツールが追加されました。
Gen-Zが相互に微積分を教えるためにディープフェイクを使用し始めています。
10個の新しいAIパワードツールとリソースが紹介されています。完全なツールリストについては、オンライン版を確認してください。

2024年2月22日、Saeed Ezzati翻訳記事

Redditの株式市場への上場への道のりは、OpenAIなどのAIベンダーとの戦略的な関係を強調しています。IPOの目論見書で、Redditは$203百万の価値があるデータライセンス契約に入ったことを明らかにし、2024年には少なくとも$66.4百万の収入を見込んでいます。これらのパートナーシップは、Googleと噂される名前のない大きなAI企業を含む可能性があり、Redditの広大なデータの価値を強調しています。このデータには、10億以上の投稿と160億以上のコメントが含まれ、AIモデルの訓練に不可欠です。Redditがデータの収益化に転じるのは、AIベンダーが多様なデータセットに合法的にアクセスする方法を求める中で、無制限のスクレイピング慣行からの脱却を図っています。

Redditのデータは、スポーツから最新のトレンドまで、幅広いリアルタイムの議論を含んでおり、チャットボットやコンテンツ生成ツールなどのアプリケーションを動かす大規模言語モデル（LLM）の訓練に不可欠です。このデータライセンシングへのシフトは、AI企業がモデルの訓練に彼らのコンテンツを使用するため、コンテンツクリエーターが補償を求めるという広範なトレンドを反映しています。これらの発展は、AIにおけるデータの使用の倫理的および法的な側面についてのより大きな議論の一部であり、OpenAIのような企業が法的に入手したデータでモデルを訓練することを確保するために、さまざまなコンテンツプロバイダーとの契約を締結しています。

IPO提出書類はまた、Redditの財務状況と所有構造に関する興味深い洞察を明らかにし、OpenAIのCEOであるSam Altmanが8.7%の持分を持ち、第三位の大株主であることを示しています。Redditがその目論見書でAIに重点を置き、データライセンシングからの重要な収益予測を含むことは、独自のデータセットを活用してAIの進歩を促進するという同社の戦略的焦点を示しています。この動きは、高品質な訓練データの需要の高まりを活用するだけでなく、倫理的なデータ使用とより洗練されたAIモデルの作成に向けた業界全体のトレンドにも沿っています。

Googleは、歴史的な不正確さの後で、人々の画像を生成する能力を持つAIツールGeminiを一時停止しました。

Googleは、進化した生成AIモデルであるGeminiが人物の画像を作成する機能を一時的に停止しました。この決定は、異なる人種の背景を持つ個人として米国の建国の父を描いたような、歴史的に不正確な画像を生成したツールへの反応です。これは、ソーシャルメディア上で批判と嘲笑を引き起こしました。同社は、人間の描写の正確性を高めるために技術を更新し、近いうちに改善されたバージョンを再リリースする予定です。

Geminiの出力を巡る論争は、文化的および歴史的に敏感なコンテンツを生成する際に、生成AI技術が直面する課題を浮き彫りにしています。このツールが多様な人間の画像を生成する能力を持っているにもかかわらず、それが一般的に包括性に対して肯定的に見られているにもかかわらず、歴史上の人物の誤表現が反発を招きました。Googleはこれらの問題を認識しており、より尊重され、正確な描写を保証するために不正確さに対処することに取り組んでいます。

この事件は、AIコミュニティ内でのバイアスやAI生成コンテンツの倫理的意味合いに関するより広範な懸念を反映しています。2015年にGoogleのAIが黒人男性を誤って分類したという以前の事件などは、多様性、平等、包括性に敏感で正確なAI技術を開発することの重要性を強調しています。AIツールが私たちの日常生活にさらに統合されるにつれて、このようなエラーを防ぐための注意深い監視と継続的な改善の必要性はますます重要になっています。

Stable Diffusion 3は、SoraやGeminiに対するAIイメージリーの早期リードを固めるために登場しました。

Stability AIは、OpenAIやGoogleからの新しい提供と競合するために設計された、最新の画像生成AIモデルであるStable Diffusion 3（SD3）を発表しました。SD3は、進化した「拡散トランスフォーマー」と「フロー・マッチング」と呼ばれる新技術を含む更新されたアーキテクチャを導入し、顕著なオーバーヘッドなしに品質の向上を目指しています。このモデルは多用途で、800万から80億のパラメータにわたり、さまざまなハードウェア構成で動作するよう設計されています。特に、SD3はマルチモーダルな理解とビデオ入力および生成の可能性を強調し、API制限のある競合他社とは一線を画しています。

ツールのアップグレードと使用の障壁を下げることに重点を置くことは、Stability AIが不可欠なホワイトレーベル生成AIプラットフォームになるという野心を示しています。競合他社とは対照的に、Stable Diffusionは広範な適用性とコンテンツ生成に関する最小限の制限を目指しています。重要なのは、悪意のある行為者による悪用を防ぐための積極的な対策を詳述し、専門家やコミュニティとの継続的な協力を通じて発表された安全へのコミットメントです。これらの安全対策は、モデルの開発と展開プロセスの重要な要素です。

Stable Diffusion 3が公開リリースに向けて準備を進める中で、AI生成イメージリー分野の重要なプレイヤーとして位置づけられており、強化された能力とより広範なアクセシビリティを約束しています。技術的進歩や具体的な安全対策の詳細はまだ少ないものの、AI駆動のコンテンツ作成のためのより包括的で安全な環境への期待が高まっています。安全性に焦点を当てたStability AIの取り組みと野心的な技術的進展は、競合他社への挑戦と、生成AIの風景を再定義する可能性を強調しています。

Chromeは、Geminiによって動力を供給された組み込みAIライティングツールを取得します。

Google Chromeは、そのGemini AIモデルを活用して、Gmailからウェブ全体に「助けて書く」機能を拡張する新しいAIライティングジェネレーターを導入しました。このツールはまだ実験段階にあり、Windows、Mac、Linuxプラットフォーム上の英語のウェブページでテキストを生成または書き換えることができます。Chromeの「実験的AI」設定を通じて機能を有効にすることで、ユーザーは任意のテキストフィールドを右クリックすることでアクセスできます。このツールは短文コンテンツ用に主に設計されており、Gemini Advanced加入者に向けた強化機能を提供していません。

AIジェネレーターはコンテキストを認識しており、ウェブサイトの内容に基づいた提案を行うことで、より関連性の高い推薦を提供します。GoogleのエンジニアリングディレクターであるAdriana Porter Feltは、この機能を強調し、レビューをサポートするために重要な製品機能を引き出すなど、コンテンツ作成を強化する能力に注目しました。ユーザーは出力の長さとトーンを調整でき、さまざまなライティングタスクに対するツールの汎用性を高めることができます。

Googleはプライバシーへの考慮を強調し、サービスによって使用されるテキスト、コンテンツ、URLデータは、機能の改善を目的として既存のプライバシーポリシーの下で処理されると述べています。これには、生成モデルの研究と機械学習技術への貢献が含まれ、このAIツールの開発と適用を監督するための人間によるレビュープロセスが設置されており、Googleが責任あるAIの使用とユーザープライバシーへのコミットメントを強調しています。

この記事が気に入ったらサポートをしてみませんか？