見出し画像

【生成AIニュース】『「Stable Diffusion 3」CivitAIで再公開』『Google「Project Oscar」』『video-style-transfer』他

まいどです。
今日も暑くて蒸発しちゃいそうです。
それでは、蒸発しながら本日の生成AIニュース。

■『Stable Diffusion 3』CivitAIで再度利用可能に


CivitAIにて公開・ダウンロードが一時取り下げされていた「Stable Diffusion 3」ですが、再度利用可能になりました。
それに続いて、SD3の幾つかのモデル等も公開され始めています。
但し、SD3に関しましては、許可を得ない限り商用利用はNGな為、商用利用する場合は許可を得た上で使用してください。

下記動画にて、ComfyuiでのSD3の使い方を説明しています。

■Google『Project Oscar』


Googleは、オープンソースのプロジェクトにおいてメンテナが行っているさまざまな作業を、生成AIなどによる支援で軽減する「Project Oscar」を発表いたしました。
足している情報があれば指摘し、関連する情報があれば補足し、質問に返答するなど、コードを書く以外のさまざまな作業を行ってくれるとの事。

■Whisper Diarization


単語レベルのタイムスタンプと、話者セグメンテーションを、ブラウザ内で多言語音声認識するフレームワークです。
下記URLよりデモを使用する事が出来ます。

■Scenic AR


スマートフォンから、どこにでも 「ARシーン」を作成できるアプリです。画像をアップロードし、場所を指定して、とても手軽にAR動画を作成することが出来ます。

■video-style-transfer


Diffutoon を基にした複製モデルです。
これは、ControlNet ラインアートおよび SD 1.5 上に構築されたトゥーン シェーディング モデルだとの事。
この精度は凄いですね。
又、こちらはオープンソースがありますが、今後アプリ展開もする予定との事。

■Luma『Dream Machine』のアップデート


動画生成AI、『Dream Machine』にて、ループ機能が搭載されました。
エフェクトの作成や、繰り返しの動画を作りたい時に非常に助かります。

■PhotoMaker V2


プロンプトから画像加工ができる、テンセントの『PhotoMaker』。
こちらのV2バージョンがリリースされました。

■DEEP SAMPLER 2


最先端のAIモデルをコンピューター上でローカルに実行し、DAWで想像できるあらゆるサウンドを生成および変更が出来る、サウンド生成AIです。

■Minitron 8B・4B


Nvidiaから2つの新しいベースモデルがリリースされました。
コンパクトな言語モデルだとの事。

■LocalAI 2.19


OpenAI、Elevenlabs、Claudeに代わる無料のオープンソースであり、独自のCPUとGPUでAIモデルをローカルに実行できる多機能ローカルLLMです。
テキスト読み上げ、オーディオトランスクリプション、画像生成などが可能です。

■トランスコスモス、中国で生成AIチャットbot「trans-AI Chat」を提供開始


トランスコスモスは、中国で生成AIチャットbot「trans-AI Chat」の提供を正式に開始しました。本サービスは、大規模言語モデルの開発に基づいており、最先端の人工知能技術を駆使して、デジタル時代の多様な顧客接点におけるブランドサービスの全体的なコスト最適化と効率化を実現すると同時に、企業にスマートなサービス管理と顧客体験の最適化を提供しながら、AIカスタマーサービスに求められる主要サービス要件を効率的に実現する物となります。

■国際STM出版社協会、AIモデルの学習、開発、運用におけるコンテンツの使用に係る許諾に関する声明を発表


STMは、AIモデルのトレーニング、開発、運用におけるSTMメンバーのコンテンツの無許可使用について声明を発表しました。
以下要約です。

『STMは、信頼性の高い研究の推進を支援しており、多くの加盟出版社がAIソリューションを統合しています。
これらの出版社は、情報の正確性と信頼性を保ちながら、他のAI開発者にもライセンスを供与したいと考えています。
しかし、著作権法というガードレールを守ることが重要であり、無許可でコンテンツを使用することは侵害にあたるとしています。
STMは、信頼できるAIシステムの普及を目指しており、今後も新旧のステークホルダー(利害関係者)と協力していくと述べています。』

※STMとは、オランダを本拠地とする「国際学術出版協会(International Association of Scientific, Technical and Medical Publishers)」の略称です。


本日は以上となります。

STMが「無許可でのコンテンツを使用」について言及致しました。
STMのメンバーは研究・出版等をしており、STMメンバーの学術論文等のコンテンツは基本的に有料の物が多くある為、それを無許可で使用する事は、侵害にあたる、と発表する事は頷けます。
生成AIは「学習」と「生成」は二つに分けて考える必要があり、「学習」における機械学習は、基本的に著作物であっても許諾なく使用できる、と言う見方が、凡その世界知見でもありますが、その「学習」に待ったをかけた形となります。
それを受けて世界各国や大手テック企業等がどうするかはまた別の話となりますが、今後の動向は見守っていこうと思います。

暑い日が続きます。
皆さんも、蒸発、熱中症にならないよう、暑さ対策をしっかりと行ってください。
それでは、また。


この記事が気に入ったらサポートをしてみませんか?