- 運営しているクリエイター
記事一覧
OpenAIの変換動画ツール「Sora」の大規模導入で、216億ドル相当、720,000個のNVIDIA H100 GPUが必要となる
Factorial Fundsの記事より、
OpenAIが開発した革新的なテキスト変換動画ツール「Sora」は、動画生成の品質と機能面で大きな飛躍を遂げました。しかしその一方で、膨大なGPUリソースを必要とすることも明らかになりました。
Soraが生成する動画は、細部描写や時間的な整合性においてこれまでとは一線を画すクオリティを実現しています。例えば、一時的に隠れた物体の存在を認識し、正確に再現
[速報]Runway Gen-2のリップシンク機能でラフなMVを作ってみる - Blog 2024/03/21
Runway Gen-2に実装されたリップシンク機能が利用可能になりましたので、早速試してみました。
先ほど、利用可能になったので、まだ数回しか実行していませんが、なかなか良いです。10秒を超えるビデオを生成しても一貫性を保ち、動画も破綻しません。
Lip Sync - Runway Gen-2
ラフなMV制作使用する画像は、Midjourney V6 (alpha) で生成。
楽曲は先週、
今話題のClaude 3を無料と有料で試してみる🤖創作や取り扱い説明書で実用的に比較する
大規模言語モデルといえば、やはりOpenAIのChatGPTが有名ですが、最近「Claude 3」が注目を集めています。あるベンチマーク測定では、GPT-4を上回る精度とのことで、大規模言語モデル戦国時代の到来を予感させます。
この記事では、「Claude 3」を提供する企業について簡単に触れるとともに、登録して使えるようになるまでの手順、有料登録のメリット、そして性能について説明します。具体的
Claude 3 Opusに課金した理由とChatGPT(GPT-4)との比較
こんにちは、Martinです。皆さんは、最近GPT-4を超えた?で話題のClaude 3 Opusをご存知ですか?私は先日、このAIアシスタントに課金してみました。今回は、その理由と実際に使ってみた印象について簡単にレポします。
※追記(2024/04/03): きちんと評価していませんが、残念ながらユーザーが増えてきて性能がかなり悪化した感覚があります。これはChatGPTでも同じでした。その
プロンプトエンジニアリングの進化の系譜
はじめに
プロンプトとはAIとの対話においてAIに入力する指示や質問のことです。2022年に画像生成AIのStable Diffusionが登場したとき、AIが生成する画像の質が入力によって大きく変わることから注目されました。
2022年11月末にChatGPTが登場したときにも、同じように生成する出力の質が影響することがわかりました。
このため、より出力の質を上げるためのプロンプトの技術をプロ
GPTストアに評価機能が実装!FBやランキング機能も!GPTs界隈がざわつく!
GPTsクリエイターのAIMUです。
本日OpenAIの公式X(元Twitter)で以下の発表がありました。
GPT を評価し、ビルダーに直接プライベート フィードバックを提供できるようになりました。
GPT の「概要」セクションに以下を含めることができるようになりました。
∙ ビルダーのソーシャルプロフィール
∙ 評価
∙ カテゴリ
∙ 会話の数
∙ 会話のきっかけ
∙ ビルダーによるその
AI生成で30万枚作ってわかったこと
2022年の8月ころから生成AIとの付き合いを開始して、最初はMIDJOURNEY(初期バージョン)から始まり、NAIに移行し、MIDJORNEYのバージョンが上がって、NIJI-JOURNEYを少し触ったあたりで、RTX4090を買ってStable-Diffusionのローカル環境に場所を移しました。
2022年8月から2023年2月まで、だいたい一年と200日(約565日)
生成枚数は32万