AIもろもろ

高品質な動画アップスケーリング STARを試す

南京大学のRui Xie氏ほかによる、動画アップスケーリングをおこなう事前学習済みモデルが推論コードが公開されていました。以下リンク先に変換結果のサンプルなどが掲載されていますが、かなり高品質な結果が得られるようです。オンラインデモも公開されているのですが、せっかくなのでローカルPCでも変換ができるか試してみました。ローカルPCでの実行実行環境 Windows11 WSL2/ubuntu24.04LTS RTX3090(24GB) 実行手順基本的に公式リポジト

古い白黒写真をリアルにカラー化🎨DDColorを試す

学習可能なカラートークン(つまり、カラークエリ) を最適化することで、グレースケール画像をリアルなカラー画像をエンドツーエンドで変換する、「DDColor」というモデルが公表されていたので試してみました。モデル概要まず始めに、画像から重要な情報を抜き出すための「Backbone network」を使い特徴抽出を行います。次に、この情報を「Pixcel Decoder」に送り、画像の空間構造を復元します。同時に、「Color Decoder」は画像のさまざまな大きさ

東大×生成AIシンポジウム第１部「生成AIが切り拓く未来」

先日2023年7月4日に開催された、東大×生成AIシンポジウム第１部のパネルディスカッション「生成AIが切り拓く未来と日本の展望」が面白かったので、個人的に興味をひいた論点を抜き出して要約してみました。１時間弱ですが、とても興味深い議論もありましたので、お時間があるかたはぜひリンク先をご確認ください。 https://www.t.u-tokyo.ac.jp/ev2023-07-04 テーマ１: 生成AIで世界はどう変わるのか水晶玉に未来を聞くかようなAGIの世界が1

suno-ai: Bark🐶で音声合成して遊ぶ

Barkに色々テキストを入れて、音声合成で遊んでみました。今はまだ荒削りですが、画像生成のときのように、恐らく、どんどん性能があがっていくでしょう。楽しみです。いま公開されてるデモはVRAM6GBくらいの消費なので、生成に30～40秒くらい必要なのを目をつぶれば、Google Colabでも自宅のPCでも気軽に楽しめるのでオススメかも。たのしいオモチャです。微妙な空気？ text_prompt = """ woman: このプレゼント、誰からもらったの？

画像認識AI YOLOの改良版「YOLO-NAS」登場

YOLOの改良モデル YOLO-NASが公開されていたので、ひとまず静止画の推論をGoogleColabで試食してみました。最近LLMの開発のニュースばかり見ていましたが、画像認識AIも着々と性能向上しているようです。なお、カスタムデータセットのファインチューニングはColab無料枠のメモリ容量では動作しないようなので、また機会があれば試してみようと思います。 https://colab.research.google.com/drive/1q0RmeVRzLwRXW-h

フォローしませんか？

#AI

高品質な動画アップスケーリング STARを試す

古い白黒写真をリアルにカラー化🎨DDColorを試す

東大×生成AIシンポジウム第１部「生成AIが切り拓く未来」

suno-ai: Bark🐶で音声合成して遊ぶ

画像認識AI YOLOの改良版「YOLO-NAS」登場

AIもろもろ

フォローしませんか？

#AI

高品質な動画アップスケーリング STARを試す

古い白黒写真をリアルにカラー化🎨DDColorを試す

東大×生成AIシンポジウム 第１部「生成AIが切り拓く未来」

suno-ai: Bark🐶で音声合成して遊ぶ

画像認識AI YOLOの改良版「YOLO-NAS」登場

東大×生成AIシンポジウム第１部「生成AIが切り拓く未来」