マガジンのカバー画像

AIもろもろ

32
運営しているクリエイター

#AI

古い白黒写真をリアルにカラー化🎨DDColorを試す

学習可能なカラー トークン(つまり、カラー クエリ) を最適化することで、グレースケール画像をリアルなカラー画像をエンドツーエンドで変換する、「DDColor」というモデルが公表されていたので試してみました。 モデル概要まず始めに、画像から重要な情報を抜き出すための「Backbone network」を使い特徴抽出を行います。 次に、この情報を「Pixcel Decoder」に送り、画像の空間構造を復元します。同時に、「Color Decoder」は画像のさまざまな大きさ

東大×生成AIシンポジウム 第1部「生成AIが切り拓く未来」

先日2023年7月4日に開催された、東大×生成AIシンポジウム 第1部のパネルディスカッション「生成AIが切り拓く未来と日本の展望」が面白かったので、個人的に興味をひいた論点を抜き出して要約してみました。 1時間弱ですが、とても興味深い議論もありましたので、お時間があるかたはぜひリンク先をご確認ください。 https://www.t.u-tokyo.ac.jp/ev2023-07-04 テーマ1: 生成AIで世界はどう変わるのか水晶玉に未来を聞くかようなAGIの世界が1

suno-ai: Bark🐶で音声合成して遊ぶ

Barkに色々テキストを入れて、音声合成で遊んでみました。今はまだ荒削りですが、画像生成のときのように、恐らく、どんどん性能があがっていくでしょう。楽しみです。 いま公開されてるデモはVRAM6GBくらいの消費なので、生成に30~40秒くらい必要なのを目をつぶれば、Google Colabでも自宅のPCでも気軽に楽しめるのでオススメかも。たのしいオモチャです。 微妙な空気? text_prompt = """ woman: このプレゼント、誰からもらったの?

画像認識AI YOLOの改良版「YOLO-NAS」登場

YOLOの改良モデル YOLO-NASが公開されていたので、ひとまず静止画の推論をGoogleColabで試食してみました。最近LLMの開発のニュースばかり見ていましたが、画像認識AIも着々と性能向上しているようです。 なお、カスタムデータセットのファインチューニングはColab無料枠のメモリ容量では動作しないようなので、また機会があれば試してみようと思います。 https://colab.research.google.com/drive/1q0RmeVRzLwRXW-h