マガジンのカバー画像

AIもろもろ

33
運営しているクリエイター

#AIの活かし方

ローカルPCのターミナル上でLLM生成コードを実行できるOpen Interpreterを試す

ChatGPTのコードインタープリター(Advanced Data Analysis)と同様な機能をローカル環境で実行可能な Open Interpreter が公開されていました。ターミナル上で、チャットインターフェイスを介して、LLMがPython、JavaScript、Shellなどのコードを実行できるもののようです。 Google Colabでの実行デモも公開されています。 ローカル環境で試す対話環境の起動はターミナルで以下を入力します。  $ interpre

WizMap: 機械学習の埋め込み(Embeddings) のインタラクティブな可視化ツール

WizMapという機械学習の埋め込み(Embeddings)の可視化ツールが公開されていました。ブラウザで手軽に機械学習で作成したEmbeddings空間をインタラクティブに探索できます。 論文のほか、Githubリポジトリが公開されています。 若干、マニアックなネタですが、情報の意味的な広がりや距離が平面上に可視化されるので、デモを触るだけでも面白いかも。 Webデモ以下URLにアクセスしてwebアプリを試してみてください。 ローカル環境で動かしてしてみます$ gi

ChatGPT にEDM生成のプロンプトを考えてもらう

MusicGenというtext2musicのAIを試しています。EDMフェスでかかる感じの曲のプロンプトを英語でお願いします。 こんどは、変化をつけてダークな感じをお願いします。 テンポが速い感じでお願いします。 っぽくはある感じはするのですが、どうでしょうか。

AI丸投げで300秒の音楽生成(MusicGen)

Meta社が先日公開した音楽生成AIのMusicGenですが、Meta公式リポジトリ版に webuiを追加して生成時間を延ばす改良をくわえたものが公開されていたので、さっそく試してみました。🫡 以下リポジトリのipynbファイルを Google ColabかローカルPCで開くと使えます。 プロンプトもChatGPTで生成して入力しました。 A high-energy 90s EDM anthem at 130 BPM, featuring resonant synthe

縦笛の曲をAIでアレンジ「MusicGen」

1.MusicGenの概要Meta社から音楽生成モデル用モデル「MusicGen」が公表されていました。事前トレーニング済モデルとして提供されているのは、以下4つ🤗。 なお、各モデルの重みファイルはHuggingFaceでも公開されていますが、MusicGenと合わせて公開されているAudiocraftというライブラリーから自動で読み込んで利用できます。 small: 300Mモデル、テキストから音楽への変換のみ - medium: 1.5Bモデル、テキストから音楽への

Koeiromap-freeとlangchainであそぶ

先日、rinna社から音声とフェイスモーションの生成AIサービスKoemotionが発表されていました。悲しいかなフェイスモーションを試すスキルが自分には無いので、Koemotionの音声合成機能Koeiromapの単体と、langchainを組み合わせて遊んでみました。 とにかくkoeiromapを試食!KOEIRO_API_KEYに各自取得したKeyを設定してください。 import requestsimport jsondef koeiro_free(text="こ

アレクサからOpneAI APIを呼び出して、音声でチャットする。

以前アマゾンプライムデーで購入したEcho Show 5と、OpenAI APIを使って簡単なチャットができるスキルを作ってみました。 おそらく、例によって同じようなアレクサスキルは、星の数ほどあると思いますが、アレクサスキル開発の例題にはぴったりだと思いました。 1.作成手順alexa developer console(https://developer.amazon.com/ja/)にサインインして、Alexaスキルを作成を選択。 スキル名:任意 プライマリロケー

今更Stable Diffusion(aurora-v1.0)に腰を抜かす。

こんばんは。お疲れ様です。 わたくし画像生成AIは、いままで食わず嫌いでほとんど手を出していませんでした。ツイッターのタイムラインでnijijourneyとかMidjourneyで生成した超美麗な画像が流れていて、すごいなぁとは思っていましたが…。 自分なぞ、いまさら感が強くて2周、3周(10周?)遅れ感はありますが、Auroraというモデルが公開されていたので試してみました。使い方はモデルを指定フォルダーにコピーするだけ。 何枚か作例を生成してみましたが、世の中こんなこ

suno-ai: Bark🐶で音声合成して遊ぶ

Barkに色々テキストを入れて、音声合成で遊んでみました。今はまだ荒削りですが、画像生成のときのように、恐らく、どんどん性能があがっていくでしょう。楽しみです。 いま公開されてるデモはVRAM6GBくらいの消費なので、生成に30~40秒くらい必要なのを目をつぶれば、Google Colabでも自宅のPCでも気軽に楽しめるのでオススメかも。たのしいオモチャです。 微妙な空気? text_prompt = """ woman: このプレゼント、誰からもらったの?