AIもろもろ

WizMap: 機械学習の埋め込み(Embeddings) のインタラクティブな可視化ツール

WizMapという機械学習の埋め込み（Embeddings）の可視化ツールが公開されていました。ブラウザで手軽に機械学習で作成したEmbeddings空間をインタラクティブに探索できます。論文のほか、Githubリポジトリが公開されています。若干、マニアックなネタですが、情報の意味的な広がりや距離が平面上に可視化されるので、デモを触るだけでも面白いかも。 Webデモ以下URLにアクセスしてwebアプリを試してみてください。ローカル環境で動かしてしてみます$ gi

高速なLLM用推論ライブラリ「vLLM」を試す

Huggingface Transformersに代わる高速ライブラリとして、vLLMというのが公表されているとのGigazineの記事がありました。とても分かりやすく動作原理やその効果を説明してくれていて、興味深く読ませてもらいました。 vLLMは、HuggingFace Transformersでサポートされているアーキテクチャーのモデルをサポートしています。というわけで、くわしい解説はGigazine記事にお任せして、実際に自分の環境で試食してみます。 Dock

ChatGPT にEDM生成のプロンプトを考えてもらう

MusicGenというtext2musicのAIを試しています。EDMフェスでかかる感じの曲のプロンプトを英語でお願いします。こんどは、変化をつけてダークな感じをお願いします。テンポが速い感じでお願いします。っぽくはある感じはするのですが、どうでしょうか。

AI丸投げで300秒の音楽生成（MusicGen）

Meta社が先日公開した音楽生成AIのMusicGenですが、Meta公式リポジトリ版に webuiを追加して生成時間を延ばす改良をくわえたものが公開されていたので、さっそく試してみました。🫡 以下リポジトリのipynbファイルを Google ColabかローカルPCで開くと使えます。プロンプトもChatGPTで生成して入力しました。 A high-energy 90s EDM anthem at 130 BPM, featuring resonant synthe

縦笛の曲をAIでアレンジ「MusicGen」

１．MusicGenの概要Meta社から音楽生成モデル用モデル「MusicGen」が公表されていました。事前トレーニング済モデルとして提供されているのは、以下４つ🤗。なお、各モデルの重みファイルはHuggingFaceでも公開されていますが、MusicGenと合わせて公開されているAudiocraftというライブラリーから自動で読み込んで利用できます。 small: 300Mモデル、テキストから音楽への変換のみ - medium: 1.5Bモデル、テキストから音楽への

Koeiromap-freeとlangchainであそぶ

先日、rinna社から音声とフェイスモーションの生成ＡＩサービスKoemotionが発表されていました。悲しいかなフェイスモーションを試すスキルが自分には無いので、Koemotionの音声合成機能Koeiromapの単体と、langchainを組み合わせて遊んでみました。とにかくkoeiromapを試食！KOEIRO_API_KEYに各自取得したKeyを設定してください。 import requestsimport jsondef koeiro_free(text="こ

アレクサからOpneAI APIを呼び出して、音声でチャットする。

以前アマゾンプライムデーで購入したEcho Show 5と、OpenAI APIを使って簡単なチャットができるスキルを作ってみました。おそらく、例によって同じようなアレクサスキルは、星の数ほどあると思いますが、アレクサスキル開発の例題にはぴったりだと思いました。１．作成手順alexa developer console(https://developer.amazon.com/ja/)にサインインして、Alexaスキルを作成を選択。スキル名：任意プライマリロケー

フォローしませんか？

2023年6月の記事一覧