マガジンのカバー画像

AIもろもろ

33
運営しているクリエイター

2023年8月の記事一覧

jetson-generative-ai-playground

githubで、NVIDIA-AI-IOTの jetson-generative-ai-playground というレポジトリを見つけたので、以前、勢いで購入したもののホコリがかぶったままにしてしまっていた(もったいない!)Jetson Orin Nano開発者キットの電源を久しぶりに入れて試してみました。 内容は以下の3つのテーマについて例題が示されています。 1. Text Generation(テキスト生成) oobaboogaの text-generaton-we

AudioGenとMusicGen用の全部入りwebui、AudioCraft Plusを試す

metaのAudioCraftリポジトリからフォークした全部入りwebui、AudioCraft Plusというのが公開されていたので早速試してみました。AudioGenとMusicGenが使えるほか、いろいろなパラメータをGradioのUIで試せるようです。 リンク先のリポジトリにはOpen in Colab ボタンもあり、Google Colab上などでも試せるようですが、今回わたしはローカルPC上で実行してみました。 基本構造(BPM、調性、全体プロンプト)と時間ご

CodeInterpreterを使ってChatGPTに微分積分の宿題をしてもらう

コードインタープリターを使ってChatGPTに微分積分の問題を解いてもらいました。 積分の問題微分の問題たしか高校で習ったはずなのに恥ずかしながら頭がさび付いてしまって、ほとんど忘れてしまいましたが、そんな時も(人類たるプライドを捨てて)さくっとChatGPTにお願いすれば、ほぼいい感じです。今回はChatGPTがすごいというか、数式処理ライブラリsympyがすごいのですが…。なにせ楽。 豊富なpythonライブラリーを活用すると、コードインタープリターは数学以外でもいろ

音声生成モデルAudioLDM2を試す

AudioLDM2というText-to-Audio/Music 生成AIが公開されていたので試してみました。リンク先にはいろいろな音声生成サンプルが紹介されており、どれも高品質でいい感じです。Githubリポジトリはこちら。 概要テキストから、効果音生成: text-to-audio (TTA), 音楽生成: text-to-music (TTM), および 音声生成: text-to-speech (TTS)の共通フレームワーク フレームワークは「オーディオ言語: La