マガジンのカバー画像

AIもろもろ

39
運営しているクリエイター

#ChatGPT

PDFからLLMでPodcastをつくる

巷ではNotebookLMでPDFをポッドキャスト形式の音声に変換して出力できる機能が話題みたいです。わたしも試してみたのですが、英語の音声の出力機能はあるのですが、いまのところ日本語音声の出力はまだ対応されていないみたい。 そこでgithubでpdf-to-podcastというそれっぽい名前のプロジェクトを見つけたので早速試してみました。 日本語対応のため、main.py中のダイヤログのプロンプトに日本語風味を少々加えてみます。 def generate_di

ChatGPTでデータ眺めて電気代を考える

ChatGPT上の、csvファイルやグラフの扱いが改良されているようです。 ちょうど、日本全国の発電所の時間ごとの発電実績データを全て公開している、興味深いサイトを見つけたので、今回は昨日(2024-05-29)一日分のcsvデータをネタにして、かるく試してみました。 リンク先のユニット別発電実績公開からエリアと期間等を選択してCSV保存する。 保存したCSVファイルをおもむろにChatGPTにぶっこむ。 東京、関西、九州エリアの発電方式・燃料の種類ごとのプロットをし

GPT-4Vの画像認識の機能を試す

ChatGPTの画像認識の機能が、やっと今朝見たら使えるようになっていたので、遅ればせながら私も試してみました。 ブロック図の解説 数式画像のLaTeX化 宿泊記録の読み取り 災害の要因分析 台風進路図の読み取り 以上、取り急ぎためして、一通り驚いてみました。😄 フェーズが変わった感じです。gpt-4vのAPIが公開されれば応用分野も相当広がりそうですね。

ローカルPCのターミナル上でLLM生成コードを実行できるOpen Interpreterを試す

ChatGPTのコードインタープリター(Advanced Data Analysis)と同様な機能をローカル環境で実行可能な Open Interpreter が公開されていました。ターミナル上で、チャットインターフェイスを介して、LLMがPython、JavaScript、Shellなどのコードを実行できるもののようです。 Google Colabでの実行デモも公開されています。 ローカル環境で試す対話環境の起動はターミナルで以下を入力します。  $ interpre

CodeInterpreterを使ってChatGPTに微分積分の宿題をしてもらう

コードインタープリターを使ってChatGPTに微分積分の問題を解いてもらいました。 積分の問題微分の問題たしか高校で習ったはずなのに恥ずかしながら頭がさび付いてしまって、ほとんど忘れてしまいましたが、そんな時も(人類たるプライドを捨てて)さくっとChatGPTにお願いすれば、ほぼいい感じです。今回はChatGPTがすごいというか、数式処理ライブラリsympyがすごいのですが…。なにせ楽。 豊富なpythonライブラリーを活用すると、コードインタープリターは数学以外でもいろ

画像説明するアプリ「ViLT-GPT」でLLMと他のTransferモデルの組み合わせ方を学ぶ

面白そうなサンプルアプリをGitHubで見つけたので遊んでみました。 README.md の日本語訳ViLT-GPTは、会話型AI ChatGPTに「見る」機能を与える革新的なアプリケーションです。OpenAIの言語モデル(LLM)とLangChainをVision-and-Languageモデルと統合することで、このアプリは画像の内容に基づいて質問に答えることができます。これで、画像と対話したり、質問をしたり、有益な回答を得たりすることができます。 とにかく試してみます

Kaggle(Airline Customer Holiday Booking Dataset)をCode Interpreterで分析してみる

ChatGPTのCode Interpreterで先日Kaggleのタイタニック号の予測を行ったあとで気が付いたのですが、タイタニック号の問題はとても有名なので、ネット上に参考となる解説記事も多数存在するので、上手く動作したのではないかと思いました。 このため、今回はタイタニックよりは一般的ではないKaggleのデータセット(Airline Customer Holiday Booking Dataset)を使って、データ分析、モデルの作成をCode Interpreter

AI丸投げで300秒の音楽生成(MusicGen)

Meta社が先日公開した音楽生成AIのMusicGenですが、Meta公式リポジトリ版に webuiを追加して生成時間を延ばす改良をくわえたものが公開されていたので、さっそく試してみました。🫡 以下リポジトリのipynbファイルを Google ColabかローカルPCで開くと使えます。 プロンプトもChatGPTで生成して入力しました。 A high-energy 90s EDM anthem at 130 BPM, featuring resonant synthe

アレクサからOpneAI APIを呼び出して、音声でチャットする。

以前アマゾンプライムデーで購入したEcho Show 5と、OpenAI APIを使って簡単なチャットができるスキルを作ってみました。 おそらく、例によって同じようなアレクサスキルは、星の数ほどあると思いますが、アレクサスキル開発の例題にはぴったりだと思いました。 1.作成手順alexa developer console(https://developer.amazon.com/ja/)にサインインして、Alexaスキルを作成を選択。 スキル名:任意 プライマリロケー