マガジンのカバー画像

LLMの活用

44
運営しているクリエイター

2023年6月の記事一覧

FlowiseAI:GUIで手軽にLangChainを使ったAIアプリを作成できる

FlowiseAIはドラッグアンドドロップの軽快なUIで、LangChainJS を使ったAIアプリケーションを手軽に開発できるオープンソースのツールです。その特徴と使い方を簡単に紹介します。🌽 FlowiseAIの概要オープンソースのMITライセンス: 商用利用可 LangchainJSを使用したLLMフローを素早く構築可能 Node Typescript/Javascriptで書かれ、OpenAI はじめとした各種LLM(ローカル動作のggmlモデルも使えます)、各

OpenAI互換APIサーバーたてて、LangChainで遊ぶ

FastChatがバージョンアップして、LangChainとOpenAI互換のローカルAPIサーバーとの統合方法が詳しめで紹介されていました。 モデルのダウンロードFastChat 初回起動時に自動でモデルがダウンロードされるので、特に何もしなくても大丈夫です。 以前のVicuna-13b-v1.1では、LLaMAから手動でデルタを適用する必要がありましたが、現行のFastChat のバージョンでは、モデル起動時に自動でデルタ適用済みのモデルがダウンロードしてくれるように

LangChainまたまた新機能: OpenAI Multi Functions Agent

中の人がどうなってるのか、にわかに信じられませんが、またまたLangChainの新機能が発表されていました😮 今度の新機能は、「Multi Functions Agent」です。 Agentが1ステップで複数の関数呼び出しをするという機能です。 Tools定義google検索ツール(SerpAPI)を tools に登録します。 llm = ChatOpenAI(temperature=0, model="gpt-3.5-turbo-0613")search = Ser

AIと教育:ChatGPTを使ったレポート作成の実験

「和訳タイトル:人工人工AI: クラウドワーカーが広く使用するテキスト生成タスク用LLM」という変わったタイトルの以下の論文によれば、クラウドワーカーに文章の要約タスクを与えると、33%~46%の人がLLMを使用してラクをする(業務を自主的に効率化する)と推定されたそうです。 ほんまかいな、という気もしますが、人間はラクな方法が使える状況に置かれると、使うなと言われない限り、便利な道具を使うのは仕方がない気もします。(エクセル使える状況でも、あえて電卓をたたく殊勝なひともい

OpenAIのFunction calling機能を活かした、LangChainの新機能Taggingを試す

Tagging機能OpenAIのFunction calling機能を活かした、LangChainのTagging(tags)機能を試してみます。 pydanticの機能を使ってスキーマを設定して、テキストにタグ付けできる機能のようです。 さっそく試してみますネタは青空文庫の「走れメロス」の読み上げをシュッと試してみようと思います。読み上げの実装はbbzさんの記事を参考にさせてもらいました。 ファイル読み込み # ファイルを読み込み、テキストを取得します。with o

ChatGPT にEDM生成のプロンプトを考えてもらう

MusicGenというtext2musicのAIを試しています。EDMフェスでかかる感じの曲のプロンプトを英語でお願いします。 こんどは、変化をつけてダークな感じをお願いします。 テンポが速い感じでお願いします。 っぽくはある感じはするのですが、どうでしょうか。

gpt-3.5-turbo-16kで要約文を作成

以前、長めの英語のyoutube動画の音声を文字起こししてから、langchainで要約文を作成することを試みました。 gpt-3.5-turboのコンテキスト長の制限4kのため、あらかじめ適当なサイズにテキストを分割して中間要約したのちに、全体の要約文を生成していましたが、gpt-3.5-turbo-16kが公開され、コンテキスト長が4倍の16k!になったので、ケチケチせず一気にぶっこむ作戦で要約文を作成してみます。 というわけで、Apple WWDC2023の基調講演

AI丸投げで300秒の音楽生成(MusicGen)

Meta社が先日公開した音楽生成AIのMusicGenですが、Meta公式リポジトリ版に webuiを追加して生成時間を延ばす改良をくわえたものが公開されていたので、さっそく試してみました。🫡 以下リポジトリのipynbファイルを Google ColabかローカルPCで開くと使えます。 プロンプトもChatGPTで生成して入力しました。 A high-energy 90s EDM anthem at 130 BPM, featuring resonant synthe

アレクサからOpneAI APIを呼び出して、音声でチャットする。

以前アマゾンプライムデーで購入したEcho Show 5と、OpenAI APIを使って簡単なチャットができるスキルを作ってみました。 おそらく、例によって同じようなアレクサスキルは、星の数ほどあると思いますが、アレクサスキル開発の例題にはぴったりだと思いました。 1.作成手順alexa developer console(https://developer.amazon.com/ja/)にサインインして、Alexaスキルを作成を選択。 スキル名:任意 プライマリロケー

2時間のYoutube音声を自動で要約 ~ NVIDIAのCOMPUTEX 2023基調講演

先日のNVIDIAのCOMPUTEX 2023でのジェンスン・ファンさんの基調講演を題材に、Youtube音声の要約課題に再トライしてみました。 音声をダウンロードトータル時間:1時間55分57秒 実行時間:2秒 !yt-dlp -x --audio-format mp3 https://youtu.be/i-wpzS9ZsCs -o nvidia2023.mp3 文字起こし時に長いと、なぜか止まってしまうので適当な時間に分割します。 実行時間:1秒 !ffmpeg

GPT-4 とおしゃべり ~ 空・無について教えてもらう

ChatGPTに落合先生の記事をコピペ。GPT-4とおしゃべりを始めてみます。 結論を先に言うと、なんというか…、個人的にチューリングテスト合格といいたい。 以降、このオブジェクト指向のブッタをシミュレーションした会話をしたいです。ブッタ役をおねがいします。ブッダさん、空の概念について、子供でもわかるように説明してください うーん。わかるような、わからないような。説明対象を5歳児にして、もう一度、説明お願いします。 計算機のメモリにたとえるの、あってます? この概念を