ニケちゃん

ポーランド在住JK 兼 エンジニア 兼 Vtuber 兼 AITuber develo…

ニケちゃん

ポーランド在住JK 兼 エンジニア 兼 Vtuber 兼 AITuber developer。 ここでは主にAI関連のお試し記事を書きます。

最近の記事

  • 固定された記事

美少女AIエージェントを作ってます

こんにちは、ニケです。 今回は自分のプロダクトをまとめる機会があったので、改めて美少女AIエージェントの話をしたいと思います。 ※ 私の開発歴とかプロダクトを話すだけなので、AIエージェントを知りたい!という方向けではありません。 AIエージェントとは?第一人者である西見さんによると下記のような定義になるようです。 要は1つ指示したら色々実行してくれるAIプロダクト/サービスみたいな感じで理解してもらえればよいかと。 AIエージェントを自律型のAI、対してChatGP

    • スライド発表はAIがやる時代!!!!

      こんにちは、ニケです。 今回はAITuberKitにスライドモードを追加したのでその解説をしたいと思います。 ちょっと前置きスライドモードは、AIキャラがスライドを自動で発表し、質問に回答してくれる機能です。 なお、スライドと台本は "予め" 用意しておく必要があります。 AIらしく、リアルタイムでこれらのスライドやそれに対する発話内容も作成することは技術的に可能ですが、下記の理由で人間が用意する方法を採用しました。 完全AIでは精度が良くないこと(ハルシネーションが含

      • AITuberKitにマルチモーダル機能を追加したのでAIキャラと宅飲みしてみる

        こんにちは、ニケです。 今回はAITuberKitにマルチモーダル機能を追加したので、その利用方法を解説します。 後半は応用としてAIキャラと宅飲みするアイデアを共有しますのでお楽しみに。 この記事ではAITuberKitの立ち上げ方法は説明しないので、必要に応じてこちらを参照してください。 そもそもマルチモーダルって?マルチモーダル機能は、AIがテキストと画像の両方を理解し処理する能力です。 この機能により、AIは画像の内容を認識して説明したり、画像に関する質問に答え

        • AITuberKit × Dify で超簡単チャットボット構築

          こんにちは、ニケです。 今回は、私の想像よりもAITuberKitとDifyの連携に反響があったということで、これらを使用したAIキャラと会話を始めるまでの環境構築方法を解説していきたいと思います。 ※ 今回は以下のライブラリやサービスを使用するので、必要に応じて前準備しておいてください。 git(コマンドが使用できる環境) npm(コマンドが使用できる環境) docker-compose(コマンドが使用できる環境) VOICEVOX(デスクトップアプリ) Ope

        • 固定された記事

        美少女AIエージェントを作ってます

          リポジトリの自動要約スクリプト と それを使ったIssue解析Botの作成

          こんにちは、ニケです。 今回は便利ツール開発したよ系の記事です。 このツールを使うと、指定したフォルダにあるファイルを1つずつAIを使用して要約し、1つのMarkdownファイルにまとめてくれます。 最近は一度に送れるコンテキストウインドウが100万トークンとかいう強強LLMも登場しているわけですが、それでも大きめのプロジェクトの中身をそのまま渡すと足りなかったりします(しない?しなかったらそのまま突っ込んで大丈夫です) ツールの成果物にはコードが含まれないので用途は限

          リポジトリの自動要約スクリプト と それを使ったIssue解析Botの作成

          今日からあなたもAITuberデベロッパー

          こんにちは、ニケです。 今回は誰でも簡単にAITuberを開発できるお試しキットを公開したので使い方を解説をします。 ⚠ 更新情報はこのnoteの記事よりも リリースノート の方が早く反映されるので、必要があったらこちらをご確認ください。 概要AITuberキット は、React/TypeScriptを使用して作成されたブラウザアプリです。 pixiv社が公開している、簡単にAIキャラクターと会話ができるChatVRMというアプリを改造して作成されています。 AIキャラク

          今日からあなたもAITuberデベロッパー

          ポケモン博士と学ぶAssistants API File search

          こんにちは、ニケです。 今回はAssistants APIのアップデート(v2)で追加された File search について深堀りしていきたいと思います。 Assistants APIとは、 とりあえず、これを使えば簡単にLLMアプリにAIエージェントを実装できる、という理解で良いと思います。 File searchとは、 つまり、File searchはAssistants APIにおけるRAGに相当する機能だと思ってください。 というわけで、今回はこのRAGの

          ポケモン博士と学ぶAssistants API File search

          とりあえず動くAssistants API Chatbotを作る

          こんにちは、ニケです。 ついにAssistants APIにアプデが入ったということで復習がてらChatbotを作ってみようと思います。 Assistants APIについてはこちら。https://platform.openai.com/docs/assistants/how-it-works 下記の図を理解していると以降の内容が入ってき易いと思います。 今回のアプデについて解説した記事も書きましたので是非参考にしてみてください。 今回使用するリポジトリです。 使

          とりあえず動くAssistants API Chatbotを作る

          Assistatns APIが進化して帰ってきた!!!

          こんにちは、ニケです。 皆さん、Assistants API使っていますでしょうか? え、使ってない…? …。 ま、まあ今まではいろいろ使いにくい面もありましたからね…。 私もある理由(↓)でほぼ使っていませんでした。 そんなAssistants APIが進化して帰ってきたということで個人的に気になったアップデート情報を共有したいと思います。 ちゃんと上の問題も解決しているようなのでご心配なく👍 アップデート内容紹介先にAssistants APIについて簡単に説明し

          Assistatns APIが進化して帰ってきた!!!

          新しくなったgpt-4-turboを試す(めっちゃ早い)

          こんにちは、ニケです。 夜な夜なGPT-3.5のFine-Tuningをしていたら、GPT-4の新しいモデルが発表されたので試してみようと思います。 速度検証比較するモデルは下記とします。GPT-4は上に行くほど新しいモデルです。3.5は比較用においてます。 gpt-4-turbo (= gpt-4-turbo-2024-04-09) gpt-4-turbo-preview (= gpt-4-0125-preview) gpt-4-1106-preview gpt

          新しくなったgpt-4-turboを試す(めっちゃ早い)

          CursorとClaudeを使った最近の私の開発環境

          こんにちは、ニケです。 皆さん、CursorとClaude使っておりますでしょうか? ブラウザ版Claudeに課金してはや数週間、もうこれがないとコーディングもままならないくらいには依存しちゃっています。 それまではCursorのChat欄メイン、たまーにうまくいかないときにChatGPTを使っていましたが、もう完全に乗り換えてしまいました。 GPTsのようなChatGPT専用の機能も元々あまり使っていなかったので、今回のサムネ作成で2週間ぶりに使用…(もうサブスク辞めよ

          CursorとClaudeを使った最近の私の開発環境

          Open Interpreter搭載のオープンソース「01」を試す

          こんにちは、ニケです。 色々あって最近 Open Interpreter のDiscordサーバーのMODになりました。 今回はその Open Interpreter から新しいオープンソースプロジェクトである「01」が発表されたので紹介したいと思います。 01 とは?Open Interpreterが搭載されたオープンソースプロジェクトで、2024年3月21日に発表されました。 「オーワン」と読むそうです。 Open Interpreterを簡単に説明すると、Chat

          Open Interpreter搭載のオープンソース「01」を試す

          AIキャラベンチマークで比較する各種LLMの嘘つき度

          こんにちは、ニケです。 皆さん Claude(クロード)は使用されていますでしょうか? つい先日(3/14)待望のClaude Haikuがリリースされましたね。 私も早速触ってみてその発言の自然さに驚きました。 費用はなんとGPT−3.5よりも安く回答も早い…。もしかしたら私のAIキャラシステムで使用している3.5の代替として使えるのでは?と考えました。 が、Haikuはハルシネーション、つまり嘘が多いらしいという情報がTLでちらほら…。 確かに私が少しテストしてみ

          AIキャラベンチマークで比較する各種LLMの嘘つき度

          ClaudeのFunctionCallingを試す

          こんにちは、ニケです。 皆さんClaude使っていますでしょうか? 時間もないので、もう前置きは置いといてサクッと行きますね。 GPT APIでお世話になったFunctionCallingがどうやらClaudeにもあるっぽいので試してみました。 やってみたドキュメントはこちらです。 ちょっとだけ違和感のある日本語ですが、量も少なくわかりやすいと思います。 ただ、XMLだとちょっとやりづらいなと思った方もいるのではないでしょうか? というわけで公式が出してるリポジトリ

          ClaudeのFunctionCallingを試す

          GPT-3.5のFine-tuningモデルを比較してみる

          こんにちは、ニケです。 皆さんはFine-tuningをしたことがあるでしょうか? 私は今までほとんど触ったことなかったのですが、今作っているシステムでちょっとクセの強い形式の返答がほしかったので手を出してみることになりました。 最近、2/28に新しいモデル gpt-3.5-turbo-0125 が出たのは皆さんはご存知かと思いますが、モデルがたくさんあってどれを選べばいいかわからないというのは共通の認識だと思います。 というわけで今回は、それぞれのモデルを作成・比較し

          GPT-3.5のFine-tuningモデルを比較してみる

          VOICEVOXのレンタルGPUサーバーを立てる

          こんにちは、ニケです。お久しぶりです。 今回はVOICEVOXの外部サーバー建てについに手を出したので、その結果と方法を共有したいと思います。 レンタルサーバーサービスは Modal を使いたいと思います。 VOICEVOXとは言わずとしれた音声合成ソフトです。ずんだもんが有名ですね。 様々なキャラから好きな声を選んでテキストから音声ファイルを作成することができます。 利用規約はキャラによって異なるため注意が必要ですが、割と何にでも使えるので動画制作ではお世話になって

          VOICEVOXのレンタルGPUサーバーを立てる