マガジンのカバー画像

最新AI研究&検証

61
最新AIの最前線に立つ技術、理論、応用を深掘りするマガジンです。検証結果や研究の記事をまとめています。
運営しているクリエイター

#無料

"元画像+テクスチャ画像+シーン画像"で直感的に画像を編集するAIの「pOps」を試してみる

「pOps」はPhoto-Inspired Diffusion Operators(写真にインスパイアされた拡散オペレーター)の略語で、画像を編集するための新しい技術として発表されていました。 この技術では、画像に特定のテクスチャを追加したり、複数の画像を合成したり、形容詞で表現を変更したりできるらしく、他にもオブジェクトを特定のシーンに配置することも可能とのことで、工夫次第で色々と調整ができるそう。 pOpsの概要pOpsは、画像の埋め込み空間で直接動作するセマンティッ

任意の画像に対する質問になんでも答えてくれるミニマムオープンソースAIツール「moondream」を試してみる

moondreamとはMoondream は任意の画像に対して現実世界の質問に答えることができるコンピューター ビジョンモデル。オープンソースで配信されています。 現在のモデル市場からすると非常に小さく、パラメーターは 16 億しかないとのこと。 この小ささで、携帯電話などを含むさまざまなデバイス上でローカル実行できるようになっているのが売りみたいですね。 プロジェクトページ類🌐プロジェクトページ類はこちら。 試してみるmoondreamは超シンプルにアップロードした画像

テキストでサラッとUIコンポーネントを作ってくれる「OpenUI」をいじってみる

今回は「Open UI」というチャットベースでUIコンポーネント(画面上に表示するUIのパーツ)の構築ができるAIツールを試してみたいと思います。 最近はtext to appもだいぶ流行っています。最近はCreate XYZも大人気ですね! 🌐プロジェクトページはこちら ということで早速ローカルで起動! 無料にこだわる私は今回も無料のLLMを使いたく、Ollamaのllama3で設定しました。 Ollamaにllama3を入れた時の記事はこちら それでは早速いじ

Ollamaと連携してDifyでRAGチャットボットを完全無料で作って遊ぶ

前回すごいすごいと話題になってたDifyがオープンソースだと知りなんとなくインストールしてみました。今回はそれの続きです! RAGチャットボット制作にはchatGPTのAPIを使ってもよかったのですが、せっかくなのでここまで来たらLLMも無料のもので全部無料でやりたい欲がでてしまい少し調べるとOllamaとの連携でDifyができる記事見つかりそれでやってみることにしました。 ありがたや~! ということで記事通りにやってみた結果がこちら! 超かんたん😊すばらしい😊😊😊

ちまたで人気のローコードLLM アプリ開発プラットフォーム「Dify」をWindowsのローカルで動かす

いま大人気のローコードなAIシステムの開発環境のLLMツール「Dify」。 あまりに人気なもんだから流石に調べておかなきゃ〜と思ったらこれがまあすごい。 オールインワンのワークスペースで視覚的に生成型AIアプリを作成、何百もの独自/オープンソース LLM とのシームレスな統合ができちゃうという異常なツールです。 このDify、クラウドサービスだと200回分のGPT無料トライアルができるのでちょっといじってみたい!という人にも優しい設計。 しかし通常はプロで59ドルします。