![見出し画像](https://assets.st-note.com/production/uploads/images/135130763/rectangle_large_type_2_8ea3f53f9b6f9e1e66b3816ba781f58e.png?width=1200)
これから Dify の話をします…
こんにちは、Choimirai School のサンミンです。
0 はじめに
「これから OOOOOO の話をします」シリーズは今回で4回目です。
▼2020年3月25日
▼2022年4月29日
▼2022年8月12日
そして、4回目のお題は「Dify」です。
1 Difyって何?
Difyは生成AIのアプリが誰でも簡単に開発できるオープンソースのプロジェクトです。
ファイルをアップロードするだけでRAGの実装ができたり、必要に応じて複数ツールの追加も可。下記ポストは、チャットボットにWolfram Alphaを追加した時の様子です。
. @dify_ai を複合AIシステム(Compound AI System)と呼んでるのはチャットボットやRAGに加え、複数のツールを自由自在に組み合わせることができるからです。ツールの中にはWolfram Alphaも↓。APIキーを取得し認証を済ませば、月2000回まで無料で使えます。他にも、arXivやBing検索との連携も可👏。 https://t.co/2cP8wZDYnI pic.twitter.com/w2WQMYf5VV
— sangmin.eth @ChoimiraiSchool (@gijigae) March 21, 2024
▲Difyで開発したチャットボットにWolfram Alphaを追加した時の様子
あと、補助金関連資料をアップすれば、補助金申請ボットのようなアプリも簡単に作れます。
Claude 3を使った助成金申請ボットを作った😇。助成金の手引(PDFやMS Word等々)をアップするとその内容に基づいて、申請書や事業計画書など必要な書類を書いてくれる👀。夕張市の助成金制度(幸福の黄色いハンカチ基金)を使って試した時の様子↓。 https://t.co/5EaePGPgxa pic.twitter.com/rE7NocDV4l
— sangmin.eth @ChoimiraiSchool (@gijigae) March 6, 2024
2 複合AIシステムとは、
Difyを一言で紹介すると「最強の複合AIシステム(Compound AI Systems)」です。
Difyとは最強の複合AIシステム
2024年に一番注目を集めているトピックの一つがAIを活用したエージェントの開発です。単一の言語モデルに頼るより、複数のAIモデルとツールを組み合わせることで特定作業に特化したアシスタントが作れる。この動向については、AIの権威者であるAndrew先生も強調していることです。
I think AI agentic workflows will drive massive AI progress this year — perhaps even more than the next generation of foundation models. This is an important trend, and I urge everyone who works in AI to pay attention to it.
— Andrew Ng (@AndrewYNg) March 21, 2024
Today, we mostly use LLMs in zero-shot mode, prompting… pic.twitter.com/nBqySLHqR6
そして、バークレー大学のAI研究チームも2023年が言語モデルの年だったのであれば、2024年は複合AIシステム(Compound AI Systems、略してCAIS)の年になると予測しています。
![](https://assets.st-note.com/img/1711416884167-J4jPU7oop2.png?width=1200)
CAIS(Compound AI Systemの略、複合AIシステム)が最先端の成果を生み出す理由は4つに分けて考えられます。
1. システム設計:モデルを繰り返し呼び出す複合システムを構築することで、大規模な言語モデル(LLM)を単に拡大するよりも、はるかに高い性能を実現できる
2. 動的なシステム:最新のデータを取得するための検索・RAG機能を追加することが重要
3. 品質管理:モデルの行動を制御しやすくなる。LLMが不正確な情報を生成することは避けられない。が、検索機能と組み合わせて出典を提示すれば、信頼性を高めることができる
4. パフォーマンス向上:アプリケーションによって、性能とコストの要件は異なる。需要に特化したモデルを使用する方がコストパフォーマンスが良い
3 Difyの特徴①:とにかく使いやすい
Difyは最強の複合AIシステムでありながらとても使いやすいのが最大の特徴です。Dockerのイメージが用意されていますのでGitHubのリポジトリからコードをダウンロードし、docker compose up -d と叩くだけですぐ始められます。
git clone https://github.com/langgenius/dify
cd docker
docker compose up -d
Q: クラウド上でデプロイすることもできますか?
— sangmin.eth @ChoimiraiSchool (@gijigae) March 24, 2024
A: Dockerのイメージが用意されてますのでDockerさえインストールすればどんな環境からも利用できます😇。手順も簡単で、
① git clone https://t.co/OEvznamJwx
② cd docker
③ sudo docker compose up -d
図はAzureで実行した時の様子です↓。 pic.twitter.com/0mKuDxiqrc
docker compose up -d で必要なコンテナが起動したことを確認し、ブラウザからhttp://localhost/install へアクセスしますと下記のような画面が表示されます。
![](https://assets.st-note.com/img/1711430072112-ornmvPfQiL.png?width=1200)
アドミン用のアカウントを登録しますとログイン画面に遷移します。遷移先で、メールアドレスとパスワードを入力すればDifyの機能が全て使える。Dockerがインストール済みですと、10分でDifyを立ち上げ、使い始めることができます。
10分でDifyを立ち上げ、使い始めることができる
4 Difyの特徴②:高品質のRAG
生成AIで差別化を図るため重要なのが高品質のRAG(検索して強化したテキスト生成)です。
今はドキュメントからデータを抽出する方法から始め、RAGを実装する仕組みも星の数ほどある(笑)。ベクトルDBはAWS上のサービスもあるけど他にも @weaviate_io や @trychroma など多数。どんな組み合わせを採用するかでAIの性能が大きく左右されるので、真剣に検討した方がいい✨。 https://t.co/f22v7goyfO pic.twitter.com/hvLNuUl7BT
— sangmin.eth @ChoimiraiSchool (@gijigae) March 18, 2024
Difyではドキュメントからテキストを抽出する作業から始め、エンベディングモデル*やベクトルDB、そしてRerankモデルの選択までベストなRAGを実装する仕組みが標準でついています。
※エンべディング:テキストや画像、音声などのデータを、AIや機械学習、言語モデルが処理しやすい数値ベクトル表現に変換する技術
ベクトルDBへ格納されたテキストは後から削除することも可。必要なデータだけを残すことでRAGのクオリティをさらに向上できます。
ベクトルDBを作った後、要らないチャンク(塊)を簡単に消せるのもDifyを使うメリットの一つ↓。必要なデータだけを保持することでRAGのクオリティを上げることができます。 pic.twitter.com/QsJr5ey7jB
— sangmin.eth @ChoimiraiSchool (@gijigae) March 18, 2024
5 Difyの特徴③:豊富なツール
CAIS(複合AIシステム)がもたらすメリットを最大限に引き出すためにはニーズによって適切なツールを呼び起こすことが大事です。
. @dify_ai を複合AIシステム(Compound AI System)と呼んでるのはチャットボットやRAGに加え、複数のツールを自由自在に組み合わせることができるからです。ツールの中にはWolfram Alphaも↓。APIキーを取得し認証を済ませば、月2000回まで無料で使えます。他にも、arXivやBing検索との連携も可👏。 https://t.co/2cP8wZDYnI pic.twitter.com/w2WQMYf5VV
— sangmin.eth @ChoimiraiSchool (@gijigae) March 21, 2024
DifyではWolfram AlphaやBing Web Searchなど複数のツールが標準で利用できます。また、ニーズに合わせ、自前のツールを開発し追加することも簡単です。
6 Difyの特徴④:複数モデルの比較
2024年3月まではGPT-4を超えるモデルがなかったので、とにかくGPT-4を使えば安全でした。が、2024年3月4日にClaude 3 Opusが公開されてからは話が違います。
Claude 3、最高👏!DockerとNginxを使ったシステムで、SSL設定の仕方がわからなくて、3週間苦労したけどClaude 3のOpusに聞いたら一発で教えてくれた😮。変更が必要だったのは3箇所。
— sangmin.eth @ChoimiraiSchool (@gijigae) March 5, 2024
◾️docker-compose.yaml
◾️conf.d/default.conf
◾️nginx.conf
これはホントすごい、そしてめっちゃ嬉しい😊。 https://t.co/O2dFTV05Wz pic.twitter.com/jEzEv9BDXB
特に、日本語に対する回答ではClaude 3 Opusの性能が、GPT-4を圧倒的に上回る。こうした変化はこれからも続く。そして、複数のモデルを評価し、適切なモデルが選べる能力が重宝されます。
Difyでは最大4つのモデルを並べ、結果を比べられます。下記図は、着物の合わせ方に対し、Claude 3 OpusとGPT-4に評価してもらった時の様子です。
Difyでは複数モデルからの答えが比べられて、より自然なAIを選ぶこともできる。着物の合わせ方をClaude 3 OpusとGPT-4に聞いた時の様子↓👘👘。 pic.twitter.com/0cKr55kbjb
— sangmin.eth @ChoimiraiSchool (@gijigae) March 24, 2024
7 Difyの特徴⑤:Webアプリの自動生成
Difyは大きく分け、バックエンドとフロントエンドの構成となっている。前者がPythonのFlaskで、後者はNext.js/Typescriptでの実装。
▼バックエンド
![](https://assets.st-note.com/img/1711436485335-ogOt3sgLi4.png?width=1200)
▼フロントエンド
![](https://assets.st-note.com/img/1711436521471-phCheFIkZk.png?width=1200)
バックエンドでチャットボットを作りますと自動的にフロントエンドのWebアプリが生成されます。Overview画面にあるPublic URLをシェアしますとチャットボットが公開できます。
![](https://assets.st-note.com/img/1711436654773-Bdd9LB3sa7.png?width=1200)
上記ページで作成したチャットボットは次のリンクからアクセスできます。利用しているモデルはClaude 3 Haikuです。
![](https://assets.st-note.com/img/1711437065017-af0t7qmsVU.png?width=1200)
8 Difyの特徴⑥:開発の精度と速さ
AIの進化は早く、この調子で人工知能が発達していけば、我々を取り巻く社会環境も急変する。こうした変化についていくためにも最新技術を活用する仕組み作りはもはや選択ではなく、必須です。Difyはオープンソース*でありながらコアの開発チームがついていて、週に1回の頻度で新しい機能をリリースしています。
※重要:2つの条件につきましてはビジネス・ライセンスが必要です。
①フロントエンドページに表示されるロゴの変更
②マルチテナント仕様のSaaSサービスの構築
Difyはオープンソースのツールだけどロゴを修正したり、マルチテナントのSaaSを構築する際には商用のライセンスが必要。商用ライセンスを締結するとDifyからロゴが変更できて、チャットアプリからも
— sangmin.eth @ChoimiraiSchool (@gijigae) March 24, 2024
POWERED BY 自社ロゴ🌈
と表示される↓。Choimirai Schoolでは商用ライセンスにも対応してます✨。 https://t.co/OLIYKzZ99g pic.twitter.com/tgEvWgG3Gu
9 Difyが起こす破壊的イノベーション
2024年3月18日からいろんな分野の方々にDifyのデモを行っています。デモに参加された方から共通するフィードバックが来年度から進めるプロジェクトを根本から見直す必要があるとのことです。2024年の夏にGPT-5が公開されますとこの変化はさらに加速します。
この1週間Difyを金融・医療・建設・製薬・着物・大学・貿易・物販業界の方々にデモしたけど共通したフィードバックが「RAG+Claude 3 Opus」の性能が想像以上に高いのとこれほど簡単に実装できることに驚いたということ。GPT-5が夏に公開されるとこの進化はさらに加速する。AIの導入はもはや必須です。 https://t.co/OLIYKzZ99g pic.twitter.com/yYS4D8MVgn
— sangmin.eth @ChoimiraiSchool (@gijigae) March 24, 2024
半歩先未来に備えるためにも変化へ柔軟に対応できる仕組みづくりは個人にも企業にもとても重要なスキルだと思っています。
10 Choimirai Schoolからの宣伝
Choimirai Schoolでは5回の個別面談でDifyの基礎から始め、RAGの実装まで体験できるプログラムを2024年4月1日からスタートします。
法人・団体向けの研修・開発は下記のメールまで問い合わせください。
📧 biz@choimirai.com
11 まとめ
AI時代には今流行りのものより、今後どう変化していくかを予測しながら動くのが肝要です。
AIの進化についていけないという話をよく聞く。アイスホッケーではパック🏒の移動先を見極めることが試合の勝敗を決める。AIも一緒で、今起きてる変化よりも今後どうなるかを見極めるのがとても大事、です✨。
— sangmin.eth @ChoimiraiSchool (@gijigae) March 10, 2024
"I skate to where the puck is going to be, not where it has been." - Wayne Gretzky https://t.co/NfHdN5GRAN pic.twitter.com/Dl5l8BQ4EU
今後の変化を見極めないと報われない努力で終わってしまう可能性も大いにある。
あと、Difyを導入しますと週一の頻度でリリースされる新機能にも自ずと興味を持つ。すると、AIによって導かれる半歩先の未来が覗けます。また、DifyではOpenAI以外のモデルも使えで、飛行機能力が鍛えられますので超オススメです。
外山先生は"グライダー"と"飛行機能力"をこう説いてる。
— sangmin.eth @ChoimiraiSchool (@gijigae) March 25, 2024
受動的に能力を得るのが前者、自分でものごとを発明、発見するのが後者である、と。
AI時代においてもこの違いを理解するのは大事。OpenAIから受動的に能力を得るのか、それとも自ら複数のAIを組み合わせ自分専用のエージェントを作るのか✈️。 https://t.co/WDq057UQYg pic.twitter.com/1E8xc9YZGO
この記事が気に入ったらサポートをしてみませんか?