見出し画像

ローカル環境上のDifyでGPT-4oを使えるようにする

こんにちは、スクーティーという会社の代表のかけやと申します。

弊社は生成AIを強みとするベトナムオフショア開発・ラボ型開発や、生成AIコンサルティングなどのサービスを提供しており、最近はありがたいことに生成AIと連携したシステム開発のご依頼を数多く頂いています。

​​いまだざわめきが収まらないGPT-4oですが、こちらも噂のノーコードAIプラットフォームであるDifyで使えるようになっていました。早速私のMac上で試してみましたので、その作業内容とGPT-4oを試してみた結果をお伝えします。


新規にDifyをローカルPC上に構築する手順は「DifyでSEO記事作成を試してみる」を御覧ください!また、GPT-4oに関しては、「GPT-4oがやばすぎる:OpenAIとMicrosoftの新機能とサービス(2024年5月13日発表)」に要約しています。

​Difyを最新バージョンに更新する

更新方法は公式ドキュメントに載っているとおりに作業するだけです。
ちなみにDifyは活発なオープンソースプロジェクトのため、この手順で頻繁に最新版に更新したほうが良さそうです。

​このドキュメントの一番下に「Upgrade Dify」とありますので、そこの指示に従ってコマンドを実行するだけです。

$ cd dify/docker
$ git pull origin main
$ docker compose down
$ docker compose pull
$ ​docker compose up -d

これで終わりです。全て実行完了したら、以下のURLにアクセスします。

http://localhost/install

これでDifyのログインページが開きます。

​ログインページからログインして、適当なアプリを開くと・・・

​おお!選択肢にGPT-4oが追加されている・・・!

「gpt-4o-2024-05-13」というのがあって違いがよくわからなかったのですが、開発者フォーラムによると「同じもの」だそうです笑

DifyでGPT-4oを試す

​では、早速チャットボットでGPT-4oを試してみましょう。
今回は簡易的に、「アップロードした画像の三角形の面積を求める」ボットを作ってみました。

小学6年生の正答率が55%だったという噂の難問(?)を解いてもらいます。

この画像をそのままアップロードして、「回答して」とだけ指示を送ります。
問題も画像の中に含まれるので、画像内にあるテキストを指示として認識するかどうかも重要になってきます。結果はいかに・・・?

正解!ちゃんと3cmの辺を底と認識しています。
流石に、数学の能力が他の言語に比べると高いパフォーマンスを出しているモデルだけあります。

ちなみに同じことをGPT-4 turboでもやってみました。

​あれ、、、GPT-4 tuboさん・・・?

最後に

最後までお読みいただき、ありがとうございます!

​弊社では、LLM(大規模言語モデル)やアーキテクチャの選定、技術検証、生成AIを使用したプロトタイピングやシステム開発、お客様社内での啓蒙活動等を対応させていただく「生成AIコンサルティング」サービスを提供しています。

また、業務利用できるChatGPTのような仕組みである「セキュアGAI」も提供しています。

この記事は私が経営する株式会社スクーティーのコーポレートブログの下記記事を焼き直したものです。



この記事が気に入ったらサポートをしてみませんか?