最近の記事
新型生成AI "Claude3 Haiku"を試してみた。 速くて賢いのに低価格。 AI エージェントとして使いたい!
3月14日に"Claude3 Haiku"(1)というClaude3 生成AIの中で最も軽量なモデルが公開され、webアプリやAPIで使えるようになりました。いつもは最も高性能なモデルに惹かれるのですが、今回は最も軽いモデルを取り上げてみたいと思います。最近AI Agentのような繰り返し計算を実行するアルゴリズムを使うことが増えてきました。GPT4のようなハイエンドモデルを使いたいのですが、とてもコストが嵩むので簡単には実行できません。そこで安くて性能が良いモデルを探してい
Google Gemini 1.5 Pro の長いコンテキストウィンドウを使えば、 AIもいよいよ自分の個性を持ち始めるかも?!
AIの進化の速度は今年も凄まじいですね。Googleから新しいgenerative AI "Gemini 1.5 Pro" が発表されました。Mixture-of-Experts (MoE) architectureを採用した自信作のようです。まだ限定的なユーザーにのみ公開されているだけで、実証実験が出来るのはもう少し先ですが、興味深い技術的ブレイクスルーが紹介されていますので、少し深堀りしてみたいと思います。 1.100万tokenの長いcontext window Ge
"REST MEETS REACT" 合成データによる新しいプロンプト・エンジニアリング。人間が生成したデータに頼らずにAIを強化するための莫大な可能性を秘めています
明けましておめでとうございます。本年も宜しくお願い致します。早速ですが、新しい年に相応しい、先進的なプロンプト・エンジニアリング手法がGoogle DeepMindから発表されました。" REST MEETS REACT: SELF-IMPROVEMENT FOR MULTI-STEP REASONING LLM AGENT"(1)と言う論文です。合成データ(Synthetic Data)によるファインチューニングが組み込まれており、期待できそうです!それでは始めましょう。
agent-style applications の時代がやってきました。 予想より早い、しかもさらにここから加速しそうです
11月7日早朝、OpenAI DevDayが開かれました。初の年次開発者総会です。GPT-4がデビューした2023年3月以降の技術発展が一気に紹介されました。あまりにたくさんあるので、網羅的に説明するのはOpenAI CEO Sam Altmanに任せるとして、ここでは、私が考えたポイントを3つほど上げて、いろいろ考えていきたいと思います。 1.やはり値段が大切 期待されていました値下げが実現しました。GPT-4はざっくりいって65%オフ程度になりそうです。もちろん使い方に
Google DeepMindより新しいprompt engineering手法登場。 CoTを上回る精度が得られるかも!
こんにちは、皆さんお元気でお過ごしでしょうか? 今年もあと2ヶ月を切りましたね。本当にAIの進化が凄まじかった年でしたが、まだその速度は衰えないようです。先日、新しいPrompt-engineering手法としてGoogle DeepMindより"Step-Back Prompting (1)"が発表されました。早速詳細をみてみましょう。 1.Step-Back Prompting DeepMindからの提案なので、当初は複雑な手法かと思いましたが、コンセプトそのものはシン
GPT4による合成テキストでGPT3.5をfine-tuning。精度は向上しました! 将来は訓練テキストが要らなくなるかも???
こんにちは、9月も後半というのに相変わらずの暑さ。写真もミスマッチ感満載ですが、早く涼しくなって欲しいのであえて秋にこだわります。でも今月いっぱい暑いままかも知れないですね。 さて、先日ご紹介したChatGPT3.5のfine tuningですが、やはり話題になってますね。ご自身のタスクに特化して性能を上げたいニーズは特に企業では根強いのだと思います。そこで今回は手元にデータが無くてもなんとかしたいケースを想定して、合成テキストを生成したのちfine tuningを行う実験
ChatGPTにfine-tuningがやって来た。その効果は抜群で、タスクに応じて実施すれば精度の大幅な改善が期待できるかも!!
皆さんこんにちは、暑い日が続きますがお元気でしょうか?イラストだけは秋らしくしたのですが、当分夏は居座りそうですね。 そうこうしているうちに突然、OpenAIから「fine-tuning機能が実装できました」との連絡がありました。私はオープンソースモデルでは必ずfine-tuningを行っていたので、ChatGPTでは全く触れられずに少し寂しかったのですが、いよいよ満を持して登場したようです。OpenAIも少し本気になったのかなと思いました。では早速始めてみましょう。 1
「Llama2」はオープンソースで商用利用可能な優れた LLM です。この言語モデルで多くのアプリケーションを試してみたいと思います
こんにちは。2023 年 7 月 18 日に Meta からリリースされた新しい LLM をご紹介したいと思います。その名も「Llama2」。このモデルを使っていくつかの実験を行ってみたいと思います。Let us start! 1. Llama2とは何ですか? 「Llama2」は、Meta AI の言語モデルです。オープンソースで商業利用が可能なため、多くの研究者が非常に興奮しています。その仕様を以下の表で説明します。 2. 英語のテキストから情報を抽出してみましょう
OpenAIからの新しいアップデート“Function calling”は、GPTが外部にアクセスし、エージェントを容易に作成できるのできっとゲームチェンジャーになります!
今日は、上の画像の「どら焼き」のような日本のスイーツコレクションの説明を含むウェブサイトを作成したいと思います。そこで私はAIエージェントに素晴らしいウェブサイトを作成するように頼みました。しかし、それは本当に可能なのでしょうか?はい、確かに可能です!OpenAIがGPTを作成したことはご存知の通りですが、これは非常にインテリジェントな大規模言語モデル(LLM)です。2023年6月13日にOpenAIによって、新しく“Function calling”が導入されました。これに