見出し画像

生成AIエンジニア塾参加してきました!

元木大介さんが開催している「生成AIエンジニア塾」に、1/6,7に参加してきました。


感想

本当に素晴らしい塾でした。是非多くの方に体験していただきたいです。

1日目

この日はこれらを学びながら実践しました。なかなか濃い1日でした。

  • 生成AIの歴史の勉強

  • GPTsの作成

  • Playground & cursorでのAssistant APIの利用

まずは生成AIの歴史のお勉強
現在までの生成AIの歴史について説明していただきました。
2023年11月から生成AIに触れ始めた私にとって、わずか1年間での技術の進化は驚くべきものでした。特にChatGPTの進化の速さとその機能の多様性には目を見張るものがありました。

特に「マルチモーダルとは」「エージェントとGPTsとは?結局何が違うの?」が理解でき、参加して本当に良かったなと思います。

何よりも元木さんのAIに対する知識が体系立てられていて、丁寧に分かりやすくご説明してくださるので、私でも理解できました。

DALL-E3で作成したマルチモーダルのイメージ図

続いてGPTs作成
学習内容をより深めるため、Code Interpreterの使用と外部ファイルの利用を含んだGPTsを作成しました。
これまでGPTsはいくつか作りましたが、この機能は使ったことがなかったのでどう使おうかなと悩みました。

この時私が作ったGPTsです。

音声を入力すると以下のことをしてくれます。

  • 簡単な音声分析

  • 音声の波形を画像化

  • 自然言語での音声変換

このGPTs作成で最も面白かったことは、他の方の作ったGPTsを見せていただいたこと、そしてなぜそのGPTsを作ったのか背景を聞けたことです。自分にはない発想や物の見方・考え方に触れられたので、貴重な経験でした。

最後にcursor
cursorの設定は大変でした。何度もエラーが出続け、苦しみました。
エンジニア1年目もこんなだったなと、久しぶりに思い出しました。
(私は汎用系エンジニアでしたが、オープン系は別物でした…)

1人ではどうにもできなくて、元木さんや周りの方に助けていただきました。もしこの記事を見ていましたら、本当にありがとうございました。心から感謝しています。

私もPythonでAssistant APIを実装してみたいという方は、ご参照ください


2日目

この日も濃い1日でした。

  • RAGの仕組み

  • LLMの仕組み

  • Azure + GPT、GCP + Gemini、AWS + Claudeの利用

ついにRAGをガッツリ学びました
待っていました。
セキュアな環境、自社データの活用、私が知りたかったことです。
企業で使用するためにはこの2つは必須と言っても過言ではないと思っています。なのでここはしっかりと学ぼうという意識を持って臨みました。

以下の記事の「Azure AI Search のカスタム RAG パターン」にRAGのイメージ図がありますので、ご参照ください。

今回この図に自分が今欲しいサービスを当てはめ、構想を考えてみました。

発音矯正サービスのフロー図

これは「イギリス英語の発音矯正サービス」のフロー図です。
大きく2段階の工程を行います。

1段階目
1.録音した音声、又は録画した動画の読み込み
2.AIが入力ファイルを読み込み、インターネットから正しい発音を検索
3.対象の音声部分を切り出し、ファイル化
4.インプットとそのファイルを比較し、文章化
5.正しい音声ファイルと上記文章をテキストとして出力

2段階目
6.予め用意した自分の声のデータベースから、正しい発音の動画ファイルをインプットに今回の会話内容を検索
7.自分の声で正しく発音した音声ファイルを出力

初めはRAGについて何となく知っている程度でしたが、今回の講義を受けて、RAGがどういうものなのかを理解するだけでなく、それを利用しサービスを考えるところまでいけました。感動しました。

RAG(Retrieval-Augmented Generation)について参考になりそうな記事を探してみましたので、もっと知りたいという方はご参照ください。

認識系AI(従来)と生成系AI
これまでは生成系AIの方が優れているものだと思っていました。
ところが今回お話を伺い、それぞれの違いがどのようなものなのかがはっきりわかりました。これが分かったことで、MicrosoftとopenAIで似たような製品(ChatGPTとAzure)を出しているけれども何が違うのと思っていたものの違い・それぞれの得意が分かりました。
私の簡単な認識では、その名の通り認識系は識別することに、生成系は生み出すことに得意があると理解しています。

詳しく知りたいという方がいましたら、参考記事を探しましたので、ご参照ください

GCP + Gemini、AWS + Claudeの環境設定
環境設定しました。やはり難しい。どこをどう操作すればよいのかてこずりました。それでもなんとか時間を変え、周りの方に助けてもらいながら設定できました。

私も設定したいという方がいましたら、以下をご参照ください

まとめ

全体的に簡単・楽では全くありませんでした。ですが他の方のビジネスアイデアをうかがうことができたり、使ってみたいと思っていたcursorを使うことができたり、RAGを利用する環境設定ができたりと大変価値のある充実した時間だったと感じています。

特にcursorに大変詳しい元木さんからcursorについて直接レクチャーいただき、実際に使っているところを拝見できたことは貴重だったと思っています。
もし自分1人だったら、cursorを上手く使えず、「cursorよくわからないな」と諦めていたかもしれません。元木さんの拝見しているところを拝見し、変な先入観を持たず、cursorはあらゆることができると心から思うことができました。

余談

今年からガッツリ生成AIに踏み込んでいこうと決め、参加しました。

初めて元木さんを知ったのは、SHIFT AIで元木さんが講師としてcursorの解説をされていたセミナーに参加した時です。

その時から元木さんの発信を拝見してますが、いつも発信の量と質が圧倒的だなと驚愕していました。

そんな時に生成AI塾を開催するとの告知、
これは参加一択だなと、急いで予定を調整し、申込を行い、どうか抽選に当たってくれ~とお願いする毎日でした。(参加できるかは抽選でした)

最後まで読んでいただきありがとうございます。簡単でも構いませんので、もしコメント頂けたら嬉しいです。

この記事が気に入ったらサポートをしてみませんか?