Microsoft AI Partner Training 参加レポート[前編]
みなさんこんにちは!
ワンキャリアの技術開発部でテックリードをしている高根沢(X:@p0x0q_jp)です。今回は、5月29日に開催された「Microsoft AI Partner Training Roadshow」のイベントに同期の野田と参加してきたので、まずは前編として私の視点からその感想をお伝えしたいと思います。
はじめに:イベントの概要と参加の背景
イベントの概要
このイベントでは、前半で最新のMicrosoft製品アップデートやAIの最新動向の概要を、後半ではテックトラックを通じて興味ある分野をより深く学ぶことができるイベントです。取り扱っているテーマについては、公式サイトから抜粋したものを引用します。(詳細ページ)
参加の背景
参加した理由は、Microsoftが行っている最新の取り組みについて学ぶことで、今後AI市場がどうなっていくか考えるきっかけになると考えたからです。
直近、どのクラウドベンダーでもAIを使ったマネージドサービスの数、種類が増えてきています。ただ利用者としては「どのサービスが自分のニーズに合っているのか?」「どのサービスが今後のトレンドになるのか?」を知ることが重要だと感じています。
そこで、今回のイベントを通じて、MicrosoftのAI関連の最新情報を知ることで、今後のAI市場の動向を予測し自社のビジネスに活かすことができるかを検討していきたいなと考えました。
当日の様子
イベント当日は、様々なセッションが行われ、多くの参加者が集まりました。特に印象に残ったのは、RAG(Retrieval-Augmented Generation)アーキテクチャの精度改善に関するセッションと、次世代の生成AIと言われているニアリアルタイムAIに関するセッションでした。
RAGアーキテクチャの精度改善
内容
RAGアーキテクチャは、生成AIの回答精度を向上させるための技術です。具体的には、外部データベースから関連情報を取得し、それをもとに生成AIが回答を生成するというアプローチを取ります。本セッションでは、このRAGアーキテクチャの精度を改善するための具体的な手法が紹介されました。
例えば、OSS PDFローダーではなくMS Azure Document Intelligenceを使うことで、スキャン画像の文字認識の精度が大幅に向上するという事例がありました。他にも、検索結果の上位数件を再ランキングするReranking手法や、元の文章を一旦別のものに書き換えてからRAGを使うRephrase手法など、様々なチューニングポイントが示されていました。
これらの手法を活用することで、僅か22時間でRAGアーキテクチャの精度を最大40%改善したとのことで、非常に具体的かつ実践的な内容でした。
※発表の中で紹介されていた関連動画
感想
弊社でもRAGの試験運用をいくつか行ったことがありますが、十分な精度が出ないことが多々ありました。改善手法としてRerankingがあることは知っていましたが、実際にRerankingやRephraseなどを複数用いることで40%という大きな改善成果を短時間で出せたという事例は非常に参考になりました。
また、追加で考えなければならないこととして、RAGでヒットさせたコンテンツをReranking APIで並び替えたり、前処理にRephraseを行うなど、処理が複雑になることで、その分マネージドサービスへの課金も増えることが予想されます。そのため、コスト面も含めて検討していく必要があると感じました。
ニアリアルタイムAIの実装
内容
ニアリアルタイムAIとは、データ処理と応答をほぼリアルタイムで行う技術です。セッションでは、Microsoft Copilotが音声、映像の入力に対応し、リアルタイムに応答するデモが行われました。
本デモでは「音声入力」や「映像入力」が「リアルタイムに処理できる」ことで得られる、次のステップの価値を示すものとなっていました。具体的な内容としては、Microsoft CopilotがMinecraftのアシスタントとして、プレイヤーに対してリアルタイムにゲームのプレイ方法のレクチャーや、次のアクションに対するアドバイスを行うというものでした。
このデモにより、ユーザーはキーボード入力を一切行わずに、音声だけでAIと対話できる未来を感じることができました。
感想
ニアリアルタイムAIが実現した世界観は、本当の意味での「AIアシスタント」の実現に近づいていると感じました。音声入力によるAIとの対話がリアルタイムに実現できると、ユーザーの負担を大幅に軽減し、多くの人に受け入れやすくなり、ユーザー体験を向上させることができると思います。
また、直近LLM界隈ではgpt-4からgpt-4oによって3.4倍高速※1、gemini 1.0 proからgemini 1.5 flash※2といったように、高速に応答が可能なモデルが登場しています。これらのモデルを活用することで、ニアリアルタイムAIの実現がより現実的になってきているなと感じました。
※1 https://artificialanalysis.ai/models/gpt-4 の調査によると、87/25 = 3.48倍の速度差がある。
※2 https://artificialanalysis.ai/models/gemini-pro の調査によると、164/87 = 1.88倍の速度差がある。
さいごに
今回の「Microsoft AI Partner Training Roadshow」に参加して、RAGにおいてプラットフォームが提供している機能をそのまま使うのではなく、RerankingやRephraseなどの手法を用いることで大幅な精度改善が可能であることを学びました。これにより、生成AIの回答精度を向上させるための具体的なアプローチが明確になり、RAGの精度改善やMicrosoft製品を活用するにあたって非常に参考になりました。
また、次の生成AIのフェーズはニアリアルタイムであり、今後は音声入力によるAIとの対話がリアルタイムに実現されることが期待されます。音声入力によるAIとの対話がリアルタイムに実現できると、ユーザーの負担を大幅に軽減し、多くの人に受け入れやすくなり、真のAIアシスタントの実現に近づいていると感じました。
このイベントを通じて、移り変わるAIマーケットに対して次のトレンドをいち早くキャッチアップできる良い機会になりました。さらに、来年は登壇者として参加することを目標に、AIの最新技術について学び続けていきたいと感じました。今後もこのようなイベントに積極的に参加し、自身のスキルアップとともに、自社組織の技術力向上に貢献していきたいと思います。
▼ワンキャリアのエンジニア組織のことを知りたい方はまずこちら
▼カジュアル面談を希望の方はこちら
▼エンジニア求人票
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?