見出し画像

東大・松尾研発AIベンチャーCEOに聞く[前編]RAGに振り切り大手企業から受注

 僕のまわりには、イノベーティブで面白い人が大勢います。仕事を通じて日々話している、わくわくするような話題の中から、読者の皆さんに仕事等で役立てていただけそうなことを、noteに残していくことにしました。

 第1回は、株式会社neoAI(ネオ エーアイ)の代表取締役 CEO & Founder、千葉 駿介さんです。

日本でのAI研究をけん引する東京大学松尾研究室に所属しながら、2022年に同社を設立し、現在に至っています。

驚愕のスピードと圧倒的なクオリティの高さ

 千葉CEOとは、大手流通系企業の役員だった時代に知り合いました。その後オファーを頂き、僕は2024年に、neoAI社の顧問に就任しました。

 neoAIの強みは、事業の先進性はもちろん、大学の研究室での最先端の研究の成果が約3カ月後にはプロダクトに実装されるといった驚愕すべきスピーディさ、技術的なクオリティが図抜けて高い、といった点です。

 これは、実はすごいことなのですよね。

 僕もかつて大学院でコンピュータ工学を専攻していて、最先端の技術を研究していましたが、大学の研究室での研究結果がビジネスの現場に利用されるまでには、当時、10年ほどかかっていました。

 それが、アカデミックな東京大学のAI研究の成果を、1年もたたないうちに社会に実装することが、neoAI社にはできています。

 これは千葉さんが現役の学生で、松尾研究所での技術を、neoAIを通じてビジネス現場でのAIソリューションに応用しているから。僕が、neoAIの顧問をしようと思ったのも、その素晴らしさにあります。

 なぜ、現役の学生ながら起業したのか、学生企業のメリットなどについて、そして生成AIについて聞いてみました。

日本最速のサービスで事業開始

中山 neoAIの最初のサービスはDream icon でしたよね。スマートフォンなどで自分の顔を10枚くらい撮って、それを送るとAIがいろいろな絵柄で描いてくれるという。

 今でこそ珍しくないけど、注目すべきは、これを2022年12月にすでにリリースしているということです。生成AIがブームになったのが2023年だから、もしかして日本最速の生成AIを利用した、BtoCサービスだったのでは?

neoAI代表取締役 CEO & Founder千葉 駿介さん(以下、所属と敬称略)はい。その通りだと思います。僕たちは構想から2週間で、Dream iconをリリースしました。当時は非常に新しかったこともあり、人気となりました。

 しかしご存知の通り、この後いろいろな企業が同じようなサービスを展開することとなり、残念なことに、唯一無二なサービスであった時間は短かったですね。

 そこで僕らが学んだことは、生成AIと、ビジネスの現場からヒントを得た独自性を、うまく繋げることで、オリジナルのサービスを開発しないといけないということです。

                                                                          姉妹サービスの Dream Animal

中山 つまり、最先端の技術を使って何かをやったとしても、技術が普及してくることによって、真似できる企業が多くなり追いつかれてしまう。今は、特に生成AI分野での技術進歩のスピードは速いしね。

 最先端な技術だけでなく、そこに何かビジネスモデルとか新しい仕掛けみたいなものがプラスαでないと、サービスがコモディティ化してしまうよね。

千葉 そこで、「特定ビジネスエリアでの強み×生成AI」という方向に、つまりBtoB方向にかじを取っていくことになります。

AIの可能性に賭け、2022年起業

中山 最初のプロダクトの話を聞いたところで、そもそもなぜ起業したのか、なぜAI分野だったのか、を教えてください。

千葉 ひとことでいえば、AIの可能性です。

 僕は就職の経験はありませんが、2022年前半頃にサイバーエージェント社のインターンをしており、そこで大規模言語モデル(LLM)をファインチューニングする機会を得ました。ChatGPT 3.5はもちろん、画像生成AIである Stable Diffusionも出る前、生成AIという言葉がまだ知られていなかった時代です。そこで、AIに対する大きな可能性を改めて実感しました。

 僕は、大学時代にビジネスコンテストを運営する組織の代表を務めていました。30年くらいの歴史のある団体で、いわばブランド力というレバレッジをかけることで、大きなことが達成できるということも学んでいました。

 ほかの選択肢も多々ある中で、AIによってビジネスの世界で大きな勝負をしてみたい。そんな気持ちで起業し、冒頭でお話ししたDream iconをリリースしたのです。そして起業してから4~5カ月後に、ChatGPTが大きな話題になりました。

RAG(ラグ)に振り切り、ゆうちょ銀行から受注

中山 一般的に、生成AIの登場ってChat-GPT3.5が世に出ていた2022年末だと思われているけど、GPT自体は数年前から存在していて、千葉さんは世間でGPT3.5がブームになる前から、既に生成AIに取り組んでいたのですね。

 2022年のneoAIの起業から5カ月後にChatGPT 3.5が出てきて、これはすごいぞとなったとき、どのようなビジネスに取り組み始めたのかを教えてください。当時は、プロンプトでどうやって、Chat-GPTにいい回答をさせるか、という、プロンプト・チューニングが、人気のテーマでしたよね。

千葉 僕らはプロンプト・チューニングではなく、いきなりRAG(ラグ)をやり始めました

中山 いきなりRAG? 2023の年初でしょ? それは、めちゃくちゃ早いよね(笑)。

 ちなみに、RAGとは何かを手短に説明します。Chat-GPTは、インターネット上の公開情報を学習して回答を生成します。ですから例えば、「次の経営会議のために、当社の過去の経営会議の議事録から、過去に何が話し合われてきたかをまとめてください」とChat-GPTに依頼しても、作成することができません。逆に、そんな情報が公開されていたら怖いですよね。そこで、セキュリティを万全にしたうえで、企業内部のデータをChat-GPTに読み込ませ、回答できるようにする仕組みのことを、RAGといいます

千葉 それによってゆうちょ銀行と、生成AI活用の取り組みを実施しました。詳細な情報はプレスリリースの通りですが、つまりゆうちょ銀行の社内資料を、ラグで読み込ませて回答できるようにするという試みです。

中山Chat-GPTを企業に導入するだけでは、一部企業を除いてはほとんど使われないと各企業が気づいたのが2023年の夏ぐらいでしたが、そのときneoAIは、すでにこのプレスリリースを出している。

千葉 僕らがそれだけの規模で、社内の実験ということではなしに実際の外部の企業と組んで行ったというのは、日本の中でもしかしたら一番早かったかもしれません。

中山 これによって、できることの例は?

千葉 先ほどの話にあったように、例えば社内の人事情報や手続きについては、汎用的な情報ではないためChat-GPTでは答えることができません。そこで、セキュリティレベルを上げて情報が漏洩しないようなシステム環境を構築し、Chat-GPTに膨大な社内のデータを覚え込ませて、社員から質問があった際にはうまく回答できる仕組みを開発しました。例えば自社商品とその周辺知識をあらかじめ覚えこませておけば、営業部員が質問を投げかけることで、商品知識やセールスのポイントを自ら学ぶことができるようになります。

中山各社から「RAGでこんなことができました」といった発表は、2023年秋頃から徐々に発表されだしたけど、neoAIではずいぶん先んじることができたということですね。

OCRのAI化で中小企業の生産性に貢献

中山 他にも、話せる範囲で、面白い事例があれば教えてください。

千葉 はい、オリックス社との生成AIを用いた共同研究があります。

 具体的には「請求書の読み取り」です。文字を読み取るAIというのは、これまでもありました。しかしそれは「フォーマットが同じ場合」という前提でのことで、フォーマットが異なるタクシーの領収書が紛れ込むことで途端にできなくなってしまう、それが今までのOCR(Optical Character Recognition、光学文字認識)です。

 そこで、OCRで読み取ってきた文字を、生成AIが、それが何を示すのかを理解して、請求書の内容をデータ化する。それができるようになりました。

現在、オリックス社のSaaS(Software as a Service、ソフトウェアを提供するクラウドサービス)のプロダクトの中に僕らの生成AIの技術を乗せ、全国の市中小企業の皆さんに使っていただいています

中山 なるほど。整理すると、今までの文章読み取りシステムであるOCRだと、請求書が同じフォーマットであるならば、例えば、どこに「請求金額」が書いてあるかがわかる。ところが、ビジネスの現場で、社外から来る請求書のフォーマットは様々であり、「請求金額」が書いてある場所も違えば、書き方も「¥2000」の場合もあれば、「2,000円」だったり、単に「2000」だけかもしれない。そうなると、もう、OCRにはお手上げ

 そこで生成AIを使うと、その請求書に書かれている内容を生成AIが見ることで、これは「請求額」だと自動認識して、その数字を請求金額として会計システムなどにデータとして書き込む。生成AIに「請求金額」とは何かを学習させることで、どんな請求書でも、請求書の各項目を読み込むことができるし、それがきちんと社内のデータベースの中に入る。それが画期的だったということですね。

千葉 特に、日本の領収書のルールの中にはインボイス番号というものがあります。その文字列をChat-GPTに覚え込ませるというのが、要素技術としては必要になってくるわけです。

 そういう日本独特のルールをいかに生成AIに読み込ませて、動かすかというところは、実はとても難しいのです。でも、その難題を技術的にやり切ることで、業務に使える生成AIのシステムが作れますし、本当に使えるサービスができるのです。

インボイス番号を読み込ませる難しさ

中山 なるほどね。例えばだけど、インボイス番号ってなぜ難しいの?

千葉 はい、そもそもですが、インボイス番号という概念を、ChatGPTは知りません。そこで「インボイス番号というのはこういうもので、こういうルールで付けられているもの」ということを教え込まなければならない。それができないとインボイス番号を拾うことはできません。「アルファベットの大文字の後に数字が続いているだけの羅列」となって、認識から弾かれてしまうのです。

 オリックス社の提供するSaaSには、当社が手掛けたこの機能も含まれていますので、領収書の読み取りにおいて、業界でトップクラスの精度です。

中山 アルファベッドと数字がならぶ文字列なんて、請求書の中にたくさんあるからね。その英数字の中で、「あ、これはインボイス番号だ」と認識しないといけないわけで、生成AIの技術を活用して、その難題に取り組み、解決した

千葉そこにちゃんと生成AIを組み込んでできている、という事例は、いまでもほとんどないと思います。

中山この生成AIを活用した取り組みには2つの価値があるよね。1つは、今まで人にしかできなかった、とても時間がかかる、請求書の項目の判別を生成AIがやることで、圧倒的に業務のスピードが上がること。そして、2つ目は、それにより人件費がかなり削減できるため、請求書のデータ入力にかかるコストが劇的に下がる。最終的にサービスの価格競争優位性や収益力が上がる

 この2つの意味で、オリックスの提供しているSaaSを導入している企業は競争優位性を得ることができる、ということだね。

千葉 利用しているのは全国の中小企業なので、これを使うことで人件費が削減できるし、従業員はもっと本質的なところにリソースを割くことができます。それが、作り出した成果ということですね。


【後編】に続く


この記事が気に入ったらサポートをしてみませんか?