LayerX、ML(機械学習)を本気でやりますという話
どうもすべての経済活動をデジタル化し、ハタラクをバクラクに変えたい福島です。
すいません今日は一番上に求人(Job Description)をのっけさせてください。本日はLayerXで本格的にML(機械学習, 以下ML表記で統一)チームをつくるので、MLエンジニアを大募集していきますというお話です。
なぜ今か
LayerXでは、サービス提供時から請求書OCRを内製化して開発してきました。
現在OCRは4-5名チームの体制で開発を行っています。この限られた体制で、できるだけお客様にとっての導入の障壁にならないよう、(短期的に)ROIよく・効率よく精度を上げていくという観点で今までは開発・運用してきました。
その結果、サービス提供から1年たったことでMLをコアに据える準備ができました。このチームの規模を10倍にしていくイメージでML開発に投資していきます。
MLをコアにしてしっかり継続投資が回る条件としてLayerXが考える要素は以下の3つです。
① MLに投資することで、サービスのUXが改善されて、収益改善につながるビジネス構造を作れていること
② アノテーション済みのデータが溜まっている+今後たまり続ける構造があること
③ (短期的に)ROIのよい、ヒューリスティック・ルールベースでの精度改善による運用が限界を迎えていること
LayerXでは、サービスを1年間運営してきていて、幸運にも、この3つの条件がそろったのが今なのです。
MLをどう競争優位にしていくのか
さきほど3つの条件を上げました。
① MLに投資することで、サービスのUXが改善されて、収益改善につながるビジネス構造を作れていること
② アノテーション済みのデータが溜まっている+今後たまり続ける構造があること
③ (短期的に)ROIのよい、ヒューリスティック・ルールベースでの精度改善による運用が限界を迎えていること
今LayerXがどういう状況にあるかを簡単に説明します。
① MLに投資することで、サービスのUXが改善されて、収益改善につながるビジネス構造を作れていること
弊社のサービスは請求書のOCR精度がユーザーの体験にダイレクトに繋がります。
実際の商談の場でも、OCRの精度の高さや、OCRからデータ化までの速さが決め手となるケースがしばしばです。
OCR精度を改善することで、当初はご導入いただけなかったお客様に導入することができた。OCR読み取り項目やOCR読み取りの帳票の種類を増やすことで、新たな導入先を増やすことができた。といったように、MLに投資することがダイレクトに、サービスのUX改善・収益改善につながるといった構造になっています。
余談ですが前職GunosyではMLをコアにしたビジネス(ニュース推薦、アド配信)をやっていました。「MLへの投資→サービスUX改善・収益改善」となる構造がいかに大切か。単なるポーズやバズワードにおさまらない意味のあるML開発につなげるにはこの構造をいかに作るかだと強く思っています。
弊社は単なるポーズではなく、事業の優位性を作るためにML投資ができるので、継続性を持ってMLチームを強化することができます。
② アノテーション済みのデータが溜まっている+今後たまり続ける構造があること
サービス提供開始1年でありがたいことに、かなりのデータが集まるようなサービス規模になってきました。
すでに月次で数百億円規模の請求書があつまるようになっています。請求書の業務は「毎月」継続的に行われますので、この規模の請求書が毎月あつまって集まってくる構造にあります。しかもサービスは急成長中ですのでこの規模はもっと増えていきます。
加えて請求書以外のデータも溜まるようになってきました。昨年12月にリリースした「バクラク 電子帳簿保存」は従来の請求書のみならず、領収書・発注書・見積書などの今までにないデータが集まるようになっています。
しかも単なる画像データが集まってるわけではありません。利用企業様はこのサービス上で、「取引先」「金額」「支払期日」などが正しく入っているかをチェックしています。ですので、単に請求書・領収書・発注書・見積書などの画像データがあるだけではなく、それに紐づく意味のあるアノテーション済みのデータがどんどん集まるようになっています。
③ (短期的に)ROIのよい、ヒューリスティック・ルールベースでの精度改善による運用が限界を迎えていること
直近、導入企業数の伸びの急成長+プロダクト拡張(バクラク 電子帳簿保存)により、集まってくるデータの伸びがすごいことになっています。
ヒューリスティック・ルールベースで改善するには限界が来ており、いよいよ本格的なML Opsを構築し、改善するフェーズが来ています。
そしてそこでしっかりとしたML Opsを構築できると、今後の新規参入企業にとってのMoat(参入城の壁)作られることにもなります。
集まってくるデータを起点に新たな領域への「帳簿OCR × SaaS」の侵食も可能になってきます。
「MLへの投資が、UXの改善・収益改善につながるようにする」→「アノテーション済みのデータが溜まり続けるサイクルを作る」→「溜まったデータがサービス改善につながるようなML Opsを構築する」→「改善されたUX・収益がさらなるデータを呼ぶようにする」といったサイクルを回すことで、MLをコアにした競争優位を作っていきます。
代表もコミットします
ML本気でやりますといって、会社のトップたる代表が何も勉強しない・コミットしないはありえないと思っています。まずは年末年始にリハビリ(※)もかねて実際にコードを書きながら手を動かしつつ、読書をしていました。
(※ 私は元々学部・院生時代にMLを研究していました。前職Gusnoyでは、初期の記事推薦エンジンや広告配信アルゴリズムなどを自ら作っていました。しかしこれは6-7年前の話です。ML領域で6-7年も現場にいないともはや自分は化石であるという自己認識です。なのでゼロから学び直すぞという気合でいます。そしてやっぱりMLおもしろいなと再認識しました笑)
というわけで、LayerX、ML本気でやります。私自身かなりコミットしてMLチームを立ち上げていきますので、MLエンジニアの皆様、どうかLayerXをよろしくお願いします。
(↑福島とのMeetyはこちら)
(↑LayerXでML開発をリードするエンジニアの高際のMeetyはこちら)