ビジネスモデル研究：Sansan

2020年6月22日 18:26

Executive summary
Sansan事業は企業向けの名刺管理サービスSanSanと、そのシステムを一般ユーザー向けにリリースしたEightからなる。競合にWantedlyの名刺管理サービスなどがあるが、明確な差別化は「あえて人力で名刺を入力していること」である。これにより読み取り精度は99.9%(同社より)となり、言語によらず、OCRでの自動読み取りと比較して高い精度でデータ入力を行うことができる。なお人力読み取りサービスはSansanの有料版サービスのみの提供である。
Sansanのビジネスモデル設計の素晴らしさは、機械学習技術をはじめとするアルゴリズム(いわゆるAIの要素技術)の限界を知った上で、技術インパクトの最大化を行いながら、本業の利益を最大化するためのコスト削減施策を「占有技術」で実現している点だ。DXerの皆様におかれましては、教師データ入力のモチベーション設計や、コスト設計に関して参考になる点が多くあることだろう。

ビジネスモデル

基本的にサブスク型。費用として、スキャナのリース料金、情報処理パートナーと呼んでいる名刺入力クラウドワーカーさんへの外注費用などが事業の原価となっている模様。名刺管理サービス自体は法人向けと個人ユーザーでUIを変えて展開しているが、基盤データベースは共通しているものと考えられる。

株式公開時の目論見書より抜粋

技術

・高精度名刺読取技術
・名寄せ技術

制約

・名刺という個人情報の塊を取り扱う上での「個人情報保護法」による制約

制約解消方法

分散情報処理による個人情報の断片化(2014年国際特許化)

Sansan特許の要約・図面(公開情報5312701号より)

個人情報の塊である名刺を取り扱うにあたって「追跡不可能なレベルで断片化」することによって、クラウドワーカーに名刺を手入力させる運用を実現している。2013年に特許化(5312701号)、2014年には国際特許化。実は断片情報化してクラウドワーカーに入力させる系の特許は類似特許をSHARP(特願2009-225342)、富士ゼロックス(特願2008-42365)などが出すものの、新規性なしで否決・不登録確定されている。
おそらくSansanは「名刺管理」「名刺情報入力」にドメインを絞って申請したことで要件を満たすことができたものと思われる。つまり名刺データを人力で入力させる分野においては、権利独占に近い内容で、これによりwantedlyなどの名刺交換サービスがOCRにとどまっている理由もなんとなく推察される。このIPをまとめた方は素晴らしい。これにより、改正個人情報保護法でも言及されている個人を特定できる情報の制約から抜けられるばかりか、クラウドワーカーに対する要求品質を抑え、単価を下げることで運用コストの削減に成功していると言える。

OCRをクラウドワーカーの品質圧縮に利用

ゼロからクラウドワーカーに入力させると工数がかかって仕方ないのと、サブスク型である以上、一部の企業が名刺を大量に入れてきた時の運用コストを平滑化する必要がある。そこでOCRによってあらかじめ名刺を読みこみ、断片化処理をかけた上で、画像とOCR文章の突合を行なっているものと推察される。これにより名刺読みとり回転率を上げている。

名寄せにおける自然言語処理技術とアノテーションフロー

名寄せについての詳細は下記のスライドに詳しいが、ポイントはその学習データの取り方。自動化しているのはあくまでも「名寄せ候補出し」のみで、画面上でユーザーにリコメンドを出す運用を取っている。ユーザーは間違った相手に名寄せされると運用上困る(ここがポイント)ので、比較的正しく答えを提供してくれるだろう。より正しい教師データを得るためのモチベーション設計がされている。

横展開

人材マッチングサービス

eightを活用したダイレクトリクルーティングサービスや、sansanの名刺データ履歴を活用した「転職確率推定」を行い(顧客生涯価値の計算に似ている)、転職しそうな人を、マッチ度の高い企業への斡旋をおこなうサービスなど。eightはリクルーティングサービス展開済み。人材紹介ビジネスになると、データ加工・運用で収益を上げるビジネスモデルが毀損しそうなので、人材紹介会社とのマッチアップしてマッチングフィーの数%をバックするなどのモデルが考えられそう。

紙業務アウトソース

第一回目にSansanを上げた理由はここ。請求書オンライン受領して、データ入力をオペレーションでフォローすることで、「あらゆる請求書のワンストップ受領、正確なデータ化、データベースでの一元管理」サービスを提供し始めた。事業の主要リソースを完全に活かしたまま、事業横展開できる好例だなと感じている。

さいごに

正直いって、この考え方をこのタイミングで実施できてしまうフットワークの軽さと、機動力の高さに感じいってしまう。なんということだろう。マジで渋い。
AI技術の限界(OCRと名寄せの精度限界)を早い段階で見極めながら、顧客のペインとなりうるところを、泥臭く人力で埋めていく。人力で作業することによる個人情報保護リスクを、かなり早い段階でヘッジする戦略は、DXを推進する上で学ぶべき点が多くある。
Sansanビジネス自体に、その他の企業でも参考になるDXの種が、見て取れるのではないだろうか。
🥝

=======

TRYETINGでは「ノーコードAIクラウド・UMWELT(ウムヴェルト)」を開発・提供しています！Spreadsheetなどをデータベースがわりにしてデータ処理・機械学習などを、ノーコードで簡単に作れる、RPA・AI処理・サーバーが一つになった製品です。

もし工数大きい業務の自動化・高精度化・データ活用などのDX課題を抱えている場合は、お気軽に15〜30分程度で無料相談乗れますので、お問い合わせください！

この記事が気に入ったらサポートをしてみませんか？