“検索” と “推薦” で社会をフェアにする（Part I）

MNTSQ, Ltd.（モンテスキュー）

2022年12月24日 14:21

こんにちは、すべての合意をフェアにしたい、MNTSQ（モンテスキュー）の板谷です。

この記事は、MNTSQアドベントカレンダー2022最終日です。

前回はコンサルタントチーム・古角の「大企業と共にSaaSを創るコンサルタントの1年」という記事でした。

私は「契約×NLP」をテーマとしたSaaS企業のCEOをしています。この投稿は、主にエンジニアの皆さま向けに「“検索” や “推薦” の技術が、社会をフェアにする力になる」ことをお伝えするものです。

今回の投稿では、以下の2本立てでお送りしたいと思います。

（Part I）なぜ “検索” と “推薦” で社会がフェアになるのか
（Part II）契約に関する検索技術の面白さ

社会はフェアじゃない。なにがフェアなのか誰もわからないから。

さて、突然ですが、あなたが業務委託をすることになり、目の前に1通の契約があります。

これ、どうしたらフェアな契約であるかを確認できますかね。別にすごく交渉したいわけではないですが、超アンフェアな条件を押し付けられていないかは気になります……。

とりあえず一読してみても、「で、どうすればいいんだろう…」と思いませんか？このまま合意してしまっていいだろうか。でも、やっぱり法的なものだからしっかり確認しないと……うががががががががが。

実はこの苦しみ、日本で年間1.5億件締結されていると言われる、すべての契約で必ず誰かが味わっています。

「一流のビジネスマンなら読めばわかるんじゃないの？」と思われるかもしれませんが、トップローファームの弁護士だった私の経験からすると、世の中に「この契約はフェアだから大丈夫！」と断言する能力を持っている人は実はほとんどいません（！）。

「見比べる」しかない。でも、見比べる相手が見つからない

ある契約がフェアであることを確認する唯一の方法、それは「他の契約と見比べる」ことです。「あれ、前の契約だとこうなってるのに、今回はこうなってる。なんで？」と気づけることが、自分を守ります。

しかしここで、LegalTech領域の宿命といえる非常に大きな問題が立ち塞がります。

「なにと見比べていいのか、わからない」のです。年間2.8億時間を浪費しているといわれる契約業務のうち、実は最も時間がかかっているのがここだといっても過言ではありません。

企業法務においては、自社の他のメンバーが締結した契約も存在するはずなので、見比べる対象はありそう……ですよね。実際に、当社MNTSQのユーザー企業には、数十万件を超える契約データを登録済みである会社も存在します。

しかし、（MNTSQではない）既存のシステムで探してみた結果がこちらです。

なにもわからなくないですか？？？この検索結果のような画面を見て、絶望した人は数知れないと思います。パッと思いつくだけでも、以下のような問題があります。

・締結版契約はPDF（紙をスキャンしたもの）が多いが、OCRがかかっていないのでファイル名しか検索できない

・契約を探したいときと、契約以外を探したいときのメンタリティーは違うはずだが、両者が同時にヒットしてしまう

・契約のうち類似 / 重複するものは排除して検索したいが、同じようなものばかりがヒットして参考にならない

・契約を検索したい場合のファセット（当事者、契約の種類、条項の内容など）はユニークで、ユーザーの目的に対して最適化された体験を設計できていない

そのため、契約の現場ではWindowsのファイルサーバを手当たり次第に掘り返したり、職人の先輩に聞いてまわることが毎日のように行われています。当社MNTSQの調査では、契約についての時間のうち、実に30%以上がこの「探す」という行為に使われています。

“NLP×検索” による解決

この問題は、現代のNLP × 検索技術によってかなりの部分を解決することが可能です。

そもそも、契約データは以下のような性質があり、NLPとの相性が抜群に良いです（参考）。

・明確な意味・構造をもち、解析しやすい（例：条、項、号などの単位での構造化）
・表現のパターンが、法律や慣習によって画一化している

当社MNTSQでは2桁テラバイトの契約データにアクセスできる体制を構築し、独自のNLPアルゴリズムを開発することで、以下のように検索の土壌となる前処理・後処理をすることが可能となっています。

・締結版契約はPDF（紙をスキャンしたもの）が多いが、OCRがかかっていないのでファイル名しか検索できない
⇒ 法務データに特化したOCRを開発

・契約を探したいときと、契約以外を探したいときのメンタリティーは違うはずだが、両者が同時にヒットしてしまう
⇒ 契約・非契約を自動判定するアルゴリズムを構築

・契約のうち類似 / 重複するものは排除して検索したいが、同じようなものばかりがヒットして参考にならない
⇒ 契約の類似性を判定し、検索結果から排除するアルゴリズムを構築

・契約を検索したい場合のファセット（当事者、契約の種類、条項の内容など）はユニークで、ユーザーの目的に対して最適化された体験を設計できていない
⇒ 契約データから当事者、契約の種類、条項の内容などを自動抽出&分類し、検索ファセットとして体系化

このように、ドメインに特化したNLPとの掛け合わせで、契約領域に検索技術が正しく導入されれば、あらゆる契約業務において、「過去の契約と比べたい」ニーズが解消できます。

さらなるチャレンジ - “検索” から “推薦” へ

MNTSQは、この検索技術を武器に、日本の多くの大企業さまでご導入いただきました。

次なるチャレンジとして、ユーザーが主体的に検索行動をしてくれなくても、過去の有益な契約データが、ユーザーの状況にあわせて自動的に推薦される世界を2023年中に作りたいと考えています。

MNTSQの特徴として、日本トップクラスの法律事務所と提携することで、日本社会全体でのベスト・プラクティスというべき「理想的な契約パッケージ」を独占的に受領しています。これにより、契約のたびに「自社のベストな過去データ＋日本全体でのベスト・プラクティス」が常に推薦され、目のまえの契約が本当にフェアなのかを吟味可能な世界を作ることができると考えています。

この推薦アルゴリズムの構築のためには、以下のような問に答える必要があります。

・交渉中のある契約データに「類似する」契約とはなんだろう
・ある状況で、見比べるべき参照点として有益なデータとはなんだろう

このチャレンジは、MNTSQが社会の最前線を切り拓いているものと自負しています。過去の契約ナレッジのうち有益なものが常に参照される循環をつくることができれば、社会全体で契約プラクティスは必ず変わります。

より早く、よりフェアに契約が締結できれば、あらゆるビジネスはより加速し、契約の巧拙という非本質的なところで潰れてしまうイノベーションも救われるはずだと私たちは信じています。

まとめ

この Part Iでは、検索技術がいかに契約領域にインパクトを齎しうるか、契約業務の現場の実情を踏まえつつお伝えできたかと思っています。

次のPart IIでは、実際の開発における面白さ / 難しさについて、より技術的な側面からお話しできればと思います。

みんなにも読んでほしいですか？

オススメした記事はフォロワーのタイムラインに表示されます！