B2Bマーケティング領域でExplainable AIを実現する機械学習エンジニア
FORCASの執行役員CAIO(Chief AI Officer)北内啓。
自然言語処理、機械学習を用いたコンテンツ生成、アルゴリズム改善はFORCASというプロダクトのコアだ。であるからこそ、CAIOという珍しい役職を置いている。特定の機能の精度改善に留まるのではなく、コンテンツ生成をもミッションとするAIチームは珍しい。
FORCASが目指す「未来のマーケティング」に、どの様に自然言語処理、機械学習が活かされているのか。北内氏にそのリアルを聞いた。
プロダクトのコアとなるアルゴリズム開発とデータ組成を担う機械学習エンジニア
――AIチームで取り組んでいることについて教えてください。
北内 分析アルゴリズムの改善と多種多様な企業データを組成の2点に取り組んでいます。
FORCASにはメイン機能として、既存顧客と類似した潜在企業をスコアリングして自動抽出する機能、「高成長企業」「広告宣伝費を増やす可能性が高い企業」といったシナリオで成約確度が高い企業をターゲティングできる機能の2つがあります。
AIチームでは、既存顧客と類似した潜在企業を自動抽出するためのFORCASの分析アルゴリズムを作ることと、ターゲティングをする際の多種多様な企業データの組成を担っています。
ーーFORCASの分析アルゴリズムについて教えてください。
北内 FORCASの分析アルゴリズムの特徴は、分析結果を見たときにユーザー自身が解釈しやすく、納得性が高いことです。
当初はGBDTというアルゴリズムを使っていましたが、分析結果を見たときに業種/シナリオ/利用サービスなどの各特徴量の重要度が解釈しづらい、セールスやマーケターの感覚と必ずしも合わないという課題がありました。
そのため、1年ほど前にNaive Bayes を独自に改良したアルゴリズムに変更しました。このアルゴリズムは重要度の算出式が分かりやすいため、ユーザーにも説明可能(Explainable)です。また、どの特徴が重要であるか明確に分かるため、マーケティングや営業の施策に落としやすいという利点があります。
さらに、特徴量が互いに独立なモデルなのでユーザー側で重要度を修正することも可能となり、ユーザーとなるマーケターやセールスの意思や経験を分析アルゴリズムへ反映できるよう進化しました。
――多種多様な企業データとは、具体的にどのようなデータをつくっているのでしょうか?
FORCASは、ユーザーが「受注確度の高い企業」を明確にターゲティングして戦略的かつ個別にアプローチするためのプロダクトなので、業界や売上規模、従業員規模などのざっくりした観点では精度の高いターゲティング(=受注確度が高い企業の予測)ができません。
そこで、多様な観点から企業をセグメントできるように、企業の特徴を表現する“シナリオ”をたくさん作っています。
例えば、上場企業なら有価証券報告書に「業績良好で人材採用が課題」「組織拡大のため人材育成が課題」「セキュリティ強化が課題」といった、企業の経営課題が書かれています。それらの課題を自然言語処理で抽出して「人材採用に力を入れている企業」といった具合で企業の特徴を表すタグを作っていく。
有価証券報告書だけでなく、企業のWebサイトや求人サイトにも企業の課題や特徴が書かれているので、それらも分析して特徴を抽出しています。
人材系企業なら人材採用や育成に力を入れている企業を知りたいし、セキュリティ企業はセキュリティを強化している企業を知りたい。
ユーザーによってほしい企業データニーズは違う。FORCASは多様な観点でセグメントできるように企業の特徴群を作ることで、ユーザーへ価値を届けています。
また、企業の開示資料を分析して経営課題を抽出することはアメリカでも有用です。なので、FORCASの米国進出に合わせ、アメリカ版有価証券報告書である「Form 10-K」の分析も始めています。
AIチームが生成するコンテンツが価値に直結
――ユーザーごとのニーズはどのようにキャッチしているのですか?
北内 社内のSlack上に、カスタマーサクセスやセールスがユーザーからの声を書き込むチャンネルがあります。そこには1日数件、1ヶ月に50件〜60件ものユーザーからの要望が書き込まれます。「最近社長が変わった企業を知りたい」「親会社・子会社を知りたい」など、要望は多種多様です。
エンジニアはすべての要望を読み込み、なぜそのデータがほしいのか?をビジネス側と肌感をすり合わせています。その上で、「ユーザーが求めるデータはどこにあるどのデータを使えば作れるのか?」をゼロベースで模索し、そこから本当に企業の特徴を抽出できるのかを検証しています。
例えば、「外資系企業をターゲティングしたい」という要望があったのですが、各企業が外資系企業(海外企業が設立した日本法人、事業拠点)かどうかをアルゴリズムだけで判別するのは困難で、できたとしても開発にはかなり時間がかかります。
そこで、たとえば社名がカタカナの「ジャパン」で終わる企業は外資系企業ではないかという仮説を立ててリストアップし、実際に外資系企業かどうか1社1社目視で確認しました。すべての外資系企業を網羅できてはいませんが、それでも現在1,600件以上をリストアップできるようになりました。このように、テクノロジーだけではなく人の力も組み合わせて企業データを組成し、最速でユーザーに価値を届けることを心がけています。
企業の特徴群を作るための分析手法は、自分たちで考える必要があります。「業務効率」「オープンイノベーション」「商品開発力」など企業をセグメントできる特徴群をつくれば作るほど、それがプロダクトの価値に直結してよりユーザーの役に立つ。
ユーザーにとって価値あるデータを作るために創意工夫を凝らしながら多種多様なコンテンツを作っている会社は、日本では珍しいのではないかと思っています。
ユーザーとの共創により未来のマーケティングをつくる
――ユーザーが求めるものをつくっていくために、ユーザーから直接要望を聞く機会は多いのでしょうか?
北内 エンジニアが直接ユーザーに話を聞きに行くこともありますし、大きな機能改善をした際は、エンジニア主催のレクチャー会も開催します。
レクチャー会では、参加してくれた数十社のユーザーと一緒に画面を見ながら、直接その場でフィードバックをもらうこともあります。レクチャー会後、ユーザーとFORCASメンバーが繋がっているSlackで「重要度の算出方法がよくわかりました」「分析結果を自信持って社内で説明できます」など、ユーザーからダイレクトに感想をもらえるのはうれしいです。
「ユーザーとの距離が近く、共創によりプロダクトの価値をつくっている」それを機械学習エンジニア自ら体感することができるのはFORCASのプロダクト開発のやりがいです。
FORCAS は誕生して約2年半しか経っていないプロダクトで、そもそもABM(アカウントベースドマーケティング)の実践を支援するサービスは、日本にはほとんどありません。ユーザーと共創しないと全容が見えにくいからこそ、ユーザーと一緒に作っていくことを大切にしていますし、作ったものが必ずユーザーの役に立つのはうれしいです。
グローバルに広がるFORCASの価値
――ユーザーと共創しながら作り上げているFORCAS。これから北内さんが実現させたいことを教えてください。
北内 FORCASのプロダクトとしての価値をより高めていくことと、アメリカ版FORCASを開発することです。実際に、2019年7月からアメリカ版FORCASの開発を本格的に進めています。
ABMはアメリカで生まれた言葉なので、日本より先行して取り組まれています。しかし、アメリカに複数あるABMを支援するプロダクトは、「資料を請求した企業」「メールに反応した企業」といった、ユーザー行動を使って絞り込むものばかり。FORCASのように企業の開示資料から経営課題を抽出してターゲティングするABM製品は存在していません。つまり、FORCASは世界から見ても最先端プロダクトと言えるかもしれない。
FORCASで培った知見やノウハウはグローバルでも有用なはずなので、アメリカ版を開発してアメリカのユーザーにも価値を届けたいと思っています。
――どんな人に仲間になってほしいですか?
北内 創意工夫をしながらユーザーに役立つデータを最速で作りたい人や、ユーザーと近い距離で開発し、直接価値を届けたい人です。
技術的には、有価証券報告書や企業サイト、求人サイトなどテキスト情報を解析しているので、自然言語処理や機械学習を専門としている人などにぜひ来てもらいたいです。
ML/データ分析はscilkit-learn, Python、サーバーサイドはJava, Kotlinがメイン。フロント側はVue.js、実行環境はAWSやDockerを利用しています。
アーキテクチャーとしてはマイクロサービスを意識しています。
自然言語処理に取り組みたい人が働けるスタートアップは国内では少ないですし、唯一無二のプロダクトを開発している会社だと自負しています。
そういった環境を求めている人はぜひカジュアルにお話したいです。もっと具体的でワクワクするお話を、直接お伝えできると思います。
最後に
カジュアル面談希望の方は、こちらからお気軽にご連絡ください。
※FORCASプロダクト開発は、アプリ開発チームとAIチームが連携しながら最速でユーザーに価値を届けることに取り組んでいます。
こちら(アプリ開発チームの記事)を読んでいただくことで、FORCASプロダクト開発についてより深く知っていただけると思います。
▼FORCAS会社紹介資料