不動産SaaS「くらすマッチ」にデータサイエンスとChatGPTを使った子育て環境AIコメント機能を実現した話
Da Vinci Studio AX推進部でマネージャーをやっているkoya3toです。AX推進部では、ユーザーファーストな新しい体験=AX(AI eXperience&AI Transformation)を推進しています。今回は、データサイエンスと生成系AIを組み合わせることで、AXな機能を実現したのでその紹介を行います。
背景
不動産購入層の中には子育て世代が多く、このような層は新しい住まい選びにおいて地域の子育て環境も重要な検討材料の1つです。一方で、これらの情報は様々な場所に散らばっていることが多く、地域の子育て環境を重要視する方に対して、地域の子育て環境に関する情報をわかりやすい形で届けることが難しいという課題がありました。そこで、検討している物件周辺の子育て環境の評価を行い、その結果を元に子育て環境に関するコメントをAIが自動生成する「子育て環境AIコメント」機能を実現しました。これにより、不動産検討者様への情報提供を低コストで実現することが可能になりました。
具体的な機能について
くふう住まいでは不動産仲介店舗様や工務店様向けの「くらすマッチ」と呼ばれる不動産SaaSを提供しています。くらすマッチでは物件の住所を入力するだけで周辺環境の地図を作成することが可能なツールです。
今回は、検討中の物件周辺の子育て環境を評価したコメントを自動で作成し、不動産購入検討者に対して提示可能な機能をくらすマッチ上で実現しました。このコメントは、周辺地域の待機児童数、出生率、子育て世帯の割合といった、その地域の子育てしやすさと相関するであろう指標を元に生成しています。これにより、不動産選びを行う上で重要な検討材料となる情報をわかりやすく提示することが可能となっています。
具体的に生成されるコメントは上記のようなものです。このコメントは担当者のチェックを経て、不動産検討者様に届けられます。
実現方法
この機能はデータサイエンス手法と、生成系AIの組み合わせにより実現しています。まず、子育てに関連した情報は従来のデータサイエンス手法で作成を行います。次に、作成した情報を生成系AIに入力し、人間が理解しやすい自然言語によるコメントを生成しています。このような仕組みを採用した理由は以下の通りです。
生成系AIの持つ知識は学習時点のものに限られるため、最新の情報を元に回答するのは難しい。
信頼性の高い外部情報を与えると生成系AIは信頼性の高い回答を行うようになる。一方で何も情報を与えないと、信頼性の低い回答をしてしまう可能性が高かった。
データサイエンスパート
生成系AIに入力する、ある地点がどれだけ子育てしやすいかという情報は、出生率や図書館の数といった子育てしやすさと相関をもつであろう指標そのものと、その値がその周辺地域と比較して子育て観点でどれだけ良いかという観点でスコア化したもの、としました。値そのものだけでなく、上記のような相対的なスコアの計算を行う理由は、物事の善し悪しは値そのものだけでは分からず、他との比較を通してはじめてわかるものであると考えたためです。
生成系AIに対する入力情報の詳しい作成方法は以下のとおりです。
入力された緯度経度から、半径5km以内の500mメッシュ(緯度経度を元に地図を格子状に区切ったもの)を取得します。
対象エリア内の500mメッシュ毎に、子育てしやすさと相関するであろう指標を計算します。考慮している指標は、待機児童の割合、出生率、人口、未就学児の割合、周辺の子育て関連施設(例:図書館、公園、小学校など)がどれだけ集積しているか、といった値です。
各指標を0-100の範囲にスコア化します。スコア化は、パーセンタイル順位に変換することで行います。パーセンタイル順位は、あるデータが全体の中でどの位置にあるのかをパーセンテージで示すものです。このため、指標の大きさや小ささを相対的に表現することが可能となっています。例えば、ある指標について、入力された緯度経度に対応するメッシュが半径5km以内の他のメッシュと比べて子育て観点で良い場合は100に近い値になります。相対的に悪い場合は0に近い値となります。
例えば、下記の図は上石神井駅の半径5kmの500mメッシュについて、どれだけ病院が集積しているかという観点でスコアを計算し、それを地図上に可視化した結果です。上石神井駅の左下は吉祥寺駅ですが、吉祥寺駅周辺が他と比べて病院が集積しているようです。これを各指標毎に計算し、生成系AIの入力に利用しています。
どのような指標を子育て環境AIコメントで考慮するかについては、くふうカンパニーグループで子育てを行っている社員の方々と一緒に、子育てする上で重要なものはなにかについてブレストを行いました。ブレストでは特定の飲食チェーンは子供連れでも入りやすく、こういったチェーンがどれくらい周辺にあるかは重要そうだと盛り上がったりしました。次に、ブレストで上がってきた観点が商業利用可能なデータで計測可能なのかを調査しました。ブレストで盛り上がった観点のデータ利用が難しく、泣く泣く検討しないこととなったりした点は少し残念でした。
生成系AIパート
生成系AI(gpt-3.5-turbo)に対してプロンプトで、上記で作成した情報をCSV形式で入力し、入力された情報を踏まえた回答を行うように指示を出しています。これにより、地域の子育て環境について、事実に基づいた人が理解しやすい自然言語で説明が得られるようになっています。
まとめ
データサイエンスと生成系AIを組み合わせることで、不動産購入層に対してより多くの判断材料を提供することを可能にしました。この機能を通して、よりよい物件選びにつながるものと考えています。
今回は、不動産購入層に対する見せ方として、自然言語というやり方を取っています。データサイエンスパートで計算した指標やスコアの見せ方は自然言語以外にも、地図上にプロットするというやり方も考えられます。どのような見せ方が不動産検討者様にとって、よりわかりやすいのかを引き続き検証/模索していきたいと思っています。
最後に、くふうカンパニーグループでは、「くふう」で暮らしにひらめきを、という企業理念の実現のために、ユーザーファーストの価値観を重視しています。ユーザーファーストを具現化するための主要な手段として、私たちはAI技術の開発と活用に積極的に取り組んでいます。私達と一緒に、ユーザーファーストを体現し、新しい価値を創り出す機会に興味がある方がいましたらご連絡いただけると嬉しく思います!
この記事が気に入ったらサポートをしてみませんか?