推薦システムの古典的手法

furufuru

2019年12月7日 03:20

こんにちは！
IT企業でデータ活用プロダクトの開発に従事しているrilmayerです。
この記事はアドベントカレンダー「Search&Discovery 全部俺」6日目の記事となります。

寝るまでが今日です！汗

今日はSearch&Discoveryの2本柱の一つである推薦システムについて、その基本的な課題感やそれをどのように解決してきたかについて紹介しようと思います。

3つの素材　アイテム・ユーザー・アクション

古典的な推薦システムは主に「アイテム」、「ユーザー」、「アクション」の3つの情報を活用して推薦を行います。

素材① 　アイテム情報

アイテムと言うのは商品や本、音楽、動画などを指します。
本の場合、著者やタイトルと言った「フィールド（ゾーン）」と言う情報を持っています。このような情報を素性と言います。
こうした素性は、うまく変換することでベクトルとして表現することができます。

例えば古典的な検索の課題で触れた単語ベクトルがその例です。
例えば本には値段や著者、出版社、そして本文などの情報があります。
それらをまとめて以下のような素性ベクトルを作ることができます。

ベクトル化、すなわち数値の配列として表現することができるとコンピューターで様々な計算ができるので大変便利です。

素材②　ユーザー情報

ユーザー情報としては公開されているプロフィールを利用することができます。プロフィール情報は主に以下の2つの種類に分けることができます。

人口統計（デモグラフィック）情報
年齢、性別、職業や住んでいる地域などです。

興味・関心情報
自分の興味のあるカテゴリやトピック、キーワードなどを公開することができる場合があり、それらがユーザーの興味関心です。

例えばユーザーのデモグラフィック情報・興味関心はアイテム情報と同様に以下のような形でベクトル化できます。

素材③　アクション（行動ログ）

アクション情報はユーザーがアプリケーション上で行動した際の情報です。ユーザーとアイテムの相互作用となります。
例えば、ECサイトであればどのユーザーがどのアイテムを購入、クリックしたかなどです。イラスト投稿サイトであれば、どのユーザーがどのイラストをいいねしたとか、どのユーザーがどのイラストを投稿したとか言った情報になります。

推薦方法：ユーザーにとってそのアイテムはどのくらい良い？

ここからは素材として紹介した情報を活用してユーザーに対してより良いアイテムを推薦する方法（どのような方法で推薦するか）を説明していきます。

古典的な推薦では「類似している」ことを目指して、とあるユーザーに対して類似したアイテムを推薦する方法が模索されてきています。
古典的な方法としては大きく分けると以下の3つに分けられます。

・ユーザーとアイテムの「類似度」を測って似ているアイテムを推薦する（素性ベクトルベース）
・とあるユーザーに似ているユーザーが過去に良いとしたアイテムを推薦する（強調フィルタリング）
・上記2つを組み合わせる方法

おわりに

今日は推薦システムの古典的な手法についてその概要を説明しました。
数式をあまり使わないふわっとした説明になっているためサクッと読めるといいなと思っています。

次回は評価などについてお話しようかと思います。

参考図書

こちらに書いてあります。

この記事が気に入ったらサポートをしてみませんか？

推薦システムの古典的手法

推薦システムは目的に沿ったアイテムをユーザーに届ける

3つの素材　アイテム・ユーザー・アクション

素材① 　アイテム情報

素材②　ユーザー情報

素材③　アクション（行動ログ）

推薦方法：ユーザーにとってそのアイテムはどのくらい良い？

推薦方法①　素性ベクトルベース（内容ベース）

推薦方法②　協調フィルタリング

おわりに

参考図書

推薦システムの古典的手法

推薦システムは目的に沿ったアイテムをユーザーに届ける

3つの素材 アイテム・ユーザー・アクション

素材① アイテム情報

素材② ユーザー情報

素材③ アクション（行動ログ）

推薦方法：ユーザーにとってそのアイテムはどのくらい良い？

推薦方法① 素性ベクトルベース（内容ベース）

推薦方法② 協調フィルタリング

おわりに

参考図書

3つの素材　アイテム・ユーザー・アクション

素材① 　アイテム情報

素材②　ユーザー情報

素材③　アクション（行動ログ）

推薦方法①　素性ベクトルベース（内容ベース）

推薦方法②　協調フィルタリング