【論文紹介】TFROM: A Two-sided Fairness-Aware Recommendation Model for Both Customers and Providers

文献情報

タイトル:TFROM: A Two-sided Fairness-Aware Recommendation Model for Both Customers and Providers
著者:Yao Wu, Jian Cao, Guandong Xu, Yudong Tan
会議:SIGIR 2021

概要

アイテムを推薦する際に、customerにとっての公平性(customer間で推薦精度のばらつきが小さい)とproviderにとっての公平性(provider間で推薦されるアイテムの露出度のばらつきが小さい)の双方を考慮した推薦手法TFROMを提案。

従来研究との差異

customerとproviderの双方の公平性を考慮した研究は少ないが、代表的な研究としてTheWebConf 2020で発表された「FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms」があげられる。この研究では、1つのproviderが1つのアイテムを提供するシチュエーション(飲食店の推薦など)を想定しているのに加えて、公平性を考える際に推薦結果のアイテムの順位を無視しているといった問題があった。本論文ではそれらを解決し、一般のECサイトのように1つのproviderが複数のアイテムを提供するシチュエーションを想定し、推薦結果のアイテムの順位も考慮している。

手法

本論文で定義している、customerにとっての公平性とproviderにとっての公平性を説明した後に、両者の公平性を満たす推薦手法について説明する。

customerにとっての公平性

何らかの推薦手法を使ってアイテムを推薦する際、全アイテムの全ユーザに対するスコアを計算し、各ユーザに対してスコアの高い順にk件ずつ推薦すれば、各ユーザの好みだけを反映した推薦結果となる。これに対して、後述のproviderにとっての公平性を反映すると、各customerの推薦結果中のアイテムを並び変えることになる。NDCGの考え方を使うと、並び替える前の推薦結果はアイテムがスコアの高い順に並んでいるのでDCGが最大となる理想的なリストであり、並び替えた後の推薦結果のNDCGは1以下になる。
このようにして全ユーザのNDCGを計算したときに、NDCGの分散が小さけければ、その推薦結果は全体としてcustomerに公平であると定義する。NDCGの分散が小さいとは、好みが十分に反映された推薦結果を受け取るユーザ(NDCGがほぼ1に近いまま)と、好みが十分に反映されていない推薦結果を受け取るユーザ(NDCGが大きく下がる)が混在せず、すべてのユーザが等しく推薦精度が下がることを意味する。

providerにとっての公平性

推薦結果の上位にあるアイテムほどユーザの目に触れやすいので、推薦結果の上位のアイテムほど「露出スコア」を多く獲得すると考える。全ユーザの推薦結果を見ることで、あるアイテムの総露出スコアが計算でき、さらにあるproviderが提供する各アイテムの露出スコアの平均により、そのproviderの露出スコアを計算する。
全providerの露出スコアの分散が小さいほど、その推薦結果は全体としてproviderに公平であると定義する。
この定義では、すべてのアイテムの価値を平等とみなしているが、「良いアイテムは露出も高いべきである」という考えを導入して、良いアイテムがたくさん露出した場合と良くないアイテムが少しだけ露出した場合の両者の露出スコアが等しくなるように重みをつけた定義もしている。ここでの「良さ」は、各アイテムの各ユーザに対する推薦スコアを使っている。

双方の公平性を考慮した推薦手法

全ユーザに対してk件のアイテムを推薦する場合、最初に既存の推薦手法を使って、全ユーザに対して推薦結果(推薦スコアの高い順=好みに適合する順にアイテムが並んだリスト)を生成しておく。
そのうえで、各ユーザに対して上記で生成した推薦結果の1位のアイテムを選ぶ。これで、1件のアイテムだけを各ユーザに選んだ時点での、providerの公平性が完全に満たせていた場合のproviderの理想的な露出スコア(全providerで共通)と、実際の各providerの露出スコアが計算できる。
次に、推薦スコアが高いアイテムを推薦してもらえたユーザの順に、2位のアイテムを選ぶ。その際、あるユーザに対する推薦スコアが2位のアイテムのproviderの実際の露出スコアが、理想的な露出スコアを超えていたら、露出過剰になっているので選ばない。代わりに、3位のアイテム、4位のアイテム、と順に見ていき、実際の露出スコアが理想的な露出スコアより小さいprovideのアイテムを2位として選ぶ。
このようにして全ユーザの2位のアイテムを選んだら、次は3位のアイテムを選ぶ、というプロセスをk回繰り返す。
上記はオフラインの条件での推薦だが、論文ではオンラインの条件での推薦手法も提案している。

実験

3種類のデータセット(Ctrip Flight Dataset、Google Local dataset、Amazon Review dataset)を使用。既存手法に比べて、customerのNDCGの分散とproviderの露出スコアの分散の両方を低くできていることを示した。

この記事が気に入ったらサポートをしてみませんか?