芋出し画像

🧠Shapではかろう

SHAPSHapley Additive exPlanationsは、機械孊習モデルの予枬を解釈するために䜿甚される手法です。これは、協力ゲヌム理論に基づいたアプロヌチを採甚しおおり、各特城がモデルの予枬に䞎える寄䞎を定量的に評䟡したす。


SHAPSHapley Additive exPlanations倀の基瀎には、ゲヌム理論から来たシャヌプレむ倀がありたす。シャヌプレむ倀は、ゲヌム理論の抂念であり、耇数のプレむダヌが共同で生み出す「ゲヌム」の総利益たたは結果を、各プレむダヌが公平に受け取るべき貢献床に基づいお分配する方法を提䟛したす。

シャヌプレむ倀の原理

シャヌプレむ倀は、党プレむダヌこの堎合はモデルの特城たたは入力倉数の各組み合わせにおいお、特定のプレむダヌがゲヌムの結果にどれだけ貢献するかを蚈算したす。これは、すべおの可胜なプレむダヌの組み合わせにおけるそのプレむダヌのマヌゞナル貢献の平均を取るこずで行われたす。蚈算は、特定のプレむダヌを含む堎合ず含たない堎合の「ゲヌム」の䟡倀結果の差異に基づいおいたす。

SHAPの䞻な特城ずしおは以䞋の点が挙げられたす

  • フィヌチャヌの重芁性SHAPは、モデルの各フィヌチャヌが予枬にどの皋床圱響を䞎えおいるかを明瀺したす。これにより、特定の予枬に最も圱響を䞎えるフィヌチャヌを特定できたす。

  • モデルの解釈可胜性SHAPは、モデルの「ブラックボックス」性を解消し、その意思決定プロセスをより透明にしたす。

  • 汎甚性SHAPは、任意の機械孊習モデルに適甚可胜です。

SHAPの実装では、たずSHAPラむブラリをむンストヌルし、機械孊習モデルをトレヌニングした埌にSHAP Explainerを䜿甚しおSHAP倀を蚈算したす。これらの倀は、サマリヌプロット、䟝存床プロット、フォヌスプロット、ディシゞョンプロットなど、様々な芖芚化手法を通じお衚珟できたす。これにより、モデルが特定の予枬を行うための理由を理解し、モデルのデバッグ、フィヌチャヌの重芁性の識別、モデルの説明、バむアスの特定などが可胜になりたす。

SHAPの䜿甚により、モデルの解釈可胜性ず透明性が向䞊し、ナヌザヌや芏制圓局からの信頌を埗やすくなりたす。モデルが特定の予枬を行った理由を説明するこずで、朜圚的なバむアスをデバッグし、デヌタの問題を特定し、モデルの決定を正圓化するのに圹立ちたす。

SHAPSHapley Additive exPlanations倀の蚈算には、協力ゲヌム理論に基づいたシャヌプレむ倀を䜿甚しお、機械孊習モデルの予枬に各特城がどれだけ寄䞎しおいるかを蚈算したす。SHAP倀の蚈算プロセスは以䞋のステップで構成されたす

  1. 特城の党可胜な組み合わせ連合を䜜成したす。

  2. モデルの平均予枬を蚈算したす。

  3. 各連合に察しお、特城 F がない堎合ずある堎合のモデルの予枬倀の差を蚈算したす。

  4. 各連合で、特城 F がモデルの予枬を平均からどの皋床倉えたかを蚈算したす。これが F の呚蟺寄䞎です。

  5. SHAP倀は、ステップ4で蚈算された倀の平均、぀たり F の呚蟺寄䞎の平均ずなりたす。

数孊的には、SHAP倀は次の匏で衚されたす


シャヌプレむ倀は、効率性、察称性、ダミヌ、加算性ずいった特性を満たす唯䞀の解ずされおおり、SHAPもこれらの特性を満たしおいたす。SHAPは、局所的な粟床、欠損倀ぞの察応、䞀貫性ずいう3぀の望たしい特性を蚘述しおいたす。

SHAP倀の蚈算は、特に特城が倚い堎合には蚈算量が指数関数的に増倧するため、実際には近䌌方法が䜿甚されるこずが䞀般的です。近幎、LundbergずLeeによっお発衚された論文では、SHAP倀を蚈算するための効率的な手法が提案されおおり、shapラむブラリを通じおPythonで容易に䜿甚できたす。

Lundberg and Lee (2017)69 によるSHAP (SHapley Additive exPlanations)は、個人の予枬を説明する手法である。SHAPはゲヌム理論的に最適なシャプレヌ倀に基づいおいる。

https://christophm.github.io/interpretable-ml-book/shap.html

SHAPがシャプレヌ倀のサブチャプタヌではなく、独自のチャプタヌずなった理由は2぀ある。第䞀に、SHAPの著者たちは、局所代理モデルから着想を埗たシャプレヌ倀のための代替的なカヌネルベヌスの掚定アプロヌチであるKernelSHAPを提案した。そしお、ツリヌベヌスのモデルのための効率的な掚定アプロヌチであるTreeSHAPを提案した。第二に、SHAPにはシャプレヌ倀の集玄に基づく倚くの倧域的解釈手法が付属しおいる。

予枬は、むンスタンスの各特城倀が、予枬を配圓ずするゲヌムの「プレむダヌ」であるず仮定するこずで説明できる。シャプレヌ倀-連合ゲヌム理論からの手法-は、特城間の「配圓」を公平に分配する方法を教えおくれる。

https://christophm.github.io/interpretable-ml-book/shapley.html#shapley


シャヌプレむ倀が持぀「効率性」「察称性」「ダミヌnull player」「加算性」ずいう四぀の特性は、ゲヌム理論における公平な䟡倀分配を定矩する重芁な原則です。これらの特性により、シャヌプレむ倀はある皮のゲヌム特に、転送可胜な効甚を持぀協力ゲヌムにおける唯䞀の公平で合理的な解ず芋なされたす

1. 効率性 (Efficiency)

ゲヌムの総利埗党プレむダヌによっお生み出される䟡倀は、党プレむダヌに完党に分配されたす。぀たり、ゲヌムから埗られる党利益は、党プレむダヌのシャヌプレむ倀の和に等しくなりたす。これにより、利益たたは費甚が無駄なく、たた䜙分に発生するこずなく分配されるこずを保蚌したす。

2. 察称性 (Symmetry)

二぀のプレむダヌがゲヌムにおいお等䟡な圹割を果たす堎合すなわち、䞀方が他方ず眮き換え可胜である堎合、これらのプレむダヌは同じ䟡倀シャヌプレむ倀を受け取りたす。これは公平性の芳点から、等䟡な貢献には等䟡な報酬を䞎えるべきであるずいう原則に基づいおいたす。

3. ダミヌ (Null Player)

「ダミヌ」プレむダヌ、぀たりゲヌムの結果に䜕の圱響も䞎えないプレむダヌのシャヌプレむ倀はれロです。これは盎感的に理解しやすく、貢献のないプレむダヌには報酬もないずいう原則を瀺しおいたす。

4. 加算性 (Additivity)

二぀以䞊のゲヌムを合成する堎合、各プレむダヌのシャヌプレむ倀は、個々のゲヌムでのシャヌプレむ倀の合蚈ず等しくなりたす。これにより、異なるゲヌム状況やタスクからのプレむダヌの総貢献は、それぞれのゲヌムにおける貢献の単玔な合蚈によっお蚈算できるずいう性質を持っおいたす。
これらの特性は、シャヌプレむ倀が持぀解の公平性ず䞀貫性を数孊的に定矩し、それを他の任意の䟡倀分配方法ず区別する根拠ずなりたす。これらの条件を満たす䟡倀分配方法は、シャヌプレむ倀以倖に存圚しないこずが蚌明されおいたす。そのため、シャヌプレむ倀は、プレむダヌ間で埗られる利益たたは費甚を分配する際の「唯䞀の解」ず芋なされるわけです。


お願い臎したす