Validity and Efficiency of Approximation Methods for Tied Survival Times in Cox Regression

2020年6月13日 12:37

Irva Hertz-Picciotto and Beverly Rockhill
BIOMETRICS 53, 1151-1156
Sep. 1997

1. Abstract

セミパラメトリックなCox 比例ハザードモデルは，生存時間の確率分布を仮定していないため，サンプルのイベント発生順をもとに尤度の式を決定するモデルである．分析に使用するサンプルを常にモニタリングすることができていれば，生存時間およびイベント発生時点を正確に計測できるが，現実問題としてそれは難しいのが常である．本論文では，計測の頻度（サンプリングレート）が十分でなく，複数の観察対象においてイベント発生時刻が見かけ上 tie（同時刻）となってしまうような場合，どの尤度近似手法が統計的に良いかを擬似データにて検証した．「Breslow の近似手法」，「Kalbfleisch-Prentice の近似手法（K-P の近似手法）」，「Efron の近似手法」の 3 つを比較したが，Efron の近似手法が推定パラメータのバイアス，信頼区間の両方の点で優れていた．
通常，多くの統計ソフトウェアでは Breslow の近似手法が default となっているが，特に，サンプルが打ち切りなどの理由によって少ないような時は Efron の近似手法が好ましい（ちなみに R は Efron が default なので意識せずに使用して良いと思われる）．

2. Methods

上から順に Breslow の尤度近似式，Efron の尤度近似式，K-P の尤度近似式となる．
K-P の近似式は Cox 比例ハザードモデルにおける Cox 尤度と似た形となっている（tie がない場合を考えれば Cox 尤度そのもの）．打ち切りは，R_i（risk set）の形で全 3 式の中に含まれており，それぞれの形で考慮されている．

3 つの尤度近似手法の検証実験の条件は以下の通り．

1. ハザード比が 2 倍異なる 2 つの集団（base hazard rate 集団と high hazard rate 集団の 2 つ）を仮定し，それぞれのサンプル数は同数（それぞれ n 個）とした．

2. それぞれの集団のサンプル数 n は，25, 50, 250, 500 個と 4 種類で試行

3. 最長のイベント発生時点（通常はハザード比の小さい方の集団のサンプルのものとなる）と開始時点を k 個の区間に離散化することで，tie となるサンプルを意図的に発生させる．k は 0.1 x 2n, 0,2 x 2n, 0.4 x 2n の 3 種類で試行．平均的には，それぞれ 10, 5, 2.5 個の tie となるサンプルが各区間で得られることになる．

4. 3 つの近似手法，4 種類のサンプル数，3 種類の離散区間を試行するため，全 36 種類分のシミュレーションを行うことになる．

3. Results

各集団のサンプル数が 25, 50, 250, 500 であった場合のそれぞれのシミュレーション結果が以下の 4 つの表（上から順に Table1: n=25, Table2: n=50, Table3: n=250, Table4: n=500）となる．

全部で 9 x 4 Tables = 36 種類分のシミュレーション結果があるが，推定すべき β は，log(2) = 0.6931 が真の値である．この結果から以下のことが分かる．

・基本的な傾向として，生存時間の計測タイミングが多く離散化された値の数（表内の Number of categories）が多くなるにつれ，β の最尤推定値は真の値である 0.6931 に近づく．

・Breslow の近似手法と K-P の近似手法のバイアスの大きさはほぼ同程度だが，Breslow の近似手法は β を過小評価する傾向にあるのに対し，K-P の近似手法は過大評価する傾向にある．

・Efron の近似手法は，他の 2 つの近似手法と比較してバイアスがどの条件でも小さい傾向にあり，信頼区間でみたときのカバー率も高い．
また，信頼区間の上下対称性も良好であり，総じて良い結果を示している．

以上の結果から，tie が多そうな場合は，Efron の近似手法を使うのが良さそうである（あくまでも適合度の観点では）．

この記事が気に入ったらサポートをしてみませんか？