一人に対して複数データポイントがある場合の相関について

単純に20人の体重と身長を測ってその相関を出すのはピアソン相関とかで簡単だ。散布図にすると20点あることになり、おそらく右肩上がりの相関が得られるだろう。

そうではなく、たとえば上記のケースにおいて、一人が1年に1回10年分、身長と体重を計測した場合はどうすればいいのだろうか?

その場合、点の数は20x10=200点になる。
それをそのまま散布図にして、ピアソン相関を求めることは問題がありそうだ。
実際、このような手法は各点に独立性があることを仮定している。しかし、この例では10点は同じ人の身長・体重ということになるから、独立性が担保されていない。よって問題が生じうる。

Repeated Measures Correlation

そのような際にどうするか?以下の論文が答えになる。

これはRepeated Measures Correlationというもので、日本語に直すと反復測定相関という感じ。
論文のfigure1をみれば、その考え方がすぐにわかるだろう。
要するに、各参加者ごとに相関を出してそれを統合するようなイメージ。

PythonとRのパッケージ

https://lmarusich.github.io/rmcorr/

これを実装するパッケージがPythonとRにある(Matlabにはなさそう)。
Rのパッケージは以下

Pythonのパッケージは以下

この記事が気に入ったらサポートをしてみませんか?