ディズニー映画RCTから考えるリスクヘッジ

リスクヘッジの論文トピック選び Part3 です。

2020年5月11日に JAMA Network Open からザワザワした論文が出たが、そのタイトルなんと

Effect of Viewing Disney Movies During Chemotherapy on Self-Reported Quality of Life Among Patients With Gynecologic Cancer - A Randomized Clinical Trial

つまり抗がん剤治療中にディズニー映画を観ることがQoLに影響を及ぼすかというRCT。

かなりリッチな雰囲気がこの時点で充満しているのだが

まず解釈のためのポイントを押さえておくと

  • 著者はディズニーの回し者では無い(Disney とのaffiliation やfundingは無い)

  • フルの原著論文

  • BMJ Christmas Issue のようなネタ特集では無い

なかなかツッコミどころがあると思うので、僕が考えるハイリスクなプロジェクトの実践編としてレビューしてみる。

-------------------------------

もし僕が腫瘍内科医でRCTの経験が豊富で研究費が5億円あってウォルト・ディズニーを崇拝していたとしても

このプロジェクトはリスクが高すぎるので手を出さないと思う。

リスクが高いと思う理由は無数にあるのだが、

1. 介入選択の動機が弱い。

まず真っ先に気になったのが、なぜこのヘンテコな介入に行き着いたのか

ということで、理由が書かれているはずのBackgroundを読んだのだがディズニー映画を選んだことに関しては、

  • ウォルトディズニーの思想が素晴らしかったから

  • 音楽がいい

  • 向社会的行動 (prosocial behavior)を助長するかも

みたいな微妙なことしか書かれていない。

このディズニー縛りの動機に僕がこだわる理由は、何か臨床的に意味のある、ディズニー映画のユニークな性質に動機が置かれていないと、結果の解釈の仕様がないと思うから。

型破りなインターベンションである分、「その時代のこういったコンセプトをもとにしている映画」、とかもっと普遍的な基盤があるべきだと思うのだが。

また、ディズニー映画というカテゴリー内にムラがありすぎるのでこの括り方を選んだことによる話題性以上のポイントが分からない。

余談だが「ディズニー映画」というワードを論文内で使えたのも気になる。

商標ってこんな露骨に書いてはいけなかったはず…?

例えば Impella vs. IABP のスタディーでImpella は 'Intravascular microaxial left ventricular assist device' という仰々しいジェネリックな言い方に直されていた。

一応Instructions for Authorsでは

Names of Drugs, Devices, and Other Products

Use nonproprietary names of drugs, devices, and other products and services, unless the specific trade name of a drug is essential to the discussion.

という書き方がされているのでやはり「ディズニー」で通せたのは謎。

論文のポイントとして重要な場合は 'unless...' という例外もあるようだが、やはりこの介入をディズニー映画の括りとして説明しなければいけない理由はかなり弱いと思う。

2. ディズニー映画の選定基準やデザインに突っ込みどころが多々

どのディズニー映画だったのかはもちろん大事で、

ドイツ語でシンデレラ、メリーポピンズ、ロビンフット等の8タイトルが用意されていてそのうち6つを介入群の患者が選んで観たらしい。

そして懐かしさ要素を含めるために、オリジナルの一番古いバージョンに絞られたらしい。

また、ダンボやバンビなどの悲しいシーンがある映画はexcludeされたとのこと。

でもシンデレラの最初の方も結構悲しかったような...

映画のハッピー度をシステマティックに選ぶ方法があるのかは分からないが、もはやディズニー映画ではなくて何やらハッピーで懐かしい映画、という縛りな気がする。

商標の記載の件もあるので、「ディズニー映画」という介入の表現が尚更しっくりこない。

そしてサンプルサイズ計算。2回の測定間に0.5 SDの差が出るとして…って既存スタディーの引用が全くない割に結構大きい数字が放られている。そして2回目以上は1.0 SDという仮定もすごい。

この攻め気味な設定ではじき出したサンプル数がn=44でめちゃくちゃ少ないのにその数ギリギリでやってみて有意差が出て著者的にはハッピーエンド

だったけど、これパワー計算がロジカルでないので パワー不足のポテンシャルを含めてnull になっていた可能性はかなり高かったはず。

この謎デザインで引用スタディーもろくに無い(サンプル数計算に使う情報が少ない)のに予測されたサンプル数が極少で、もしnullだった場合は確実に終了のお知らせだったのに、

なぜか上手くいった。

あえて言えば、比較群はテレビや映画を観てはいけなかったらしく、治療中ただひたすらボーッとしていなければいけなかった(?)のでむしろ比較群のQoLがreal worldのレベルより下がったことにより0.5 SD のeffect sizeが満更ではなくなったのかも知れない。

まぁ、どうでもい

この記事が気に入ったらサポートをしてみませんか?