さあ、ここから何もかもを始めるのよ！！～ロジスティック回帰分析の勉強と、Ybarra氏論文批判の修正～

2021年9月24日 22:38

ゆっくりしていってね！！！！

この記事は、「表現の悪影響」論シリーズの第3弾よ！
第1弾と第2弾はこちら！

とはいえ、今日は論文そのものの検討はお休み。
間違ってしまっていたこともあり、お勉強をするのだわ。

というのも、第2弾でもTogetterまとめで紹介させて頂いたけれど、Twitterさんで次の御指摘をもらったのだわ。

p値が3.2×10^(-19)というのは、真には差がないものを、偶然今回の検査でサンプルが偏ったために差があると認定してしまっている確率が、3.2×10^(-19)という意味で、もう一度同じ試験をしたときに別の(影響がないという)結果が得られる確率は、客観的に見てきわめて低い。
— nekojita (@nek0jita) September 22, 2021

私、本業の「化学」で実験データを解釈するために多変量解析は何種類かやってきたのだけれど、オッズ比やp値、95％信頼区間を出すスキルは持ってなかったのだわ。
また、そもそものロジスティック回帰分析の知識もまるで不足していたわ。

p値が低いときの反論の糸口は「もう一度同じ試験をしたら別の結果が出るかもしれない」ではない(p値が高ければそういう反論を刷れば良いが)。また同様に、nが少ないということも反論の糸口にはなり得ない。p値が低いときにふさわしい対抗方法は、系統的誤差を疑い検証することである。
— nekojita (@nek0jita) September 22, 2021

こちらの御指摘をいただいた時点では、まだ正直釈然としてなかったんだけど（ごめんなさい！）、今日改めて自分で勉強してみたところ、完全に私が間違っていて、nekojitaさんの言うことが正しいと分かったわ。

悔しい悔しい！！　そしてお恥ずかしいわ！！
私もそれを知って出来るようになりたい！！！　私もそれがやりたい！！！
（訳：御指摘いただき大変ありがとうございます。当方の勉強不足でご迷惑をおかけし、大変申し訳ありませんでした。また、考え直すきっかけを頂戴でき、幸甚に存じます。）

アンケート回答間の相関分析というジャンルについて、私は自分なりに総説論文＋原著論文を読んで学んだ多少の知見と、自分が慣れている化学関連知識の範囲で批判を試みたけれど、まだ「不十分」かつ「欠陥」があったわ。

特に、ロジスティック回帰分析を全く分かっていなかったのが致命傷。

これは言い訳になっちゃうけど、だって、化学実験のデータ解析では使わない、私のジャンルだとロジスティック回帰分析を使っている論文を見たことすらないもの！

そのせいで、第1弾・第2弾のnote記事については、nekojitaさんのおっしゃる通り、批判として的外れになった部分があったわ。
具体的には、たとえば「67人というサンプルサイズの小ささ」を指摘するのは、本当の有効打にはならない。リプライをいただいた通りね。

今回はそれを修正するために、

①なぜ私は間違えてしまったか？（なぜ批判がずれてしまったか）
②正しくはどう考えるべきだったか？（ロジスティック回帰分析とは何か）
③自分でも最低限、データからオッズ比・p値・95％信頼区間が出せるようになろう。

以上の3点について述べさせてもらうわ。

「因果関係の立証」に関するイメージのズレ

これは自分の経験に引っ張られてたからね。「因果関係の立証」のイメージが完全に実験化学のそれだったから。

私がイメージしていた因果関係の立証プロセスっていうと、まずはこれよ。

Carl et al., 2007より引用（visited 2021/9/24）

有機化学系の人間が、親の顔よりも見ることになる景色ね。
他ジャンルの人には、ぜんぜん意味わからないと思うけどマジよ。名前は「三つ首丸底フラスコ」さん。

ざっくり説明すると、化学反応を調べるときによく使う実験器具なのだわ。たとえば、物質AとBを混ぜて、物質Cを合成する化学反応があったとするわね？　こんな感じに。

A+B→C

そんで、これに何らかの添加剤Xを入れて、もっとたくさん速くCが合成できないか試すとしましょう。

三つ首丸底フラスコさんを上手に使うと、ほぼ完全な対照実験ができて、因果関係を特定できるわ。簡単には、添加剤Xが①ない場合と②ある場合でそれぞれ実験して、結果が変化したら、それは添加剤Xが原因だと言えるわよね？

というのも、実験器具はもちろんのこと、温度とか圧力とか撹拌速度とか、投入する化学物質A及びBの量とか、溶媒の量といった結果に影響しそうな他の因子はガッチガチに固定してあるからよ。

その上で、再現性試験を何回もやって、また少し条件を変えて（典型的には、添加剤の量を増やしたり減らしたりね）――実験を詰めて詰めて詰めて――ようやく、「よし！　これなら因果関係がある！」と言うのよ。

これが私のイメージする「因果関係の立証プロセス」。

……え？　あなたの研究では、他の因子が固定できない？

だったら、ランダム化比較試験（RCT）で、他の因子の影響が完全相殺できるまで頑張るしかないでしょう。それ以外だと永遠に「相関」のままで「因果」とは違うわよね。私、何か間違ったこと言ってる？

――と、このくらいのノリだったのだわ。

ただ、この要求水準だと、「喫煙習慣が肺がんを引き起こす」すら、おそらく立証困難で、現代医学でもまだ確立していないことになるわ。喫煙について、ランダム化比較試験はたぶんやってないでしょう。（無理やり喫煙させるグループと、絶対に喫煙させないグループをランダムに作れるわけがない。）

ロジスティック回帰分析による原因特定

まあ、じゃあ「そんなの無理！」な時にどうしているかというと、それがロジスティック回帰分析のようね。

臨床研究センターの『ロジスティック回帰分析』のPDF資料が非常に分かりやすかったから、そちらから引用させていただくわ。

ここでは、まず「1年後の糖尿病の進行」の原因（１つとは限らないわ。基本的には複数の原因の複合でしょう。）を探るために、まず10変数（年齢、性別、BMI……）を因子として仮に決め、ロジスティック回帰分析を行っているわ。

Ybarra et al.（2011）の研究でいえば、「性的攻撃行動」とその原因と考えられる変数（性的表現との接触、家庭環境、アルコール・ドラッグの使用……）がこれに相当するわ。

谷岡健資『ロジスティック回帰分析』臨床研究センター（2019）, p.29.

そして、これらの10変数と「1年後の糖尿病の進行」との間の相関やオッズ比を見て、「特に影響する因子」を絞り込んでいくわけね。
「これはあんまり関係しないみたいだから捨てる。」「これはすごく関係するみたいだから保持。」ってイメージよ。

谷岡健資『ロジスティック回帰分析』臨床研究センター（2019）, p.33.

この手法は、どうしても因果関係の完全な確定とまではいかないのだけれど、各因子が結果（目的変数）に影響する大きさはオッズ比で分かるし、またp値やその95％信頼区間によって妥当性をある程度まで担保することはできるわ。

p値やオッズ比の95％信頼区間について厳密な説明は教科書に譲るとして、ここで最低限分かっていればいいのは、

p値：小さければ小さいほど変数間の関連が確かだと言える。よくある基準はp<0.05。
オッズ比の95％信頼区間：「4.0～6.0」みたいに範囲で出る値。その範囲に1（1は「関連なし」を意味する）が含まれておらず、大きな値かつ狭い区間であるほど良い感じ。（負の値でも可。その場合影響の作用は逆。）

くらいでしょう。

ただ、注意事項があって、それがnekojitaさんの御指摘でもあるのだけど、「p値が十分小さくて、オッズ比の95%信頼区間も十分大きな値で狭いが、その因子は真の原因ではなかった。」というパターンはありうる点よ。

その一つが系統誤差が関与していた場合で、具体的には、もっと大きなオッズ比を持つ因子がそもそも最初の検討に入っておらず、原因として特定した因子（例：性的表現）は、その因子を反映していたに過ぎなかったケースが考えられるわ。
Ybarraさんの研究では検討のうえで否定されていたけど、例えば「暴力的な環境の家庭にいること」が真の原因なのに候補に入っておらず、「性的表現に多く接すること」も「性的攻撃行動をとること」も実はその結果に過ぎなかったら、それはp値や95％信頼区間のチェックでは検出できないわ。

ロジスティック回帰分析は、あくまでも数式的な処理だから、現実の事情まで勝手に考慮してくれるわけじゃないってことね。

だから、Ybarraさんの研究結果を批判するなら、考えられる系統誤差の候補を出すのが最もクリティカルになるわ。それをやってくれたのがKeKさんね。

Ybarra et al. (2011)の研究で気になるのは、犯罪行動のリスク要因として有名なセントラルエイトのうちごく一部の影響しか排除できていない点。

特に、反社会的交友関係を調査していないのは不思議。https://t.co/HcLFaCbVte
— KeK (@kek_kuten) September 23, 2021

くっ……！！　それ、私が第2弾のnote記事で書いておきたかった！！！　悔しいのだわ、お恥ずかしいのだわ！！
（訳：私には勉強不足で書けるはずもないことでした。資料をご提示いただき、心より感謝申し上げます。）

……ふう。まあ、落ち着きましょう。
いえ、ダメージ受けてるの私だけだけど。

それはそうと。

Ybarraさんの言う「性的表現との接触によって、性的暴力行動を取る割合が6.5倍に増える。」は上記の系統誤差の疑念から相変わらず信じていないけれど、私が述べた批判では潰せないものだったと、ここで認めるわ。

というか、現実問題として、「性的表現→性的攻撃行動」で6.5倍はさすがに大きすぎない？　タバコが肺がんを起こすオッズ比すら3.3倍なのだわ（Fukumoto et al., 2015）。
……いえ、もちろん、異なるデータセットでオッズ比を直接比較しても意味がないのは分かってるけど……。
あと、タバコについては、国家統計でも、ちゃんと喫煙者率が下がるほどに肺がん患者率も下がってるし。性犯罪率・性暴力率はそうではないという違いもあるわね。

性表現について、国家統計とのギャップ指摘は、依然としてちゃんと意味がある批判の一部だと考えてるわ。

オッズ比・p値・95％信頼区間を出せるようになる

さて。私も情けないままでいたくはないし、ひとまずオッズ比・p値・95％信頼区間を算出できる体制を構築するわ。

やったことがないから、環境づくりからよ。

調べたところによると、EZRというアプリケーションを使うのが簡単そうだったから、それにしてみたわ。

上のアプリをパソコンにゆっくりインストールしたら、次の記事の手順に従うとオッズ比・p値・95％信頼区間が出せるわ。

せっかくだし、動作確認もかねてYbarraさんの論文データを使いましょう。ただ、そのままでは提供されてないから、私が論文を読んで自分でCSVファイルを作ったわ。

ただし、ちょっと面倒だったし、対象データは1年目のみ。Ybarraさんが出した値とは完全一致はしないだろうけど、まあ正しく動いていれば大体は合うはずよ。

そして、実際にやってみた結果がこちら！

オッズ比：7.5（Ybarra：6.5）
p値：8.5x10^-15
95%信頼区間：4.4～13.0（Ybarra：4.0～10.6）

うん。それっぽい結果になったのだわ！　大丈夫そうね！

おわりに

自分の批判が空ぶったのは残念で、また読者さんにも本当に申し訳なかったわ……。むきゅ……。

ただ、私はダメージを力に変えるタイプよ！

研究室では鬼舞辻無惨（※指導教官）に2年間にわたって「お前の論のダメなところ」を指摘されてはシバかれ続けたけれど、全部耐え抜いてやったのだわ！！

今回、まったく不案内だったロジスティック回帰分析について、とりあえず最低の最低の知見は確保。最も基本的な計算もできるようにした。因果関係の立証に関する資料（ガイドライン等）も色々追加で入手したわ。

手厳しい批判を受けるのは素晴らしいことよ。言われなかったら知らないままだったでしょうし、今回で確実に前進は出来たわ。それほど大した前進ではないかもしれないけれど……。

まあ、せいぜい頑張ってみるのだわ！

それでは今回の更新はここまで！
ここまで読んでくださった皆様、ゆっくりありがとう！

よろしければ、スキ＆シェア、Twitterのフォローをよろしくなのだわ。

ちょっと今回の内容でお願いするのは恥ずかしいけれども……。

この記事が気に入ったらサポートをしてみませんか？