論文執筆について思うこと ① ... 関連性・因果推論の表現は正確に
写真はマンチェスター大学の図書館。公開後、てにをは、ですます調、ちょっと説明を足したり微調整しています。タイトル変更。内容には変更なし。
このNoteは、回り道しつつ「論文を書くとき、気をつけるといいのではないか」と高い頻度で思ってきたことを書いています。特に科学論文を書いたりする方に読んで頂いて、生かしてもらえると嬉しいです。多くは私のこれまでの論文を査読した経験に基づいています(査読については受賞暦等ありこうした文章もユニークさが出てこうして綴ってみる価値もあろうという思案)。
「因果関係に関する表現は避けなさい」・・学術誌の指針
医学誌のトップジャーナルの1つであるJAMAの論文著者への指針では次の文章があります。
”Causal language (including use of terms such as effect and efficacy) should be used only for randomized clinical trials. For all other study designs (including meta-analyses of randomized clinical trials), methods and results should be described in terms of association or correlation and should avoid cause-and-effect wording.”
意訳すると
「因果関係を示す表現(効果や有効性などの用語の使用を含む)は、無作為化臨床試験にのみ使用するように。 他のすべての研究デザイン(無作為化臨床試験のメタ分析を含む)では、方法と結果について相関関係について記述すべきであり、因果関係の表現は避けましょう。」
となります。こうした緒言は多くの医学誌で(明言されていないかもしれませんが)採用されており、論文著者は表現に気をつけることが求められています。
具体的な例を挙げたいと思います。
たとえば、煙草の喫煙をし続けると肺がんを引き起こすか検証するのを目的に研究するとします。その一環として肺がんを患った人とそうでない人の過去の喫煙暦を比較して『症例対照研究』を行うとします。
あるいは数万人のがんを患っていない人たちの喫煙暦を調べ、さらにその人たちを数十年追跡して肺がんを発症するリスクが喫煙した経験のある人とそうでない人とで異なるか『前向きコホート研究』を行うとします。
JAMAや他の学術誌が注記しているのは、喫煙していた人ほど、肺がんを患った人の率が高かったとき、その結果をどう表現するかという点ですね。4例を挙げると、
1.喫煙により肺がんのリスクが上がることがわかった。
2.喫煙をしている人では、そうでない人と比較して肺がんのリスクが高くなった。
3 喫煙者は、非喫煙者と比較して、肺がんのリスクが高かった。
4.喫煙暦は肺がんのリスクと正の関係を示した。
となります。これでNGなのは1と2です。リスクの違いが確認できただけで上がったか下がったかとかは判らないからです。その点から3、4は表現として問題ありません。
そして結論の表記も同じ論調でなくてはなりません(肺がんのリスクが高くなる、上がるとは述べてはいけない)。研究で観察できたことを正確に述べなくては客観性が損なわれてしまいます。そういうわけで筋の通った指針と思います。
それに対する懸念の声が次。
「因果関係の議論は積極的に」・・専門家の提言
ハーバード大学のProf Miguel A. Hernánは次の論文でこのようなことを述べておいででした。
簡単に概要を述べると、
1.最近の医学論文は、因果関係を示すような表現を避けるように徹底している。多くの医学研究では因果関係に強い関心があるはずなのだが、その推論と明言を避け相関関係の程度について述べるのみに限ってしまっているのが現状だ。因果関係(Causality)を示すC-wordは穢れた表現かのように扱われてしまっている。
2.どのような介入や状況の、どのような効果を推定しているのか積極的に表現しなくてはならない。そうでなくては科学は進歩しないだろう。
(補足:上記の喫煙と肺がんの例をとるならば、喫煙と肺がんのリスクの相関関係から、どれほどの喫煙の経験がどれだけ肺がんのリスクを個人や集団で上げるのか検討するのがそもそもの目的でしょう。その目的として考えている因果効果がどれほどなのか明確に議論しないのは科学として不適当ではないでしょうか。・・ということです。)
こんなところです。研究自体に問題がありながらもその結果によって、推定したい因果関係、社会や個人への介入とその効果についてどんな意味を持っているのかという視点が欠けてしまうのはやはり良くないですね。多くの場合において、その視点を失っては研究自体に意味がないのではないかというのもごもっともかも。
学術誌側を擁護してみる
Prof Hernánの述べることも解るのですが、ただ学術誌側がC-word(Causality[因果関係]の表現)を避けろということを述べていることについても理解しています。それを平易に記したいと思います。
質の悪い論文の多くは結果について因果関係を示しているとは限らない結果を、あたかも因果関係があるかのように解釈して論文にしてしまう事例が多いのです。冒頭で挙げた喫煙と肺がんの関係については1,2のような解釈をするような論文です。
栄養系でもたとえば「朝食を摂っている人ほど糖尿病を患う人が少なかった」という集団を観察した結果が得られた際に「朝食を摂っていると糖尿病のリスクが下がった」と表現してしまうという様です。
薬などの医療の介入研究でも同様です。ある疾患を抱える患者さんの集団で、薬Mを飲んでいる患者、飲んでいない患者を比較して、その薬Mを飲んでいる患者ほど心疾患Dを患う率が低かったとき、「薬Mが心疾患Dのリスクを下げた」と表現してしまうのはNGです(註1)。たとえば薬Mを飲んでいられる病状の患者ほどそもそも比較的に健康で心疾患Dのリスクが低い可能性があります。そのために薬Mがリスクを下げたとは言えないのです。このように研究結果から言えることから逸した解釈は読者に誤解を与える内容ですので芳しくないわけです。
こうした問題は留まることを知りません。その改善の兆しが見えないために、学術誌側は冒頭のJAMAのように「因果関係を示すような表現は止めろ」と諦めともいえる指針を出しているのが現状と思います(註2)。
私は査読を多くこなしてきてこうした問題に幾度となく直面してきました。同問題について改善を求めるコメントを付すのですが効果も明白にみえず、問題の「蔓延」からすると焼け石に水かと思っています。ということで学会誌側が、「因果関係を示すような表現は止めろ」というのも理解している次第です。
ちなみに冒頭の論文著者のProf Hernánの論文ではこうした結果と解釈の問題のずれには触れていません。彼が述べているのは研究して得られた(上記のような)結果から因果関係を明確にしたいという目的を見失わずに評価することの大切さです。その評価についてもっと積極的になりましょうという具合です。
論文の執筆時の注意点
個人的に、医学系の学術誌が述べていることと、Prof Hernánが述べていることは矛盾しているとは考えていません。どちらの考えも尊重して自身が書く論文にも展開できると考えています。その際に心がけることのひとつは観察結果と解釈とを混同しないことといえるでしょう。
朝食を摂っている人と抜いている人の2型糖尿病のリスクの違いを例にとるなら、
1.朝食を抜いている人ほど2型糖尿病を患うリスクが高い
2.朝食を抜くと2型糖尿病のリスクが上がる/高くなる
の2点について、1点目は観察結果の記述であり、2点目は観察結果から考えた解釈です。これを区別することが絶対不可欠です。研究結果を報告する際に、観察結果と自分の推論とを混同するのは科学として致命的な問題とは思いませんか? その致命的な烙印を押されないようにするために、観察結果と解釈との区別が大事になります。
言いかえれば因果関係の表記の練り方で、科学者としての客観性が備わっているか否かが現れてしまいます。ですので論文を書く際には、因果推論をしたくても、観察結果と分けて考えましょう(註3)。
査読をした時、その論文の質がよく学術誌の読者層に合っていれば、編集者側に「再投稿を許可してもいいのではないでしょうか」と好意的な評価を与えます。その条件を満たす事柄の一つは(抽象的ではありますが)、「著者らが客観的に結果を評価でき、科学的な議論ができそうか否か」が挙げられます。このポイントを押さえる一手が、抄録で逸脱した解釈をしない、上記のような混同をしないことです。
英語の具体例(×な例、○な例)
冒頭の喫煙と肺がんのリスクについて例を挙げます(Never-smokersとの比較対照を明確にすべきですが簡潔化のため省いています)。
×.喫煙により肺がんのリスクが上がることがわかった。
×.喫煙をしている人では、そうでない人と比較して肺がんのリスクが高くなった。
Active smoking increased a risk of developing lung cancer.
Current smoking elevated incidence of lung cancer.
Current smoking was associated with an increased risk of lung cancer
○ 喫煙者は、非喫煙者と比較して、肺がんのリスクが高かった。
○.喫煙暦は肺がんのリスクと正の関係を示した。
Active smoking was associated with a higher risk of lung cancer.
There was a positive association between smoking status and lung cancer incidence.
という具合でしょうか。"increased risk"という表現が良くないのは、increaseかdecreaseか増減を観察したわけではないからです(多くの研究において)。朝食と糖尿病との関係を例にとれば(比較対照は省略)、
×.朝食を抜くと2型糖尿病のリスク/発生率が上がる
Skipping breakfast elevated the incidence of type 2 diabetes.
Skipping breakfast was associated with an increased risk of developing type 2 diabetes.
○.朝食を抜いている人ほど2型糖尿病を患うリスク/発生率が高い。
Skipping breakfast was associated with a higher risk of type 2 diabetes.
The more adults skipped breakfast, the higher incidence of type 2 diabetes.
という感じです。
私だけかもしれませんが、どんな論文を査読する際でも、観察結果と解釈・考察・推論の結果を分別してもらえると「あぁ、この著者たちはこうした議論に慣れている人だ。安心・・。」と流れが決まります。ぜひぜひ気をつけてもらえると嬉しいです。
おしまいです。似たような内容でまた記すかも。
#####
註1)そういう研究に過去携わったので思い出しつつ例にあげました↓
註2)P値とも同じことかもしれません。多くの研究者がP<0.05か否かで研究成果の価値を短絡的に判断してしまうために、正確に使ってくださいというのを[諦めて]もう使用を控えてくださいという流れもあるように。
註3)Prof Hearnánが論文で述べているのは、観察結果とその解釈の間に、観察結果が因果関係への興味の基で得られたものという考えになります。ですので、その緒言に従えば、喫煙者が非喫煙者と比して肺がんの発生率が2倍になると推定できたという例をとると、
1.Active smoking doubled the incidence of lung cancer.
2.Active smoking was estimated to double the incidence of lung cancer.
3.We estimated active smoking to increase lung cancer incidence two-fold.
という文章で、2と3の文章は良いだろうという考えになります。研究者がその因果効果の推定(estimate)を目的にして(問題点も含め)明確に筋を通すのであれば私はよい表記だなと思っています。
この記事が気に入ったらサポートをしてみませんか?