エビデンスレベルとは?
スゴ論の記事を何回か読んでいると、「エビデンスレベル」という言葉が必ず登場することに気づかれる方もいるかと思います。普段あまり耳にすることのないこの言葉ですが、いったいどのような意味なのか、どのような意図で記事に表記しているのか、簡単にまとめさせていただきます。
キーテーマ
エビデンスレベル
結論
エビデンスレベルとは、その研究の質を表す基準である。
解説
論文は基本的に何かしらの研究成果を発表するための媒体です。
しかし、一口に「研究」と言っても幅広く、その方法や形式によって論文の内容、さらには信憑性が大きく左右されます。
研究を手段・形式によってグループ分けし、それぞれのグループの信頼度の目安を基準として示したものがエビデンスレベルです。
一般的に使われているエビデンスレベルの元では、研究は大きく5つのグループ(レベル1~5)に分けられています(ソースによりグループ数が異なる場合もあるようです)。
レベル5が最も信頼度が低く、レベル1が最も信頼度が高い、というイメージです。
以下、レベル5から順番に紹介していきます。
レベル5:専門家による意見
文字通り、その分野の専門家がそれまでの経験やこれまでの観察を元に意見をまとめたものです。
何か具体的に根拠を示している訳ではないので、筆者である専門家のそれまでの実績等により信頼度が担保されている論文だと言えるでしょう。
レベル4:ケーススタディ(比較対象なし)
実際に起きた事例について観察を行った研究です。
例えば、「タブレット端末をとあるクラス内の生徒全員に配った後の、成績・授業態度の変化」という研究があるとすれば、このグループに属するでしょう。
欠点として、比較対象がないため結果の解釈がしにくいという点が挙げられます。
上の例でいうと、仮にそのクラスの生徒の平均点数がタブレット導入後に5%上がったとしても、比較対象がないため成績向上の要因をタブレット導入だと断定することは難しいわけです。
レベル3:ケーススタディ(比較対象あり)
実際に起きた事例について観察を行うところまではレベル4と一緒ですが、比較対象を加えた研究です。
例えば、「タブレット導入クラスと未導入クラスの間における、成績・授業態度の推移の比較」はこのグループに属すると言えます。
タブレット導入クラスで5%成績が上がり、未導入クラスで2%成績が下がったとすれば、タブレット導入が何かしら成績向上に寄与しているという仮説の信頼度が強まりますよね。
ただし、欠点として、ケーススタディであるがゆえに外部因子の影響を受けている可能性が否定できないということが挙げられます。
上の例でいうと、タブレットの有無とは関係なく、クラス間における生徒の違い・先生の違いが成績推移の差につながったのではないか、という反論が成立してしまうわけです。
レベル2:対照実験
アサガオの葉にアルミホイルを巻き、ヨウ素液を使って光合成について観察する実験を覚えているでしょうか。
あらゆる条件を人為的に整えた実験下で観察を行うことで、外部因子の影響を最低限におさえようとする研究がこのグループにあたります。
スゴ論が扱うような教育分野では、人についての研究であるという性質上、完璧な対照実験を行うことはとても難しいといえるでしょう(被験者一人一人の性質が異なるため)。
こうした場合は実験の組み立て方や母集団の大きさによって信頼度が大きく変わってくるため、研究者の手腕が問われるグループであるといえます。
レベル1:メタアナリシス
レベル2-レベル4の研究を大量にまとめ、統一した基準のもとに結果を総括した研究です。
細かい文脈を捉えることはできないものの、「全体としてこのような傾向がある」という結論を導き出すために有効な研究です。
エビデンスレベルの考え方
*筆者の解釈と意見が含まれています。
「エビデンスレベル=研究の質」と聞いてしまうと、レベル5や4の論文がまるで1や2の研究に劣っているように聞こえてしまいますよね。
はたしてそうなのでしょうか。
これは筆者個人の意見なのですが、エビデンスレベルはその分野の成熟度を間接的に表しているといえると思います。
前提として、学問分野に関する研究は一つの論文や研究で完結することはなく、多くの研究者の努力によって、仮説が少しずつ積み重ねられながら進められていきます。
例えるなら、「真実」が存在する上の方向に向かって、少しずつ積み木を積み上げたり崩したりしていくことを続けていくようなものです。
例えば、レベル5(専門家の意見)は、「こんな考え方があるんじゃないだろうか?ここに積み木を積み上げていってみようよ」という呼びかけと捉えることができます。
この呼びかけに共感する人が多い場合、「確かに!その考え方が正しいとすると実生活におけるこの現象が説明できる」「もう少し厳密に考察してみよう」等々、レベル4・3・2の研究が進んでいくわけです。
そして時がたち、ある程度積み木が積みあがったところで、一歩俯瞰して出来上がった構造物の出来栄えや特徴を確認するのがレベル1(メタアナリシス)だといえます。
エビデンスレベルはその研究の良し悪しを判断するものではなく、その分野にどのように貢献しているかを示している基準だとも言えるかもしれません。
まとめ
実はエビデンスレベルという考え方は教育学や社会学、心理学の分野で使われることはほとんどなく、主に医学の文脈で活用されています。
「何か研究の信頼度を読者の皆様に簡潔に伝えられないか」という模索の結果、スゴ論では採用に至ってます。
ここまで読まれてお気づきの方もいるかもしれませんが、エビデンスレベルは私たちにとって「良心」と「保険」の二つの意味合いを兼ねるものです。
できるだけ信頼性の高い情報を届けることを目的としているスゴ論ですが、100%正しいというハードルの高さゆえに、最終的な判断・解釈は読者の皆様に委ねています。
スゴ論の記事の中でもし印象に残るような研究を見つけたら、是非そのエビデンスレベルをもとにご自身で解釈を加えてみてください。
文責:山根 寛
Wright, James G. MD, MPH, FRCSC; Swiontkowski, Marc F. MD; Heckman, James D. MD Introducing Levels of Evidence to The Journal, The Journal of Bone & Joint Surgery: January 2003 - Volume 85 - Issue 1 - p 1-3
https://journals.lww.com/jbjsjournal/Fulltext/2003/01000/Introducing_Levels_of_Evidence_to_The_Journal.1.aspx
この記事が気に入ったらサポートをしてみませんか?