見出し画像

甘味料摂取とがんリスクとの関係に関する論文への懸念

先日、WHOから一種の甘味料の摂取が悪性腫瘍発生(がんのリスク)と関係するかもしれないという主旨の発表がありました(註1)。その発表内容を支えるヒト研究のエビデンスは私の知る限り低質です。ヒト研究のうち、核となるものは次の論文ですが、これについて私は批判的な考察を抱いています。その内容をこのNoteでは紹介します。

Debras, C et al., Artificial sweeteners and cancer risk: Results from the NutriNet-Santé population-based cohort study, PloS Medicine, 2022

次のように、4つのポイントに絞って紹介しまとめたいと思います。ちなみに、後述しますがここに記載する問題はこの論文に限った話ではなくよくある話です。また甘味料の健康への良し悪しは別の話とします。

1. インターネット上で行った調査・・自己申告による食事摂取

多くの栄養疫学研究では、自己申告による食事調査結果を用いて、その妥当性が課題になります。この研究では「昨日、何食べた?」という情報を2~15回に渡ってインターネット上のシステムを使って調査し検討しています(24時間思い出し法)。自己申告ですから、当然、その妥当性、つまりきちんと量的に測定したいものが測定できているか否かが問題となるわけですね。

この検討については同研究グループにおいて実施されています(註2)。その妥当性の程度は割愛しますが、大事なのは次の問題点。この「昨日、何食べた?」という測定はこの研究では「オンラインのシステムを使って得た自己申告による情報」(1日分)でした。この情報の妥当性の検討にはそれより質の良い情報と比較することになります。ここでの比較対象は、「同じ食事」について「栄養士がインタビューを通じて自己申告してもらった情報」でした。

つまり妥当性の研究に参加した人たちは同じ食事を同じ日に、違う方法で思い出したわけです(オンラインのものを最初にやり、次にインタビューを実施)。これについて問題が2点あります。

①     この対照の仕組みでは、思い出すのが容易で、思い出しやすいもの、思い出しにくいものが共通します。当然、2つの方法によって測定された食品摂取量や栄養要素摂取量は(本当は妥当でなくても)相関することとなります(妥当性が過大評価される)。
②     日常の、習慣的な摂取量の程度の妥当性は不明なままです。一個人に対して1日分の24時間思い出し法の結果を調べただけで、季節ごとや週末と平日との違いなどを押さえた習慣的な摂取量の妥当性はわかりません。

このコホート研究では長期的な健康への影響を主目的としているため、②については、習慣的な日常の摂取を把握できる方法・手段(たとえば年間にわたる食事記録法や血中リン脂質の脂肪酸など)による項目を妥当性検討において対照とするべきでしょう。①②の問題を抱えているようでは妥当性を検討するものとしては非常にお粗末な研究なのです(それでも栄養学学会誌に報告されてしまうのも問題)。

習慣的な摂取量を把握したものとして甘味料の摂取とがんのリスクとの関係を検討するのであれば、上記2点の問題点は深刻です。いくら妥当性があると主張されても信用できないというのが私の個人的な意見です。

2. インターネット上で行った調査・・自己申告による体重、身長、”体格指数” (BMI)

 上記の食事摂取と同様、体重や身長も自己申告なのがこの研究の特徴です。そしてその妥当性の研究も伴います(註3)。健康に関するインターネット調査に参加したフランス人(女性多め)というと、自己申告による身長・体重の情報というとどのようなバイアスを懸念しますか?

想像に難くないと思いますが、疫学研究でも長らく認知される通り、体重は低く報告され身長は高く自己申告されるという結果が得られました。そして分母に身長、分子に体重をもつBMI(kg/m2)という体格や肥満の程度を示す指数は余計に真値からずれます。人によっては-3.0 kg/m2ほどと真値からのずれが報告されています。これは身長160cmの人であれば±5 kg強体重の誤差を呈することを意味しています。

甘味料とがんリスクとの関連性を検証した研究では、統計解析において「BMIで補正した」という処置がなされています。これは体重があり肥満に近い人ほどがんのリスクは高く、さらに甘味料の摂取は高くなることが予想されるため、BMIは「交絡因子」として考えられるから、「太り具合について皆、一緒だったら」と仮定できるよう統計的にモデリングしたわけです。この考え自体は賛同できる妥当な考えと思います。

しかし、BMIの測定誤差を考えるとその処置の正確性は疑わざるを得ません。この研究についてはその測定誤差を鑑みて結果を解釈する必要があります。しかしそれはなされていません。(細かい視点として、肥満に近い人ほど体重を小さく自己申告し、そんな人ほど食品摂取の推定も誤る傾向も考えられます。そうした差異誤分類と呼ばれる事象の可能性についても無配慮な論文でした。)

1点目、2点目とインターネット上の自己申告に伴う問題ですが、栄養疫学においてはよくある妥当性に関する懸念というわけです。その問題の規模は残念ながら外からは解りません。しかし、たとえば仮に体格(BMIや肥満の程度)について正確に補正ができていれば、交絡因子の方向性から考えて関連性は報告されたものよりかなり低くなると予想できます。そうした可能性については論文著者は知らぬ存ぜぬという様なのが非常に残念です。

3. 結果が不安定

論文著者は複数回(2~15回)の食事調査結果より平均値(i.e. 2~15日分)を得て、その個人の摂取量により分けた3群(摂取量ほぼゼロ、低い摂取、高摂取)についてがんのリスクを比較する解析を行いました。メインの結果の1つとして、たとえばアスパルテームの摂取が高い女性は、乳がんのリスクが摂取量ほぼゼロの人と比較して22%高かったそうです(95% 信頼区間1〰48%)。ハザード比にして、1.22(1.01〰1.48)でした。

一般的に食事調査の回数が多いほど妥当性が高いと実証されています。その点に着目してか、論文著者は食事調査を2回、あるいは3回しか行っていない研究参加者(約三分の一の人たち)を除外して再解析を行いました。4回以上の食事調査を行っている人なのでより習慣的で正確な食事摂取の情報が得られていると予想されます(定かではありません)。

その結果は補助資料(メインの論文ではなく学術誌のオンラインにのみ用意されているもの;Supplementary Appendix、Table G)に掲載されています。その結果は、ハザード比にして1.07(0.87〰1.32)というもので有意な関係があるとは言えそうにない推定値でした。

関連の強さが、解析の条件を変えただけで66%ほども減衰したということになります(ハザード比1.22→1.07)。より正確な食事摂取情報を提供したであろう対象者に限定した解析でまったく別の結論を導けそうな推定が得られたのでした。何歩か譲って、食事摂取量の推定がより正確だと考えなくとも、解析条件を変えただけで結果がこれだけ変わったということは憂慮すべき事態です。

このアスパルテームと乳がんとの関係(ニュースでも取り上げられていた)だけではなく、ほかの解析でも総じて、同条件の導入で関連性が弱まるという結果が補助資料には報告されています。この結果から、私としては、メインの結果として主張されたものは不安定すぎて信頼できないと考えている次第です。

4. 客観性を欠いた解釈

上記3点目の結果の安定性について、著者らはどう述べているのでしょうか。上記のように「条件を変えて結果の安定性を検証する解析」をSensitivity analysis(感度分析)と表現しますが、著者らは次のように述べていました(結果の末尾)。

Overall, results remained similar in all sensitivity analyses.

つまり結果はどれも似通っていたというのです。(は?どこが??)というのが私の正直な感想でした。どう見ても、解釈を変え得る、あるいは明らかに結果の頑強さに疑問を禁じ得ない結果が報告されているのですが‥。膨大な補助資料を前にするとついつい精査する視点を欠いてしまいますが、よくよく汲み取っていくと論文のメインの結果は頑強ではありません。しかし、著者らはどれも「似た結果」と簡略化している様子なのです。
 

おわりに

上記、1~4点目の問題点がありながらも、抄録に書かれている結論などでは、食品安全に関する専門機関は甘味料について再評価すべきだという論調です(プレスリリース等でも)。こうした結論、上記4点目、そして論文全体から、著者らの「政治的に影響力のある結果を導きたい」という恣意性や強い自己掲示欲を私は感じています。恣意的な社会思想、イデオロギーについてはConflict of Interestとして注視に値することと医学界でも議論されています。その影響は問題ながらも、それが明確に関与しているとは断定できない事象で悩ましい話ですね。それに相関するものとして、この論文、および研究グループは科学的な精密さや客観性を欠いていると私は判断しています。

以上のことから、甘味料とがんリスクとの関係を検証したこの研究は質が低く、WHOの政策提言の素材とするには不十分過ぎると私は考えています。インターネット上で24時間思い出し法を開発し、複数回実施して、甘味料、食品添加物など、これまでの栄養疫学では推定が困難な因子を研究対象として扱うという胆力は素晴らしいと思います。しかし、その一方で基本的な疫学的配慮や慎重さが著しく欠いておりとても残念です。この研究グループ(NutriNet Sante Study)の質と科学とについて、何らかの機会が折り重なって研究や導かれるエビデンスが改善されていくことを願っています。

今回の4つのポイントのように、①②メインの食事因子や共変量(本旨ではBMI)の妥当性があたかも確実かのように装うこと、③結果の安定さ・頑強さが欠如していること、④都合の悪い結果については議論しないといったような事態は栄養疫学論文では頻出するものと私は認識しています。残念ながら、科学・教育・モラルの問題といえるでしょう。栄養疫学や観察研究のデザインに依存する領域の論文を書く、あるいは触れる機会のある方は特に意識して頂ければ幸いです。
 

註1)https://www.who.int/news/item/15-05-2023-who-advises-not-to-use-non-sugar-sweeteners-for-weight-control-in-newly-released-guideline
 
註2)Touvier, M et al., Comparison between an interactive web-based self-administered 24 h dietary record and an interview by a dietitian for large-scale epidemiological studies, Br J Nutr, 2011
いくつかの生体指標(Na, K , 窒素)と比較し妥当性を検討した研究論文もあるが(Lassale et al., Br J Nutr, 2015)、上記②の問題を抱えている仕様。

註3)
Lassale, C et al. Validity of web-based self-reported weight and height: results of the Nutrinet-Sante study. J Med Internet Res. 2013;15:e152.

ヘッダーの画像はこちらから
https://www.pexels.com/ru-ru/


この記事が気に入ったらサポートをしてみませんか?