見出し画像

1日かからず論文を読めるようになるためのワークフロー

一次情報、欲しくないですか?

ここのところ例の疫病でモデルが合わないだの、一度かかっても抗体がいまひとつできないだの毎日のように言われているし、ほかにも地球温暖化やポリ袋の有料化でプラスチック問題の報道も頻繁にされています

困るのは人によって言っていることが全然違うことですよね。ある報道番組では専門家と呼ばれる人がAだと言っていたのに、ネットニュースでは他の人がBと言っている。さて何を信じれば良いんだ、、、

そんな時に、科学系のニュースの根拠になっている『論文』をサクッと参照出来るようになると冷静に現状把握が出来ます。

すこし昔まで論文は専門家だけのものだったのですが、じつは近年論文を読むハードルはかなり下がりました。

なので

論文を読んでみよう!!

ということで、僕(科学者です)が自分の専門外の分野の論文を読みたいなと思った時に使っている方法をまとめてみました。

おもに「どうやって基礎知識を身につけるか」というのと「論文ってそもそもどこで、どうやって手に入れるのか」に焦点を当てています。

最初に「論文を読めるようになることの意義」を書いたので、「そんなんいいからすぐ読みたい!」という人は3節まで飛んでください。

(数学が出来ないとそもそも読めない論文などは想定していません)

論文は科学系ニュースの元ネタ

一次情報を売る怪しいセールスマンみたいな書き出しをしましたが、一応僕はデンマークで科学者をやってます。

(理系)科学者における業績は基本的にはどれだけ面白い論文を書いたか、なので毎日せっせと研究をして、区切りがついたら慣れない英語に嗚咽をあげながら論文を書いているわけです。

ここら辺の話はあとで詳しく書きますが、論文は「論文誌」と呼ばれる冊子にまとめられて毎月とか一定期間ごとに発行されます。週刊少年ジャンプみたいですね。

で、そこで発表された論文のなかに面白いものがあればニュースや新聞などで取り上げられるわけです。例えば8月1日のYahoo Japanニュース科学欄には

”白亜紀の細菌、いまも増殖能力 約1億年前の地層で発見”
という記事がありました

画像1

(すぐリンク切れするからスクショを貼りましたがもし引用扱いの範疇を超えてたら消します)

第1段落の最後に「科学誌ネイチャー・コミュニケーションズに発表した」とありますね。その雑誌のサイトに行けば元ネタの論文があるということです。

基本的に例の疫病であれ環境問題であれ、全ての科学系ニュースの元ネタは論文誌にあります。

「信用できる情報筋によれば...」「関係者によると...」といったボヤかしも一切なく、そこに全てが書かれているわけです。

どうして混乱するのか

端的に言って、ニュースで言われていることで混乱をきたすのはメディアが「短く伝えすぎ」だからだと個人的には思っています。

あの疫病に関して最新の研究をフォローしている訳ではないので架空の研究で例え話をします

例えば、インフルエンザワクチンの効果に関して、ある番組では「効果がない」という”識者”の解説がなされ、他方では「効果がある」と”識者”が喧伝していたとしましょう。

どちらも別々の論文に基づいた「根拠ある」主張だ、と言っています。さてどっちが正しいのか。

これだけの主張だと、実はどちらも正しかったります。

インフルエンザワクチンの効果はだいたい5ヶ月程度持続すると言われているので、もし前者の論文がワクチンを接種して半年、後者が1ヶ月の人でテストをしていれば「効果なし」、「効果あり」と相反する結論を出していてもなにも不思議ではないですよね。

もちろんワクチンの持続期間がいまとなっては分かっているので、半年後の被験者をテストするなんて意味が分かりませんが、インフルエンザを例の疫病に置き換えてみたらどうでしょう。感染で抗体がどれほどできて、どれほど持続するのかもいまひとつ分かっていないのが現状なので、似たようなものじゃないでしょうか。

何が言いたいかというと、

「結論」の部分だけ見てしまうと、一見相反する意見はいくらでも乱立してしまい「何が何だか分からない」状態になりやすいので、多少面倒でもそのデータを得るために何が行われたのかまで知っておかないと簡単に間違う

ということです。

こういった情報は残念ですが2次以降の情報ソースでは落とされるのが普通です。テレビのニュースだろうが論文解説系YouTuberだろうが、研究が基づいている仮定などを説明していると視聴者が退屈しちゃいますもんね多分。

論文を頭からすべて読む必要は一切ないですが、少し気になった時にそういう細かいことを、解説者の主観を通さない一次情報として自らチェックできるようになるというのはかなり意義のあることだと思います。

論文を読むために : 問題意識を共有できるか

さて、論文を読んでいきたいわけですが、論文を読むために越えるべき壁は

1.  英語
2. 選定方法と入手方法
3. 問題意識の共有(予備知識)

の3つがあると思っています。1は最近話題になっているDeepLの翻訳精度がかなり高いのでほぼ解決です。pdfではなくhtmlで書かれた論文のページ(大抵両方あります)で論文をコピーしてDeepLにかけましょう。個人的な感覚としてはGoogle Translateより自然です。

のちほど紹介するarXivではpdfでしか論文を読むことは出来ませんが、このサイトを使えばhtmlページを作ってくれます


【8/12追記】「ほんやくこんにゃく」という素晴らしいアプリについての説明を別noteが書きました!こっちのほうが便利なのでご興味があればぜひ!
(まとめの後にもリンクを置いてあります)


もちろんこの部分は英語が読めればそもそも問題ではないです。2の「選定/入手方法」は後ほど解説するので3の「問題意識の共有」を説明していきます。

そのためには実際の論文を見てみるのがいいかと思います。疫病関係はセンシティブで気が滅入るので海洋プラスチック問題にします。

紹介する論文は2015年にNature Communicationsに出版された、こちらの論文です。

タイトルを和訳すると

1957年から2066年までの海洋上層部における非保存性マイクロプラスチックの存在量

といった感じでしょうか(非保存性でいいのかなぁ...)

本当にはじめの一部分だけ読んでみましょう。抄録と序論を一部抜粋してDeepLで翻訳、少し手直ししています。(雰囲気を知って欲しいだけなのでまじめに読まなくていいです)

抄録
これまでの実験研究では、マイクロプラスチックを摂取することで海洋生物に害を及ぼす可能性が示唆されています。(略)
本研究では、数値モデルと南極から日本までの経海洋調査を組み合わせて、1957年から2066年までの太平洋における遠洋性マイクロプラスチックの経年変化を示した。(略)
除去過程を3年間の時間スケールで考慮した数値モデルの結果から、亜熱帯収束帯周辺の遠洋性マイクロプラスチックの重量濃度は、2030年(2060年)には現状の約2倍(4倍)に増加することが示唆された。

序論
最近の研究では、極海域[1-6]、限界海域[7,8]、沿岸海域[9]などの外洋に直径5mm以下の遠洋性プラスチック片が存在することが報告されている。重要なことは、マイクロプラスチックは、その表面に汚染物質が吸収され[10,11]、その後、動物プランクトンのような小型の海洋生物によって摂取されるため、海洋生態系への化学汚染物質の輸送ベクトルとして機能する可能性があることである[12-14]。

論文はその雑誌によって多少の差はあれ

抄録 : 論文に何が書いてあるのか
序論 : なぜその研究をしたいのかの導入 
結果 : データなどを淡々と出す 
議論:これまでの要約と議論

というテンプレ構造を必ず持っています。

序論は研究の導入部なので、そこで「あーなるほど、それだったらその研究したいよね」という気持ちになれない場合、それ以降はもうただただ苦痛です。なぜ著者はこの話をしたいのか全く分からないまま、延々と話を聞かされる。炎天下の全校集会での校長先生のお話っぽさがあり、「論文が読めない」というのは基本的に序論での躓きだと思っています。

序論を読んでみてどう感じました?「わかるわかる!」と思うのであればこの節はもう飛ばしちゃってください。

「なに言っているのかさっぱり分からん」という方が多いと思うので細かく見ていきましょう。まずは最初の一文

最近の研究では、極海域[1-6]、限界海域[7,8]、沿岸海域[9]などの外洋に直径5mm以下の遠洋性プラスチック片が存在することが報告されている。

謎の数字がありますね。

これは過去の論文の引用であり、論文の末尾を見てみるとこういったリストがあります(一部抜粋)

画像2

序論はこういった感じで過去の研究を引き合いに出しながら、問題意識の共有を行うのが普通です。

とてもくだけた言い方をすれば、最初の一文では、

参考文献の1番から6番では極海域、7番と8番では限界海域、9番では沿岸海域に小さなプラスチック(マイクロプラスチック)があるよ、ということが調べられているじゃん、それはまぁみんな知ってるよね?

といった感じのことが言われているわけです。

続いて

重要なことは、マイクロプラスチックは、その表面に汚染物質が吸収され[10,11]、その後、動物プランクトンのような小型の海洋生物によって摂取されるため、海洋生態系への化学汚染物質の輸送ベクトルとして機能する可能性があることである[12-14]。

そういったマイクロプラスチックは汚染物質をためこんで、その汚染物質は魚にも溜め込まれるだろうし、最終的には人間にも来ちゃいそうだよね。これは困るよね。(汚染物質が何なのかは参考文献10番と11番、魚とかにも溜め込まれることの詳細は参考文献12から14番を見てね)

といった感じ。(ラフすぎて著者の方不愉快に思われたらすみません..)


この論文はコンピューター・シミュレーションを行うことで、将来マイクロプラスチックがどのくらいの量になるのかを報告しているのですが、この最初の数行に書かれていることに共感できるのであれば、シミュレーションの結果がどうなったか気になりますし、逆に意味が分からないとただただ苦痛です。序論を読んで共感出来なければ興味がないか、知識が足りないので読まない方が合理的だと思います。

___

この「問題意識の共有」こそが、非専門家が論文を読む際に一番大きな関門になると思うのですがこれは

簡単な入門書 → 一般書 → レビュー論文

の順で知識をつけていけば割とスムーズに乗り越えられると思います。

Step1 簡単な入門書

要は新書などです。大抵のものは薄いのでさくっと読みやすいですし、幅広い読者を想定しているので解説も平易。知識ゼロから始めるにはうってつけです。ものによっては岩波ジュニア新書とかでもいいかも知れない。

新書を2-3冊読めばまぁ、分野のあらましとどういったことが問題になっているのかくらいはぼんやりと分かるようになるはずですし、専門用語への心理的な抵抗感が少しなくなっていくと思います

例えば上述の論文であればこの新書とか(というかこの新書でこの論文を知ったんですけど)

Step2 一般書

新書の質が良く、もう分野の問題意識は共有できたと思えたなら飛ばしてもいいかも知れないですが、新書でだいたいの知識がついたらもう少し専門的なものを読みます。

これは例えばハードカバーの、想定している読者層がもう少し狭めのもの、あるいは講談社ブルーバックスやちくま文庫math & science、岩波科学ライブラリーなど。

ポイントは巻末に参考文献がついているかどうかです。論文を読む難しさの2つめ、「どの論文を読めばいいのか分からない」を解決してくれるのが参考文献です。専門家の書いた本についている参考文献であれば基本的にその分野の重要論文あるいは最新の論文のはずです

たとえばこれ

は新書よりもう少し踏み込んでいて、参考文献が充実していたので良いかなと思います。

Step3 レビュー論文

レビュー論文というものがあります。悲しいことに科学はかなり細分化・蛸壺化が進んでいるので、専門からほんの少しずれるだけで知らないことだらけです。そのため有名な論文誌は有名な研究者に分野の解説論文(レビュー論文)の執筆を依頼しています。

レビュー論文は基本的に古典的な、「これは知っていないとまずい」という超有名論文の紹介に始まり、分野の最新動向の解説までいくのでとても有益です。科学者向けに書かれているとはいえ、その分野の常識を知らない人に向けて書かれているので新書と一般書を読み込んでいればなんとか読めると思います。

例えばこれなんかは結構引用も多くて、過去に行われた研究成果を一覧の形でまとめてくれています(無料っぽい。違ったらすみません)

参考文献も付いておりとーっても有益なのですが、まぁ手に入らなかったりするし、ここまでやるのはかなりガチ勢なのでこれはオプションです。もしここを飛ばしたい場合はStep 2の一般書は必ず参考文献付きのものを。

ところで、ここでの「本」は別に文章を楽しむために読むわけではないのでハヤカワ五味さんが解説しているような読み方で、特に新書は1時間程度でサクッと読むのがいいかと思います。

どこで論文は手に入るのか:Google Scholar

さて、新書や一般書を読んで問題意識の共有予備知識の獲得がある程度すんだらもう読んじゃいましょう。論文。

むかしは論文といえば大学などの大きな図書館にしかなく、近くの大学図書館になければ郵送でコピーを送ってもらうしかなかったそうです(!!)

しかしいま、論文入手のハードルはめっっっっちゃくちゃ低いです。

ググりましょう。

ただ普通のGoogle.comではなく、Google Scholarです。

Google Scholarは文献検索用のエンジンで、もちろん論文データベースとして元祖ではないですがとっても使いやすいです。

画像3

Google Scholarの便利な点はまず、論文を引用された回数順に並べてくれることです。論文はさきほどのように過去の研究を引用して書かれるものなので、引用された回数が多いとそれだけ後世に影響を与えた重要な論文ということになります(分野によって専門家の数が違うので異なる分野間での比較は微妙)

Google Sholarにはもうひとつ、とんでもなく便利な機能があります。それは論文の下にある「引用元」という部分をクリックすることで、その論文を「引用している」論文一覧を表示してくれるというもの。

各論文の最後にある「参考文献」欄にリストアップされる論文は、未来に書かれる論文を参考文献にするなんて出来ないので、当然ですが過去の論文ですよね。

そのため参考文献をみるだけでは、その研究分野の過去しか知ることが出来ないのですが、この「引用元」ボタンを使うと、その論文がどのように引用され、分野が発展していったのかを知ることが出来ます。この機能は本当に素晴らしいです。

一般書あるいはレビュー論文で知った論文を読んでみてもしさらに興味が湧いたらこのボタンをクリックしてより新しい研究を探してみてください。

どこで論文は手に入るのか:無料の論文誌

ところで、実は多くの論文は有料です。そしてめっちゃ高いです。

一番有名な科学誌はNatureかなと思うのですが、毎週の定期購読は年間で56,100円、そしてなぜか1冊だけの購入は24,647円でした(マジで..?)

論文1本単品購入はだいたい4,000円とかそれくらい。なかなか高いんですよ。

(ちなみに誤解しないで欲しいのですがそのお金は科学者にはびた一文も入って来ません。全部出版社です)

大学や研究機関は出版社と特別な契約をしているので、大学の構成員は多くの論文を自由にダウンロードすることが出来ます。多分大学図書館であれば一般の方でもダウンロードできるはずです。

これがまた、論文にアクセスしづらい要因のひとつだったんですよね...


ところが最近、著者が出版時にお金を払うことで論文を無料で、誰でも読めるようにしようという流れが出来てきました

というのも、読者が高価な論文を買って読むというシステムは、予算がたくさんある大きな大学に所属していないと論文にアクセスすることすらままならなかったり、非科学者を完全に排斥していたりという問題がありました。

科学は結局のところ税金で行われているので、研究の成果物に大きな大学に所属する科学者しかアクセスできないのはおかしい、という考えのもとこのような論文のオープンアクセス化が進んでいます。多分。

ここ最近はオープンアクセス化もかなり進み、質の高い論文が無料で手に入りやすくなりました。このnoteでおすすめしたいのはそういう論文たちです。

おすすめのオープンアクセス・ジャーナルは 

Nature Communications
Science Advances 
Public Library Of Science (PLOS) 

です。

Nature Communications とScience Advancesはそれぞれ有名なNature, Scienceの姉妹誌です。もちろん本誌ほど審査は厳しくないですがクオリティの高い論文が載ってますし、特定分野の専門誌ではないので興味を持った分野の関係論文は何かしらあるはず。

Public Library of Science (PLOS)は生物と医学系に強い印象があります。Nature Communications, Science Advancesに比べると審査はかなり甘く、科学的な正しさは審査するけどもその重要性は割と読者に任せる、という考え方ですが面白い論文はそれなりにある気がします(最近審査厳しくなったような気も)

ここで紹介した論文誌はオープンアクセス・ジャーナルなので全ての論文がオープンですが、普通のジャーナルでもいくつかオープンの記事があったりするので探してみてください。

また、プレプリントサーバーというものがあります。論文は査読というプロセスを経て正式に出版されるのですが、これはまぁ半年くらいは普通かかるので、分野によりますが査読に出すと同時にこういったサーバーにアップすることで結果をはやく公開してしまおうという流れがあります。(ここらへんの事情は補足を見てください)

物理系はarXiv, 生物系はbioRχiv, 医学系はmedRχivがあります。

いずれも全て無料で、最終的にオープンアクセスではない雑誌に出版されたけど実はプレプリントサーバーで読める、といった裏技もありますが、原則アップされた論文それ自体は正式な査読を受けていないので研究の正確さは担保されていません。

僕は専門がシステム生物学なのでどうしても論文が物理系、生物系に偏ってしまうのですが工学系などで有名なOpen Access Journalがあったら教えてください。。

「問題意識の共有」の部分で紹介した論文もオープンアクセスのNature Communicationsの論文です。ある程度の予備知識をつけるとディグるだけで結構楽しいのでやってみて下さい!

まとめ

まとめます。

論文を読めるようになるには問題意識の共有が一番大事

問題意識の共有は新書 → 一般書 → レビュー論文を読めばいける

論文は読んだ本の参考文献からたどる。Open Access誌なら無料

このワークフローをたどって論文1本読むまでいくのは集中していれば6-7時間もあれば足りると思いますし、一回たどった分野であれば、気になったニュースがあった時に原論文を軽く確認することはそこまで難しくなくなるはずです。


ちなみに本気で読み込むのでなく、かつ問題意識を認識している論文は

Abstract → Discussion → Figureとそのキャプション+関連箇所 

という順で結果から順に読むのがおすすめです。著者が到達したい結論から逆に辿っていくほうが自分でディグっている感じがあって退屈しないです。問題意識を理解しているならイントロは読まなくていいんじゃないですかね。 

逆に問題意識や関連論文を知りたいならイントロだけ読みまくるのがいいかと思います。


論文に気楽にアクセスできるようになると、ニュースで気になったことなどにもう一歩踏み込めるので、すこしハードルが高いかも知れませんが予定のない休日とかに試してみてください

本編はここまでです!長文お読みいただきありがとうございました!!

【8/12追記】途中で紹介したほんやくこんにゃくを使うとこんな感じの和英併記+図が良い感じの位置にくるpdfを作ってくれてめっちゃ便利です!

画像4

解説は別で書いたのでご興味あればぜひ使ってみてください!


補足 : 論文の“正しさ”はどう決まるのか

これは本題とは関係ない補足なのですが、本文では「論文誌」「査読」「プレプリント」といった業界用語をいろいろと使ってきました。気にせず読めるようには頑張りましたがもし気になった方がいればと思い、ちょっと解説を追加します。

これら業界用語の解説は論文の「正しさ」とは何なのかという部分にも関係してくるのでじつは大きいテーマなのですがさくっと。

___

冒頭にも書いた通り、われわれ理系研究者にとっての業績とは論文の数と質で、どれだけ質の高い論文を継続して多く書けたか、です。

質というのは測るのが難しいですが、引用された回数がひとつの指標です。もうひとつはどれだけランクの高い論文誌に載ったか、ですね。もちろん良い論文誌に載れば研究者の目に留まりやすくなるのでこれらの指標は独立ではありません。

なので誤解を恐れずざっくりいえば、われわれは面白い研究をして、またそれを良い論文誌に掲載する、ということを目指して日夜研究に励んでいるわけです。

___

この節では論文が論文誌に掲載されるまでをざっくりと説明したいと思います。

研究がある程度区切りがついたなと思うと、僕らはそれを論文の形にまとめます。ものによりますがまぁA4二段組で5-6ページくらい。

そして書き上がった論文を出版社に「持ち込み」ます。漫画家さんみたいですね。もちろん実際に持っていく訳ではなくてオンラインで投稿するんですが。

そこで出版社の編集者さんが担当になってついてくれます。編集者さんは現役の科学者だったりすることもありますし、科学関係の博士号を持っている出版社専属の人だったりもします。

担当さんが「これはうちの紙面に載せる価値がある」と「科学的正確さ」・「科学的重要さ」の主に2点を確認できた場合、その論文は正確性のさらなる検証のために「査読」というものに回されます。英語ではピアレビューです。それが確認できない場合は「今回は縁がなかったということで、、、」となります。

「査読」のステージでは担当編集者さんが数人(3人が多い)の現役科学者を選び、その人たちに論文を読んでもらい、コメントをしてもらうように依頼します。

ちなみに査読者(レフェリー)が誰なのかは論文の著者には知らされず、また査読に報酬は発生しません。不正や報酬の多寡によって判断が変わることを防ぐための業界一致の慣習です。

査読者のコメントや批判・質問などに完璧に答え、それらに従って論文を修正し、基本的にはレフェリー全員のOKがもらえると、めでたく論文は出版されます。

いまは多くの論文誌がオンラインなので「出版」といってもそのジャーナルの名前を冠して、そのジャーナルのサイトに掲載されるといった感じですが(Nature, Science, Cellなど有名老舗ジャーナルは紙での出版も続けています)

業界ではこの査読を通った論文は基本的には正しさが確認されたものとして考えられます。査読を経ていない論文を「プレプリント」として別の扱いをするのはそういった理由があります。

「まだプレプリントなので」と言った時は、著者たちも気付かなかった計算ミスや議論の飛躍などがもしかしたらあるかも、といった意味が込められていると思います。

___

ところで、プレプリントサーバーが重要になってきた背景には、査読にかかる時間の問題があります。

論文の査読は(もちろんものによるので一概にはいえませんが)まぁ半年くらいはかかります。僕は理論系なので早いほうですが実験ならもっとかかりそう。

というのも、どの科学者も自分の業務で忙しいなかでボランティアで査読を行なっているわけですし、著者も返ってきたコメントに全て返答し、ものによっては新しい計算や実験を行わなければならないので。

科学は最初にやった人が一番偉いという世界です。そのため査読に1年かかっている間に他の人が(研究の終了自体は遅いのに)査読が早かったおかげで論文を一番最初に発表してしまった、ということではいたたまれない。その解決策のひとつとしてプレプリントサーバーは機能しています。

プレプリントサーバーのもうひとつの特長は、例えば今回の疫病の問題のように迅速な研究が求められる場合に発揮されています。一分一秒を争って結果を出したのに査読に半年かかったので発表された頃には手遅れでした、では元も子もありません。そのため件の疫病関連の論文はプレプリントサーバーにたくさん投稿されています。ただ、玉石混同すぎるのですが、、、

___

こういった具合に、ちゃんとした論文誌に載っている論文はちゃんとした検証がなされており、ある種「お墨付き」があるが情報が遅い。他方プレプリントサーバーは早いが一切チェックがされていない(bioRxivとmedRxivは少しだけやっているらしい)と理解してもらえれば大枠では合っているかなと思います。

ただ、この査読も完璧ではないということだけ注意させてください。

査読はさきほども書いたようにボランティアです。報酬は発生しません。紙とペンで出来るような理論研究であれば、結果のチェックのために実際に査読者が計算を確かめることができます。しかし数千万円から数億円かかる機器が必要な実験の論文だったら?そんなの追実験することなんて出来ないですよね。

そこまでの機器が必要なくても、(例えば生物の)実験は年単位で時間がかかることが多く、追実験を査読者が行うということは現実的ではないです(僕は実験プロパーではないので断言は出来ませんが)。実際にそれが顕在化した例が小保方事件ですね。

加えていえば、査読を真剣に行うモチベーションは「間違った論文を世に広めるわけにはいかない」という科学者の善意、ただそれだけなので一度モラルハザードが起こってしまえば崩壊しかねないシステムです(とはいえ報酬を払えばいいとも思わないのですが)。

そのため査読を通った論文の結果でも実は重大な見落としがまだあったり、ほんの少し条件を変えただけで大きく結果が変わるということが実験系の研究で見られたりします(理論系にはないと言っているわけではないです)。そういった事情があることから、僕の実験系の友人は「同様の結果が3つ以上の研究室から独立して報告されない限り信用しない」と言っていました。

ニュースで取り上げられるような論文はそれなりにしっかりしているものだと思うので、こういったことを意識する必要はさほどないと思いますが、頭の片隅にでも置いておいてもらえると嬉しいです。


いただいたサポートでもっと勉強します!