見出し画像

[研究室学生向け] きちんとサーベイする

新しい研究テーマを考えるとき,既存のテーマを発展させるとき,論文を書き始めるとき,「きちんとサーベイ(文献調査)する」ことが重要です。

なぜサーベイが必要か?

いくつか理由がありますが,大学研究室における研究活動おいては,次の2点が挙げられます。

当該分野の概要把握と深い理解

  • 自分が挑もうとする分野では,何が典型的な問題で,それらがどこまで解決・解明されているのか,世界中の研究者達の間では,どんなアプローチが伝統的でどんなアプローチが流行しているのか,把握しておく必要があります。これらを知らないほうが有利,というシーンはなかなか想像できません。

  • コツコツと調べ物をするのは退屈で,色々とアイデアを出す方が楽しいという気持ちは良く分かります。しかし,研究は「思い付き合戦」ではありません。研究を始めて何年も経っていないような「ビギナー研究者」がオリジナルのアイデアを捻り出そうとする行為は,野球初心者が魔球を編み出そうとするようなものです。魔球を投げるためには,基本的な体力づくり,正しい投球フォームの習得,一般的な変化球の習得などが必要なことはご納得いただけるでしょう。研究におけるアイデア出しも同じで,最低限知っておくべきことがあります。

  • 既存研究を調べすぎると,当該分野の素人ならではの「知らないからこそできる発見」のチャンスが減るという考えもあるでしょう。その意見に反対はしませんが,とはいえ,それがいつまでもサーベイをしなくてよい理由にはなりません。少なくともその発見に基づいて研究を始める際には,きちんとサーベイをしてください。

自分のロジックの論理性・客観性の向上

  • 論文執筆や学会発表を行う際には,自分のロジックの論理性・客観性を高める必要があります。平たく言うと,筋が通った内容を,多くの人が納得できる根拠に基づいて,書く/話す必要があるということです。

  • 多くの情報系研究室の場合,研究課題は何かを明らかにすることであったり,何かを実現する手法を提案することであったりするでしょう。原則として,研究は何かを世界で初めて明らかにする/実現するものですので,研究課題の妥当性を示す際には既存研究のサーベイは特に重要です。

  • 例えば,研究課題が「○○を明らかにする」だったとしましょう。この場合は,世界中のどの文献(現実的には調べられる範囲の文献)をあたっても○○は不明であることを示さないとロジックが成立しないでしょう。

  • あるいは,研究課題が「○○を実現する」だったとしましょう。この場合も,世界中のどの文献においても○○は実現されていないことを示さないとロジックが成立しません。

きちんとサーベイできているか?

多くの情報系研究室では,教員や先輩学生からサーベイの重要性・方法を教わるはずですので,まったくサーベイをせずに論文執筆・学会発表をしている人はほとんどいないでしょう。しかし,本当にきちんとサーベイできているでしょうか?たとえば次のようなことはしていないでしょうか?

  • 先輩の論文の参考文献リストをそのまま拝借し,自分で内容の更新もしていない。

  • Web検索でヒットした新しめの文献をいくつか流し読んだだけで,サーベイしたつもりになっている。

  • 読む文献の被引用数や,それが収録されているジャーナル/発表された会議の採択難易度・学術的価値を気にしたことがない。

  • 日本語文献しかサーベイしていない。

特に4点目は耳が痛い人がいるかもしれません。しかし,日本古来の伝統芸能や日本語そのものに関する研究でもないかぎり,高品質・最先端の知見が日本語文献の中にある可能性は低いです(無いとは言いません)。特に情報系分野では,残念ながら日本が最先端を走っているケースは多くありませんし,日本人研究者も高品質な成果は英語文献として発表することが通常です。たとえば世界中で1国しか使っていない言語を公用語とするどこかの国の研究者が,自国語文献だけをサーベイして,自分の研究は世界で前例が無いと主張したらどう思うでしょうか?それと同じことを自分もしていませんか?

上記に該当しない人は,ある程度きちんとサーベイできているかもしれません。しかし,次の質問に答えられるでしょうか?

  • あなたの研究分野で,難関とされている英語ジャーナル,国際会議の名称を5件以上挙げられますか?

  • あなたの研究分野で,難関ジャーナル・国際会議で活躍している海外研究チームを5件以上挙げられますか?

  • これまでに大きな衝撃を受けた論文を5件以上挙げられますか?

活躍している研究チームなどは,意図的に調べることも大事なのですが,きちんとサーベイしていると自ずと分かってくるものでもあります。

代表的なサーベイ方法

サーベイの方法は,研究分野・研究室によって多少異なるでしょうから,ここでは大まかな方法を説明することとします。

キーワードによる検索

  • 検索エンジン(例:Google Scholar,大学OPAC)や,学術文献ライブラリ(例:ACM Digital LibraryIEEE Xplore)を用いて,キーワードで文献を探す方法です。

  • 多くの人が行っていると思いますし,この方法しか実行していない人もいるかもしれません。

  • しかし,キーワードによる検索は実は難易度が高いです。検索対象の概念を抽象化した上で正しい技術用語で表現する必要があるため,ある程度の技術知識・英語力が必要です。

  • しかも,玉石混淆の検索結果から参考にすべき論文を見つけるのも実は難易度が高いです。検索キーワードを含んでいても,低品質であったり,分野違いであったりする文献が結構あります。適切な論文を見つけるためにはある程度の技術知識・経験に基づいた目利きが必要です。

  • 研究室に入りたての学生が「自分の提案に関する既存文献はありませんでした」というのをよく耳にしますが,それは検索キーワードがあまりに限定的であったり,技術英語として標準的でなかったりするためであることが多いです。

  • 正しい検索キーワードを把握するだけでも相当大変なので,慣れないうちは教員や先輩学生に,どのようなキーワードで検索すれば良いか教えてもらうのも手です。

優れた文献に付いている文献リストの利用

  • 原則として,学術文献には,当該文献が参照している文献のリストが含まれています。典型的な論文であれば,論文の末尾に参考文献リストが付いています。

  • この文献リストを「芋づる式」に辿っていくと,短時間で効率的に多くの関連研究を調査できます。

  • ただし,当然ながら,芋づるの起点となる文献は慎重に選定する必要があります。

  • 典型的には,何らかの基準で学術的価値が高いと判断できる論文(例:難関ジャーナル・会議の論文,新しいわりに被引用数が多い論文)を起点とすると良いでしょう。

  • サーベイ論文と呼ばれる種類の論文もあります。よほどニッチな分野でなければ数件は見つかると思いますので,タイトルに「A Review」や「A Survey」が含まれるものを探すと良いでしょう。ただし,被引用数を稼ぐためにこれらのキーワードをタイトルに含めた低品質なサーベイ論文もありますので注意してください。

  • この方法は,やめるタイミングが難しいです。ある文献の参考文献リストにある文献には,また新たな参考文献リストがあるので,いつまでもサーベイできてしまい,時間ばかりが過ぎてしまいます。やめる判断基準はケースバイケースですが,自説の主張に十分な根拠が与えられる材料が揃ったかどうかを1つの基準とすると良いでしょう。ただ,これにはある程度の経験が必要ですので,被引用数が○件以下のものは読まない,ページ数が○ページ以下のものは読まない,◯月◯日には一旦サーベイをやめるなど,何らかの機械的な基準を設けるのも手です。

特定のジャーナル/国際会議で発表された論文から探す

  • 初心者におすすめの探し方です。

  • ジャーナル/国際会議に採録されているので一定の質が保証されていますし,当該ジャーナル/国際会議のトピックから極端に外れたものは含まれていないでしょう。

  • 通常はジャーナル/国際会議の公式ページに発表論文一覧があります。そこから直接論文にアクセスできることもありますし,そうでない場合も論文名をキーワードにして前述の方法で当該論文を検索すれば良いでしょう。

サーベイのコツ

  • いきなり論文の中身を読まない。論文を探す行為と,中身を読む行為は,意図的に区別した方が良いです。論文を探している最中は,タイトル,著者グループ,アブストラクト,結論を読むくらいにとどめ,それ以外の部分は,その論文をじっくり読む必要が生じたとき(例:自説の主張のためにその論文を引用するとき)に読むのが良いでしょう。

  • 全ての論文の中身を全部読もうとしない。生真面目で几帳面な学生の方にありがちですが,見つけた論文の中身を懇切丁寧に読み解こうとしないでください。絶対に時間が足りません。1本の論文を書く際に,本当に丁寧に読み込まないといけない論文はせいぜい数本です。

  • 当該分野のマップを作る前提でサーベイする。どれだけ多くの重要な論文を調査したとしても,それらをだらだら列挙するだけではあまり意味がありません(論文執筆時にサーベイ結果を列挙することしかせず,教員や先輩から注意を受けた人も多いでしょう)。難関ジャーナル/国際会議の論文を見ると分かるでしょうが,良い論文では,関連分野の文献を体系化して説明しています。たとえば,本研究はA〜C分野に関連する,A分野はA-1〜A-3のアプローチがある,A-1アプローチの代表例は文献1〜5である,このアプローチにはこのような長所・短所がある,といった具合です。いきなりマップを作るのは難しいでしょうから,文献を1件サーベイするたびに内容を端的に表すタグ(例:アプローチ名,研究チーム名,使用デバイス,使用アルゴリズム,ターゲットユーザ)を付けておき,ある程度文献がたまったらそれらのタグを俯瞰してみるのが良いでしょう。そうすると,自分が調べた文献が,いくつかのグループに大別できることに気付けると思います。

サーベイした文献の管理

サーベイを行うと,膨大な数の文献を管理する必要が生じます。ジャーナル・会議の難易度,論文のページ数,分野によって変わるでしょうが,情報系の難関国際会議への投稿論文なら1本あたり50件程度,和文論文誌でも20〜30件程度は参考文献が必要でしょう。これを大学・大学院に在籍している間続けるのですから,数百本の論文(中身を全部読むかは別として)を管理することになるわけです。

これを手作業で管理するのは現実的ではありませんから,Mendeleyなどの文献管理システムを使うことを強く推奨します。「Mendeley 使い方」などのキーワードでWeb検索すると効果・使い方がたくさん見つかるはずです。

この記事が気に入ったらサポートをしてみませんか?