![見出し画像](https://assets.st-note.com/production/uploads/images/144184233/rectangle_large_type_2_7b34237a4fc800709e439a9b761eb87c.png?width=800)
本当に欲しい論文を探し当てる!生成AI時代の論文検索
今回は、医療従事者や研究者の方々に向けて、大規模言語モデル(LLM)を使った本当に欲しい論文検索の効果的な方法をご紹介します。この方法を用いることで、膨大な論文の中から、楽をしつつ自身の研究や臨床に必要不可欠な情報を、高い精度で効率的に抽出することが可能となります。
従来の論文検索AI(Perplexity, Consensus, Elicitなど)は利便性が高い一方で、検索結果の質や適合性に課題がありました。しかし、今回ご紹介する手法では、研究者自身の求めるコンテキストに合致した論文のみを、高い精度で絞り込むことができます。
(2024.06.10追記)注意点としては与える論文の抄録数が多すぎるとリストの最初の方しか見ない事が多いので100件以内に絞り込む事、Hallucinationの可能性があるのでご自身で必ず内容を確認下さい(著者名やタイトル、DOIリンクに間違いがあったり内容が検索の意図に反している場合があります)。
(2024.06.16追記)当初Gemini1.5Proで紹介していましたがNotebookLMの方がHallucinationが少ないので変更しました。
こちら回答ありがとうございました!
— 限界助教|ChatGPT/Claudeで論文作成と科研費申請 (@genkAIjokyo) May 12, 2024
文献検索として「良い」の割合が多いサービスは上から順に
1️⃣Perplexity
2️⃣Consensus
3️⃣TXYZ
の順になりました
私個人としてはTXYZ>Perplexity>Consensusの順なのですが、分野が違うと良し悪しが違うのでしょう
今後推奨するときの参考にさせていただきます🙏 https://t.co/lcs2RjWs1N pic.twitter.com/gvxFekAaR4
とりあえず何か知見を知りたい場合にざっくりと文献を引っ掛けたい場合にはこちらの手法が便利だと思います。
高精度な論文検索の手順
Pubmed検索式GPTを用いて、適切なクエリを作成し、Pubmedで論文を検索します。検索結果は100件以内くらいまでに絞り込むことを推奨します。検索結果が多ければもっと検索範囲を狭めるように、検索結果が少なければ検索範囲を広げるような検索クエリを作成するようにお願いしてください。検索数が少ない場合は専門用語の英訳が上手く言っていない場合がありますのでご自身でキーワードを英語にして検索式を作成しなおしてもらってください。
他のLLMで使いたい場合のpromptはこちら
- ユーザーが提供したClinical Questionから、関連するすべての用語(同義語や準同義語を含む)を可能な限り抽出する。
- これらの用語を使用してPubMedの検索クエリを作成する。その際、以下の点に注意する:
- 用語をダブルクォーテーションで囲む。
- AND、OR、NOT等のブール演算子を適切に使用する。
- 検索フィールドを指定して関連性の高い結果に絞り込む(例:[Title/Abstract])。 フィールドに必ず検索ワードが含まれるような検索式にする。
- より具体的な条件を追加して結果数を減らす。
- 検索クエリは高感度であるが、特異度も適度に高いことを確認する。
Clinical Question: (ここに検索したいテーマを入れる)
検索がなかなか上手くいかない場合は頑張って一ついい感じの文献をみつけて、その文献の下に出てくるSee all similar articlesをクリックしてそのあと出てくる全ての結果を以下の2の手順で保存してください。
![](https://assets.st-note.com/img/1718487194045-48M1ZWBz3C.png?width=800)
2. PubMedの検索結果ページで「Save」を選択し、「All results」と「Abstract(text)」を選択します。これで、検索結果全ての論文情報とアブストラクトのテキストファイルが得られます。
![](https://assets.st-note.com/img/1716098277477-OeDPySRt6l.png?width=800)
![](https://assets.st-note.com/img/1716098287736-0AD1LL7XdN.png?width=800)
3. 取得したテキストデータをNotebookLMに入力します。
新しいノートブックを開いて先程のテキストファイルをアップロード
![](https://assets.st-note.com/img/1718487888330-HRvQmq6wcY.png)
4. NotebookLMに対し、目的に合致する論文のみを抽出するようにリクエストします。できるだけ具体的に自分の欲しい論文の方法や結果などを記載してください。
![](https://assets.st-note.com/img/1718488384409-mmKSwxUptE.png?width=800)
![](https://assets.st-note.com/img/1718488408975-gP9JXmm1Wi.png?width=800)
検索結果は一旦Notebookを閉じると消えてしまうのでピン留めをしておいてください。
LLMを活用した論文検索の利点
膨大な論文データベースから、目的の情報を高精度かつ効率的に抽出可能
人間がabstract全部読まなくても必要な論文が分かる
検索プロセスを最適化することで、研究の質と速度の向上が期待できる
Gemini1.5Proは、現在1日50回までの無料使用が可能であり、100万トークンまでの長いコンテキストに対応しているのが特徴です(右側のパレットにトークン数のカウンターあり)。検索結果数があまり多くない場合は、Claude3やGPT-4も適しているでしょう。GPT-4oはロングコンテキストに弱いようなのでオススメはしません。
【GPT-4oは長文が苦手?】
— 限界助教|ChatGPT/Claudeで論文作成と科研費申請 (@genkAIjokyo) May 16, 2024
✅GPT-4 Turboは16Kまでの長文で良好な成績
❌GPT-4oは2K以上になると成績悪化
◆短い文脈ではGPT-4oが安価で高速
◆6-10ページの文書にはGPT-4 Turboが良い https://t.co/3lXbjUQ8Su
この革新的な論文検索手法を用いることで、研究や臨床に必要不可欠な情報を、高い精度で効率的に見つけ出すことができます。ぜひ、この方法を試してみてください。論文検索のプロセスが大きく改善され、研究の質と速度の向上に繋がるはずです。
この記事が気に入ったらサポートをしてみませんか?