見出し画像

Ovidの特性(近接演算子とキーワードフィールド)

購読している(学ばせていただくばかりのROM専門ですが)MLでovidについてやりとりがあり、大変勉強になったのでnoteにメモ
kwとkfフィールドの違いについては個別に(いつもとても親切に教えてくださる)@SRLibProblems さんと @melsydavies さんから教えていただいていました。またMLのやりとりの細かいところの理解が自力ではできなかったので、@SRLibProblems さんに教えていただきました(ぺこり)

(MLの内容そのままではアレなので、キーワードは変えています)
上の4つは同じ単語を使って論文タイトル(ti),抄録(ab),キーワード(kw)フィールドを対象に検索した結果です

Ovid MEDLINEで”evidence based medicine”を数パターンで検索した画面イメージ

Line1と2の検索からも分かること
Ovid MEDLINEでは(フレーズ指定なし("")でも)キーワードがフレーズで検索される
PubMedでは(フレーズ指定しない場合)下のようにPubMedの検索アルゴリズムで補足した検索を行います

PubMedで”evidence based medicine”と入力してSearchをクリックしたときに行われている検索


ここからが本題
Line3と4ではOvidの近接演算機能 adjを使って 、論文タイトルまたは抄録またはキーワードフィールドを対象に、evidence とbased とmedicineが近接して1語または2語以内に含まれる文献を検索しています。
理論的にはL1(フレーズ検索した結果)より、近接演算指定して(それぞれの単語の間にN語を挟んでいるパターンも入ってくる)ので拾える文献が増えるハズと思ったのですが、ヒット数はL1の19884件よりむしろ減っています。

原因は以下2つでした
1.adjの挙動(仕様)
2.ovidのキーワードフィールドの持ち方

1.adjの挙動(仕様)と2.ovidのキーワードフィールドの持ち方

ovidのキーワードフィールドには、.kw.kfの2つがあります。
(素直にキーワードだからkwでしょって思ってトラップにはまった私)
.kw検索をした場合、著者キーワードとして指定された単語と一致するもののみを検索し(フレーズとして一致するもののみを検索(Phrase Indexed))、著者キーワード内のフレーズ用語は拾ってくれない。→evidence.kw.として検索すると"evidence based・・・"みたいなのは検索で拾わず、"evidence"(のみ)がキーワードフィールドに索引されている文献のみを拾う
この場合、.kwでevidence based medicineのフレーズで指定した検索(evidence based medicine.kw. )をするか、.kfで指定しないとevidence、 based、 medicineを含む著者キーワードを持つ文献を拾ってくれない(.kfは単語単体で拾ってくれる=word indexed)。と言うことを知りました。
文字での説明に限界があると思いますので以下、検索の画面をお示しします

Ovid MEDLINEでそれぞれの単語だけを検索しline8で掛け合わせ
evidence.kw.は”evidence”の単語だけをkeyword に持つものを拾う
basedも同様
.kw検索をadjで行った結果
"evidence"(のみ)、"based"(のみ)、"medicne"(のみ)をkeyword headingに持ちn語以内に近接しているものを拾う

anj1とadj2の.kw検索には(Line11,12)違いがなく、Line5,6,7,8の検索からevidence(のみ)とbased(のみ)とmedicine(のみ)を検索した結果の掛け合わせ(evidenceのみをkwフィールドに含む文献とbasedのみをkwフィールドに含む文献とmedicineのみをkwフィールドに含む文献を検索している)

Ovidの.kwフィールド

また、.kwフィールドでは語句はアルファベット順に並ぶそう。
そこで.kwを指定してadjを使った場合、evidence,based,medicineはb→e→mの順に並ぶので、この間に他のキーワードがn語いないに近接という指定は結果として意図しない挙動となる。ということを教えていただきました。

.kfで検索した場合は一部として含まれていても拾ってくる
.kfで検索した時に含まれるデータ
PubMedの同一文献のデータ

ovidとPubMedのデータがおかしい(索引ミス?)のでは?と思って本文を確認してみましたが、確かにこの記載ではevidenceとbasedとmedicineは別々の単語として索引されるだろうなと納得しました。

出版社サイト(正確にはPMC)で公開されている論文内の記載

(文脈にもよりますが)ovidではキーワードフィールドは.kfを使う方がよいと知りました。


I appreciate your kindness to@SRLibProblems and @melsydavies and all medlibs!


この記事が気に入ったらサポートをしてみませんか?