さよならMendeley、さよならWatch folder、そして残されたdoiなしpdfの行方

さよならはじめての文献管理ソフトMendeley


5年近くお世話になった文献管理ソフトMendeleyとついにお別れすることにした。(正確にはまだお別れしきれていないが。)

数年前にMendeleyのAndroidアプリが終わってしまった時からなんとなく不穏な空気はしていた。ついでに、投稿論文に合わせた書式で参考文献リストの作成をしたり、Wordに文献を挿入する上では、Mendeleyはいささか力不足だなという気はしていたので、すでにEndnoteを導入していた。
(参考)Endnote導入した時の記事:

大枚はたいてEndnoteを買ってもなお、Mendeley Desktopは使い続けていた。もちろん不満がないわけではなかったが(ディレクトリ構成とか、検索かけるたびに謎の表示になってしまうとか…)普段読んだ論文をぶち込んでいく上では、Mendeley Desktopの方が便利だったからだ。所属機関が契約していて100GBのストレージが使えるのは大きかったが、所属機関から離れてもストレージ課金して使おうと思っていた。それくらい推していたしヘビーユーザーだったのだ。

そんな愛着あるMendeleyともさよならだ。きっかけは、Mendeley Desktopの終了、Mendeley Reference Managerへの移行だ。

もちろんこのMendeley Reference Manager、しばらく使ってはみた。見た目はかっこいいし、客観的にみてめちゃくちゃ悪いという感じでもなかった。ただ、個人的に、以下のような絶対に許せない点が幾つかあった。あんまりネット上にネガティブな意見を書きのこすのは気が進まないが、同じような境遇の人や、ソフトウェアの開発者さんが見てくれるかもしれないので、不満点と所感、今後の方針をまとめておこうと思う。

Mendeley Reference Managerの不満ポイント

論文を自動ダウンロードしてくれない

これに関してはむしろ勝手にダウンロードするなという人もいると思う。それに、Mendeley Reference Managerを使うようになってからインポートした論文はダウンロードしなくても既にローカルに入っていると思われるので、この問題は「Mendeley Desktop使用時にライブラリに追加した論文」についての話だ。

困るのは、筆者のように、Mendeley Desktopの終了にともなってReference Managerの方に移行した時だ。
以前はMendeley Desktopでサクサク読めていた論文が、タイトルをクリックして数秒待たないと読めないのはけっこうイライラした。しかも致命的なことに一括ダウンロードする方法も見当たらない。

全ライブラリを対象とした本文検索が効かない

Mendeley  Reference Managerでは、論文を開いているときにその論文内で単語を検索することはできる。できなくなったのは、「その単語を含む論文を全ライブラリの中から出してくる」というやつだ。

本文のindexingがそもそもなされなくなったのか、それとも何らかのアクションをしないとindexingがなされないのかはわからないが、とにかく本文検索ができない。タイトルや著者名で論文を検索しないといけない。正直これはめっちゃ困る論文書くときのコロケーション(言い回し)検索エンジンとしてMendeleyを結構活用していたからだ。英文コロケーションの検索サービスとしてはだいぶ前からLudwig.guruを課金して使っているが、やはり自分の分野の論文に勝るものはない。


右クリックでできる操作が減った

これは些細なことと言われればそれまでだが、地味にイライラする。具体的に何がむかついたかというと、論文の本文を開いているときに本文を右クリックして出てくるメニューで、「コピー」ができなくなったことだ。

キーボードショートカットでCtrl + Cすればいいと思われるかもしれないが、これは結構面倒くさい。論文を読んでいるときは右手のマウス or 左右どっちかの手のタッチバッドでMendeleyを操作している(つまりキーボードは使っていない)。右クリックでできていたころはマウス or タッチバッドで動作が完結していたのに、わざわざキーボードを触らないといけなくなるのだ。積み重なるとストレスが溜まる。

ネット検索で情報が探しにくい

新ソフトの情報がとにかく探しにくい。まあ旧ソフト(Mendeley Desktop)と新ソフト(Mendeley Reference Manager)の名前が似すぎているので仕方がない。

Endnoteでも、Endnote onlineと製品版Endnoteが全く別物だったりして情報検索にあたっては結構辟易とした。しかし製品版Endnoteについては、日本代理店のユサコさんが、懇切丁寧な解説を日本語で出してくださっているし、本当にわからなければユサコさんに聞けばいいので、この点についてはかなり助かっている。

エルゼビア社はお金もってるんだから、もうちょっと、マニュアル作るとか、SEO対策で新ソフトの情報が上に来るようにするとか頑張ってほしい。

Watch folderが使えなくなった

正直これが一番大きい。とどめの一撃。
なんでwatch folder使ってるのかって?
そこには次に述べるような理由があるのですよ…。

さよならWatch folder

Watch folderとは

そもそもMendeley DesktopのWatch folderとは、ローカルにフォルダを設定しておけば、そこに入れた論文pdfのメタデータを読み取り、ライブラリに自動追加してくれるという機能だ。加えて、watch folder上のpdfをオンラインストレージに自動追加した上で、watch folderとは別のディレクトリに、ファイル名をいい感じリネームした上でダウンロードしてくれる。

もちろん、このwatch folderの機能、常にうまく動くわけではない。ていうかwatch folderで読み取られた文献情報は不十分かつ間違いも多く、そのまま引用に使えないことが非常に多かった。おそらくwatch folderが廃止になった理由の一つは、そこにあるだろう。しかしそれを踏まえても、Mendeleyのwatch folder機能は十分に便利だったのだ。

時代の波に呑まれたWatch folder

そもそもweb importerがあるのに、なぜwatch folderを使う必要があるのか?とお思いの方もいらっしゃると思う。筆者も最初はweb importerをメインで使っていた。だが、エルゼビア社以外の論文のダウンロードがうまくいかない場合がたまにあり、論文のダウンロードを確実に行うために徐々にwatch folderのみを使うようになっていた。

実は、この「論文pdfのダウンロード第一主義」という考え方こそ、Mendeley Reference Managerの開発者側に「時代遅れ」と見做された可能性がある。時代は(特に主にヨーロッパの学術界は)オープンアクセスまっしぐらだ。今後出版される多くの論文がオープンアクセスになる。出版社側でオープンアクセスになっていなくても、機関レポジトリ等で公開される論文が増える。分野によっては、arxiv等のプレプリントサーバーで必要な文献はだいたい読めたりする。オープンアクセスで論文が読める時代に、論文のダウンロードなんて必要か?という挑発なのかもしれない。

まあ、論文をダウンロードしなくてもいいというのはいささか過激であるにしても、オープンアクセスの時代には論文pdfの形態も様々になるだろうし、そもそも今後はpdf以外の形態の学術出版物も増えることは間違いない。そのような多様な形態のファイルからメタデータを取得するような無茶には、最初から挑みませんよ、という宣言なのだろう。論文メタデータは公式サイトやメタデータファイルから取得する、というのは至極まっとうな考え方だし、実際に、筆者も、論文を執筆する際には公式サイトからダウンロードした情報を使用するようにしている。

ただ、多少のメタデータを犠牲にしてでも、論文本文を確実にダウンロードできるという、watch folder機能のメリットは筆者には大きかった。いくらオープンアクセスが進んでも、過去の論文までさかのぼってオープンアクセスになるわけでは(おそらく)ないからだ。筆者の分野は、40年前とか50年前の伝統ある雑誌に載っている論文を普通に引用する分野だ。論文はダウンロードできる時にしておかないと手に入らない。研究者同士で論文のリンクではなくpdfを送りあうのは普通だ。まあ、メタデータを公式サイトからインポートしたあとそこにpdfファイルを添付すればいいのだろうが、普通に面倒くさい。

代替ソフトを探す中で見える、watch folderが本当に必要だった理由

Mendeley Reference Managerでwatch folderが使えないとわかってから、他の文献管理ソフトで同等の機能を持つものがないか色々と試した。

結論から言うと、同じ使い勝手で使えるものはなかった。やはり、これに関してはエルゼビアが一意に悪いというわけではなくておそらく時代の流れなのだ。以下簡単に結果を示す。

Endnote

Endnoteは、Edit > Preferences > PDF handlingから、「PDF Auto Import Folder」を設定できる。一見するとMendeley Desktopのwatch folder機能に近いが、重大な欠点がある。doiがついていない論文pdfからは、文献情報を取り込んでくれないのだ。

「doiが書かれていない論文pdfなんてあるんですか!?」と思ったそこのあなたであれば、Endnoteに乗り換えればwatch folder機能を使い続けることができる。

残念ながら筆者の分野は全然ダメだった。古いものはともかくとして、新しいものでも、Book chapterのような形式の論文は、pdfにdoiはついてなかった。結局、筆者の持ってた論文の半分くらいしか、情報取り込みはできなかった。

まあ、doi至上主義というEndnoteの思想はわからんでもない。正確でない情報をライブラリに載せたくないというEndnoteなりの配慮というか美学なのだろう。しかしこちらは既に、doiのついてない論文pdfを500本は所持しているのだ。これらのpdfをメタデータとどうやって紐づけろというのか。せっかく競合製品(Mendeley)から顧客を引き抜くチャンスなのに、ソフトウェア間の以降がスムーズでないのはよくない気がする。

もちろん、この文句はEndnote側にとっては少しフェアじゃないかもしれない。というのも最近のEndnoteは基本的に逆の思想(pdfからメタデータを取るのではなく、メタデータからフルテキストpdfを取得してくる)の機能を推しているからだ。Find Full Text機能というやつだ。Mendeley desktopからの移行に際しては、pdfをEndnoteに取り込もうとするのではなく、MendeleyからとりあえずメタデータをエクスポートしてEndnoteにぶち込み、あとはEndnoteにフルテキストpdfを探させるのもありかもしれない。

ただ、ユサコHPでも言われているように、Find Full Text機能も完璧なわけではない。


結局、オープンアクセスが浸透していない分野では、論文pdfはダウンロードできるときにしておけが鉄則なのであり、ローカル環境での文献管理がメタデータ中心ではなくpdf中心になってしまうのは仕方ない気がする。

Zotero

大量のdoiなし論文pdfを管理するにあたり、Endnoteがいまいち使えないことが分かったので、次はZoteroを試した。

Zotero導入には以下のサイトを参考にした。

https://note.com/sdeso/n/ndaf538c5a388#6VOH0

https://humosy.hatenablog.com/entry/2017/10/01/014034


まだ使い込んでいないので使い勝手についてジャッジはできないが、現時点でZoteroのいいなと思ったところは、アドオン追加で機能をカスタマイズできるところや、上記の、全ライブラリを対象とした本文検索が(一応)できることだ。本文プレビューがないのでコロケーション検索用の装置として使うのは難しいかもしれないが、そもそもEndnoteではできないので、そこは好感度が高い。

ところで、watch folder機能についてだが、ZotFileというアドオンを追加することで、昔は使えていたらしい。しかしversion 5.0.2以降は廃止されている。

http://zotfile.com/#hidden-options

なお、pdfリネーム機能は失われておらず、ZotFileを追加することで使える。

http://zotfile.com/#renaming-rules

そしてここが最も重要なのだが、Zoteroは、Watch folderの機能そのものは使えないものの、既に手元にあるdoiなしpdfたちからメタデータを読める範囲で読むということはやってくれる。素晴らしい。

筆者は、Folder Importというアドオンを使用して、doiなしpdfがたくさん入っている論文が入っているフォルダごとインポートを行った。

アドオンのインストールが終わったら、緑ボタンのところに"Add Files from Folder"というメニューが現れることになる。

エクスプローラがポップアップしてくるので、フォルダを選択したらこれが出てくる。詳しくが良くわからないが、「Store copy of files」を選択しないと、pdfメタデータを読み取ってくれないので注意

まずはファイルをインポートして、そのあと「メタデータを回収」してくれる。

これで、とりあえず手持ちの論文pdfについては、Zoteroを使ってデータベース化することができた。今までのように、とりあえず論文をダウンロードしてwatch folderにぶち込んでおいて自動で読み取らせることはできないが、必要に応じて手動で読み込ませることはできそうだ。これまでコツコツダウンロードしてきた古い論文たちが、怪文書の束とならなくてとりあえずよかった。

文献管理ソフトについて、現時点では、pdfファイルごとソフト間の移行を行うのはなかなか大変だというのが、今回のまとめであり感想である。

今後について

Mendeley Desktopなき今後、自分のマシンでの論文ハンドリングをどのように行っていくかについては、決め切れていない部分もある。とりあえず現時点では、

  • 筆者の分野的には、投稿論文用の文献リスト作成には、Endnote一択だと思うので、Endnoteを使う。ただしEndnoteは古いdoiなしpdfの読み込みやライブラリの全体検索に難があるので、普段論文を貯めていくデータベースとしては使うのは厳しい。

  • 手持ちの論文pdfについては、Zoteroで一応読み込みができたのでZoteroで管理する。今後ダウンロードする論文に関しても、Zoteroでの管理を試してみる。メタデータを公式サイトからとり、そこに添付ファイルをつけるというやり方でなるべく論文をインポートするようにする。デバイス間の論文pdf同期については、外部クラウドを用いてうまくやれるように今後調整する。

  • ライブラリに追加された論文pdfのディレクトリ構造については、EndnoteもZoteroも正直あんまり気に入らない。ディレクトリを探しさえすれば論文がばーっと入ってるMendeleyの方が個人的にはよかった。

  • ライブラリ全文検索に関しては、論文pdfが全体で4GBくらいになっている今、どういうソフトを使っても重くなってしまう。筆者はPCのスペック自体はまあまあ高いものを使っているので、CUIのコンソールでうまくやる方法を探す。

という感じになりそうだ。運用が安定したころにまた公開したいと思う。




この記事が気に入ったらサポートをしてみませんか?