見出し画像

鳥の学名リストとの付き合いかた

いま進めている解析では、鳥1種につき複数の変数の値がくっついているデータセットを使って種間比較をしている。もともとは他の論文で公開されているデータセットをダウンロードしているのだけど、2000種近い学名がずらーっと並んでてもどんな鳥なのか全然想像できないし(私がそらで書ける学名は数種しかない...)、論文によって「科」「目」の情報があったりなかったりして、いちいち検索したりコピペしたりするの大変すぎない?ってなった。

こういうデータをよく扱っている人々はきっといい方法を知ってるんじゃないかという気がするんだけども、暫定で対策したのでメモ↓

パッと情報を追加する方法(仮)↓


1. 汎用データベースファイルを作る
「種」「科」「目」をセットにしたエクセルシートを作る。「科」「目」については和訳とセットにしたエクセルシートをそれぞれ作る。

とりあえず今まで検索してきた分と、公開されている日本鳥類目録↓・IOC World Bird List↓↓ をベースにして、あとは随時足していく予定。


2. INDEX関数とMATCH関数を使う
論文からダウンロードしたデータ(だいたいcsvファイル)の学名が入った列の横に新しく列を作って、

例えば「科」の情報を追加したかったら、1行目に

= INDEX(種DB!B$1:B$100, MATCH(A1,種DB!A$1:A$100,0))
※「種DB」シートのA列に学名、B列に科の情報が入っている場合
※ MATCH関数の最後の「0」は完全一致を指定している

みたいに入力して全行コピーするとパッとできる。

おわり


INDEX, MATCHって今まで知らなかったけど、同じ方法で、「特定の種のデータを別の論文のデータセットからひっぱってくる」のもパッとできるようになって便利だった。そもそもエクセルでやる必要はあるのか?って話ではあるんだけど...。


この記事が気に入ったらサポートをしてみませんか?