見出し画像

地味にAIで絶滅危惧種をまとめた話

PDFの情報を手で書き写すのが面倒だったけど、ChatGPTさんにCSVにしてもらってラクにできたよ!という話。


やりたいこと

岡山県版レッドデータブック2020というPDFがあります。これから項目を幾つか抜き出して、Google Sreadsheetで閲覧できるようにしたいです。

こういうPDF
こんな感じの表にしたい

村で見られる絶滅危惧種をリストにして、僕ら専用のポケモン図鑑をつくるんだ!というのが動機です。生きものがたくさんいる山をこれからつくっていくために。

まずデータをダウンロードする

哺乳類、鳥類、爬虫類、両生類、昆虫類は作成済。今回は魚類。僕らが直接扱う生きものの中で魚類はそんな多くないからいいかな…とか思ってたけど「アブラハヤ」と思しきものの写真をメンバーが撮影していたのでスミマセンいれときます!という感じ。

データを分割する

ChatGPTが読み込めるデータは意外と少ないので10ページ弱に分割していく。Adobe Acrobatを使いました。

ChatGPTにCSV化してもらう

今回は「Convert species list to csv. The csv should have Common Name in Japanese, order in Japanese, family in Japanese, Conservation Status (Okayama) in Japanese, Conservation Status (Ministry) in Japanese.」としました。たぶん日本語でもいけるんじゃないか。

がんばって分析している

ChatGPTが失敗する

わりと失敗する。もう一度はじめからやりなおすとできることが多い。

日本語ファイルとかと相関がある気がする

ChatGPTからファイルをもらう

うまくいくとこんな感じでファイルダウンロードしてね!と言われる。ダウンロードする。

ちゃんとCSVになっている

文字コードの問題があるので、エクセルで見るときは「データの追加」からやるのがおすすめ。

あとは繰り返し

繰り返してね、と言う。何も言わずにファイルアップロードするだけで大丈夫だったりもする。

成果物

これが岡山県版レッドデータブックから一部の情報を抽出してリストにしたものだ!ChatGPTのおかげでだいぶ入力がラクでしたね。ぜんぶ一気にできないのはめっちゃ面倒だけど。うちの社内WikiとかもAIで処理したいけど、大量に処理する…というのが結構ハードル高くて困る。

まあ本当はもともと県の方でつくってるPDFのソースをCSVやらの形で公開してくれていれば一番ラクではあるけれども。こんど問い合わせてみよう。

とにかく、絶滅危惧種のリストがある程度揃いました!村の観察状況とかをここに記録していきます!前にnotionでも写真いりの図鑑つくってたんだけど、私の手違いで消えてしまったのでそちらはそちらで作り直し…。

少し生きもの系のことを勉強し始めたけど、こういうローカルなデータベースをちゃんと整備して公開しておくのは思ったよりも価値がありそうなので頑張ります。

編集は自由に可能なので、村のみんなも一緒にやろうぜ!

この記事が気に入ったらサポートをしてみませんか?