見出し画像

『「GISでデータ分析」できるようになるまでの話』を読んでみて

noteにGISという言葉が出てると気付き、つい拝見したのが以下の記事です。

感慨深いものがありました。私はアメリカでこの記者のようにGISの可能性に期待し、1から学び直し、地理学で博士号をとり、GIS Professional (GISP)という資格もとりました。でも日本ではあまりGISは認知されていないとも気づきました。NHK取材ノートとしてGISが紹介された記事を見るのは本当に嬉しかったです。

ESRIというGIS系アプリやサービスを提供しているアメリカで一番大きなGIS系の会社があります。ESRIの提供するArcGISはアメリカの大学ではデファクト・スタンダードと言っていいぐらいです。以前その会社主催のカンファレンスに参加した際、と言ってもCOVID19の前ですから2,3年以上前になりますが、日本から来られた方々と話す機会を得ることができました。その方々も理解されていましたが、日本の地理情報、位置情報を利用するという環境は、アメリカと比べてもかなり遅れています。

GISというのは記事で紹介されていた無料で使える「QGIS」や、最近は個人で使うなら年間100ドルで高度な空間分析に必要なExtensionも含めて提供してきたArcGISという「ソフトウェア」を使うだけの話ではありません。昔から色々と議論はあるのですが、GISのSはシステムのS、サービスのS、サイエンスのSとも言われています。

スマホの位置情報から近くのお店を紹介されたり、行き先を示してくれたり、地震がどこであり、津波の可能性や、それがどのあたりまで影響するかとか、GISという言葉を全く知らないにも関わらずGeographic Information(地理情報、位置情報)を利用したサービスというものは世の中にあふれていますし、どんどん具体的、高精度になってきています。

地理学では必ず取らなければいけないコースがあったのですが、その時に言われた事がとても印象に残っています。地図を含め地理学というのは人間が存在した時からあった。意識するにせよしないにせよ、戦略・戦術として必須だったと。

簡単に言えば、狩猟で、どこらへんで狩りをすればいいのか、木の実を含めてどこらへんに食べるものが存在するのかから始まり、現在ではGoogle Maps一つで知らない土地、知らない外国に行っても、ある程度どこに行くか、どこの店や観光地に行くかも決められる。全く意識しないにも関わらず、毎日、地理情報を使って行動を決めていると。

そうか、それならGIS(地理情報システム・サービス・サイエンス)はそんな私達の生活を支えるのに役立つと当時強く思いました。

アメリカでも日本のドラマを見ることができるようになりましたが、GISを利用しているなあと最初に思ったのは「科捜研の女」でしょうか。初めて見たときは、靴についていた植物を、植生分布図からどこらへんから得られたものか分析してたものでした。植生分布図があるのを見た時、そんなデータもってるの?!と驚いた覚えがあります。ドラマ上のものか、本当に警察がそんなデータもっているのか私にはわかりません。ですが持っているとしたら凄いです。

名前は忘れましたが別のドラマで「遺伝子マップ」という言葉も聞こえました。遺伝子の配列情報ではなく、同じ植生でも、場所によって遺伝子が異なり、グルーピングができるのではないかと。こういった細かな情報があればあるほど分析は助かります。

そしてGISは地図を重ね合わせて分析できるだけでなく、データをもとにした予測にも役立ちます。詳細は省きますが、記事で紹介されていたように「地形」データがあれば、私の場合「海の底の地形」データですが、それを元に、ある種の魚がどこに集まって産卵するか予測することができ、それを元にメキシコで今まで発見されていなかった3箇所の産卵場所の保護地域設定に関わった事があります。魚によっては絶滅が危惧されている中、妊娠中の魚を殺すのはやめよう、魚とるなら産んだ後にしようよというためのものです。

日曜劇場「DCU」で日本の水域から出る船を追ってるシーンがありました。多くの場合AISといった船の現在地を追うシステムがあるからできるのですが、それを元に違法漁業をしている人たちを見つけることをしたり、年間データからどこらへんに漁業のホットスポットがあるか特定してみたりと言ったサービスもあります。

地理情報を使う場面は至る所にあるんですよね。

ただGISというシステムやソフトウェア、データサイエンスで使われているGeospatial PythonやSpatial SQLといった、データ分析のツールやライブラリ以上に大事なのは、そこで使われる「データ」です。

記事で指摘されていたように、日本の場合、地理情報データ提供の仕組みがアメリカと比べて10年以上遅れている気がします。しかもPDFとか!! 

オープンデータというのは本当に大事です。学生の多くはお金ないのでQGISかアメリカでは大学でArcGISを使うのですが、データがないと何もできません。教えている教授陣も多くのオープンデータがあればいろんな事ができて、面白い課題も与えられたり、それを元に学生から面白いアイデアや工夫が出たりもします。ですが、使えるオープンデータが少なければ、そのまま使われるデータも問題も一緒になり、教える側としては楽なんですが、発展なんてありません。

覚えていらっしゃるでしょうか。COVID19のデータの素晴らしいダッシュボードを作成したのは学生です。全米で全世界で見られたダッシュボードです。日本版も作られていたのでご覧になられたかたもいると思います。あれ、データさえあれば結構簡単につくれるんです。実は難しくないんです。ArcGIS Onlineといった環境ある大学なら授業の課題としてだしてもいいようなものです。ですがすごいインパクトがありました。メディアでもかなり使われました。

GISを使ったデータ分析は地図を利用するので本当にわかりやすいです。もっと使われることを期待しています(もちろん地図の見た目で騙したり別の目的に誘導するみたいなこともできるのですがそれはまた別の機会に)

そして日本でオープンデータ(一般公開データ)がさらに増えることを期待しています。


余談・BigDataに関して

QGISやArcGISではBigDataの分析には向きませんから、どうしてもクラウド側で大量のデータを処理した結果をQGISやArcGIS側で最終的に加工して地図と重ね合わせてわかりやすく表示する形が取られています。ですがこの辺もちょっと不安です。

例えば農業において天候・気象データというのはとても大事です。農業系データサイエンスに関わるようになり学んだのですが、ものすごく大雑把に言うと一日の最高温度と最低温度の差を分析に利用して、どこの土地がより実りが多くなっていくかとか、これだけの密度で種をまいてもいい場所と、そうでない場所はどこかとかまで分析しています。

特定の場所(緯度・経度)での過去10年分の天候データの変化を元に収穫量との関連を知りたいといった事をする場合、あまりにものデータ量に簡単にはデータを取得・分析ができません。
関わっているので言えることですが、Google BigQueryを始めとするBigDataを扱うクラウド環境があれば、10年分の天候データ(毎日の最高気温、最低気温、風速、最大風速、湿度、雨量などなど)をとってくるのにも数分、数秒で済むようになってきました。しかもGISも簡単な機械学習もBigQuery上でできるようになっているわけですから、利用しない点はありません。

アメリカの気象庁であるNOAAから天候データが一般公開されています。それを元に日本の情報をとってくるブログも結構あります。ですが、日本の気象情報ならアメダスの情報をみたいとも思うわけです。いちいちCSVファイルをダウンロードするのでなく、アメダスの情報がBigQueryとかRedshiftから使えるようになればとても便利なのですが。







この記事が気に入ったらサポートをしてみませんか?