Rによる極値分析（rGEV)

2022年4月24日 21:23

1．ｒGEVモデル

　rGEVモデルでは、各年の上位ｒ個のデータを用いて一般極値分布を割り当てる。気象データを用いた極値統計では1年間をブロックとして極値を毎年取得して分析する。途上国の気象データ、特に降雨データは限られている。仮に20年間観測されても、20個のデータしか得られないと十分な精度が得られない。上位ｒ個のデータを用いることで有意な分析を行うことができるかもしれない。
　RのismevではｒGEVモデルに当てはめて、rGEV(μ, σ, ξ) を対数尤度関数としてを用いてμ, σ, ξを算定する。これらが明らかになれば、以下によりT年の再現確率を求めることができる。

2．データの作成

　神戸市のGEVと比較するために、1897年から2013年までの日降雨データをダウンロードした。日付と日降水量(mm)が元データ、これにYearを付した。港町として開けたので古いデータがある。このような貴重なデータがいつでも誰でも入手できることはすごい。

各年の上位5位までのデータセットをPYTHONで作成する。
全ての日データをデータフレームdfに入れ込み、yy年毎にデータをqueryで切り出し、降順に並べ替えて最初の5行を切り出す。
df.query('Year == @yy').sort_values('rain', ascending=False).head(5)