GRU

・GRU:従来のLSTMでは、パラメータが多数存在していたため、計算負荷が大きかった。GRUではパラメータを大幅に削減し、精度は同等またはそれ以上が望めるRNN構造。

画像1

確認テスト:LSTMとCECが抱える課題について、それぞれ簡潔に述べよ

回答:LSTMは計算量が大きい、その構造の中のCECは時間依存度に関係なく重みが一律で学習特性が無い。

確認テスト:LSTMとGRUの違いを簡潔に述べよ

回答:LSTMはメモリセル(CEC)を使うことで勾配消失問題を回避し、さらに入力ゲートと出力ゲートを導入してメモリセルの重み一律の問題を解決した。GRUはメモリセルをなくして忘却ゲートと入力ゲートを合体させたモデルである。

考察

・GRUはLSTMを基に削減せるものを削減し、簡素化に成功した。しかし、メモリセルがないため、機械翻訳などのタスクのパフォーマンスがLSTMより劣ることがある。そして、時間系列の連続したデータの復元ではRNNとGRUの方が円滑に生成できることが多い。三者は異なるタスクに使い分けをしなければならない。

この記事が気に入ったらサポートをしてみませんか?