トランスフォーマーの自己アテンションの理解⑦エンコーダ・ブロックの詳細

2023年1月9日 22:19

本シリーズの記事リスト

この記事では、エンコーダ・ブロックの詳細を解説します。論文の図１の左側になります。

エンコーダ・ブロックの内部にある、マルチヘッド・アテンション（Multi-head Attention）、位置ごとのフィード・フォワード（Position-wise Feed-Forward）、残差接続（Residual Connection）、レイヤー正規化（Layer Normalization）などを解説します。

では、さっそく始めましょう。

エンコーダ・ブロック

オリジナルのトランスフォーマーのエンコーダは６つのエンコーダ・ブロックが階層をなしています。上図では、Nxと書かれていますが、これは「N階の層になっている」の意味です。６つの層を展開するなら以下のようになります。

上手では、「エンコーダ・ブロック」を単に「エンコーダ」としています。これは図を複雑にしないためでもありますが、同じ仕組みを積み上げただけなので「エンコーダ」と省略して呼んでも間違いではないからです。

以下は、エンコーダの図を日本語にしたものです。

ここから先は

5,548字 / 11画像

キカベン・読み放題

¥1,000 / 月

初月無料

人工知能、機械学習、ディープラーニング関連の用語説明、研究論文の概要、プログラミングの具体例などの読み応えのある新しい記事が月に４−５本ほど追加されます。また、気になるAIニュースや日常の雑観などは随時公開しています。

メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示
メンバー限定掲示板を閲覧できます
メンバー特典記事を閲覧できます
メンバー特典マガジンを閲覧できます

このメンバーシップの詳細

ログイン

この記事が気に入ったらサポートをしてみませんか？