Transformerとは何か？

2025 11/14

2025年11月14日 2025年11月14日

Post Views: 109

Transformerは、2017年にGoogleが発表した論文「Attention Is All You Need」によって提案された深層学習モデルであり、現在の生成AIと大規模言語モデル（LLM）の基盤を成すアーキテクチャです。これ以前の自然言語処理では、RNNやLSTMのような「単語を順番に処理する」仕組みが主流でしたが、Transformerはそれらを完全に置き換え、高度な文脈理解、長文処理、圧倒的な学習効率を実現しました。

Transformerの中心的な革新は、Attention（注意機構）、とくに Self-Attention（自己注意） にあります。これは、文中の単語が他の単語とどのように関係しているかを一度に学習する仕組みです。RNNのように文を逐次的に読むのではなく、Transformerは文章全体を「一気に」読み込み、文脈的なつながりを同時に把握できます。そのため、長距離依存関係──たとえば文頭の主語と文末の述語の関係──を正確に処理できます。

Self-Attentionの仕組み

Self-Attentionでは、各単語が「Query（質問）」「Key（鍵）」「Value（値）」という3種類のベクトルに変換されます。モデルはQueryとKeyの類似度を計算し、「どの単語にどの程度注意を向けるべきか」を決定します。そしてValueを重み付けして合成することで、文脈情報を反映した新しい単語表現を生成します。

この仕組みにより、