見出し画像

ベクトルのこと

ベクトルって言葉はいくつか違う意味で使われるよね、というお話。

「ゆるコンピュータ科学ラジオ」というYouTubeチャンネルで、大規模言語モデルの基礎(のさらに基礎)に関して取り上げています:

「ことラボ」というYouTubeチャンネルのりょーさんと共に、非常に平易にわかりやすく大規模言語モデルの根幹のアイディアを説明しています。

その中で「ベクトルとはなにか?」というお話がありました。パーソナリティーの堀元さんが水野さんにそれを質問すると「向きと長さがある量」「基底ベクトルの実数倍の和で表せるもの」と返答します。一方堀元さんはそれを「間違ってはいないけど…」と付け加えたうえで「複数の数字の組」と訂正しました。これに関しコメント欄ではちょっとした議論が起こっています。

水野さんの答えも堀元さんの答えも間違っていないと思います。以下私見による4種類の「ベクトル」という語の運用法に関して述べます。ただしこれらは必ずしも独立した概念ではなく、互いに関わっていることを断っておきます。

ベクトル空間の元としての「ベクトル」

ベクトルを「ベクトル空間の元」として語る立場があります。最も文句が付けられにくい定義がこれではないでしょうか。大学の数学科でベクトルと言ったらこれを指すことが多いのではないかと思います(しらんけど)。

ベクトル空間の定義を佐武一郎著「線型代数学」(裳華房)から引用します:

集合$${V}$$が次の二つの条件を満たすとき、$${V}$$はベクトル空間であるという。($${V}$$の元を $${\boldsymbol{a,b,\cdots,x,y,\cdots}}$$ 等で表わし、それらを一般に'ベクトル'と呼ぶ)

($${\mathrm{I}}$$) $${\boldsymbol{a,b}\in V}$$に対し$${\boldsymbol{a}+\boldsymbol{b}\in V}$$が定義され、これに関し次の法則が成立する。($${\boldsymbol{a}+\boldsymbol{b}}$$を$${\boldsymbol{a,b}}$$の和という)
 (1.1) $${(\boldsymbol{a}+\boldsymbol{b})+\boldsymbol{c}=\boldsymbol{a}+(\boldsymbol{b}+\boldsymbol{c})}$$ (結合の法則)
 (1.2) $${\boldsymbol{a}+\boldsymbol{b}=\boldsymbol{b}+\boldsymbol{a}}$$ (交換の法則)
 (1.3) 特別なベクトル$${\boldsymbol{0}}$$(零ベクトルという)が存在し、任意の$${\boldsymbol{a}\in V}$$に対し
 $${\boldsymbol{a}+\boldsymbol{0}=\boldsymbol{a}}$$
 (1.4) 任意の$${\boldsymbol{a}\in V}$$に対し$${-\boldsymbol{a}}$$(逆ベクトルという)が存在し
 $${\boldsymbol{a}+(-\boldsymbol{a})=\boldsymbol{0}}$$

($${\mathrm{II}}$$) $${\boldsymbol{a}\in V}$$、$${c}$$:スカラーに対しスカラー倍$${c\boldsymbol{a}\in V}$$が定義され、これと($${\mathrm{I}}$$)の加法に関して次の法則が成立する($${c\boldsymbol{a}}$$を$${\boldsymbol{a}}$$のスカラー倍という)
 (2.1) $${(cd)\boldsymbol{a}=c(d\boldsymbol{a})}$$ (結合の法則)
 (2.2) $${1\boldsymbol{a}=\boldsymbol{a}}$$
 (2.3) $${c(\boldsymbol{a}+\boldsymbol{b})=c\boldsymbol{a}+c\boldsymbol{b}}$$ (ベクトルに関する分配の法則)
 (2.4) $${(c+d)\boldsymbol{a}=c\boldsymbol{a}+c\boldsymbol{b}}$$ (スカラーに関する分配の法則)
※ 'スカラー'とはある体Kの元のこと

佐武一郎「線型代数学」(裳華房)P115より

この空間の元$${\boldsymbol{a},\boldsymbol{b}}$$などがベクトルです。ベクトルは太字(TeXでは\boldsymbol)で表されることが多いです。

いろいろ書いてありますが、よく見ればふつうのことばかりです。この定義では集合および演算が定義されて初めてそれがベクトルか否かがわかります。またベクトルの大きさ(ノルム)や内積が定義されているか否かは問いません。ベクトル空間にノルムを入れればノルム空間、内積を入れれば計量空間、さらにそれが完備ならばヒルベルト空間というように、どんどん性質のよい空間へと拡張することができます。

物理・工学ではふつうは内積までは入ってないと困ると思います。

数を並べたものとしての「ベクトル」

つぎに$${(1,2,3)}$$のように数を並べたものとしてのベクトルがあります。そのような対象がなす集合につけた名前です。堀元さんが述べたのはこの意味でのベクトルです。基本的には演算とは独立に語られ、それを見ただけでベクトルか否か判断できます。$${n}$$コの実数を並べたものの集合は$${\mathbb{R}^n}$$などと表記します。コンピュータ用語で言うなら型に相当するような概念かと思います。対義語は「スカラー」であり、これは(1つだけの)数です。

動画で堀元さんも述べている「ベクトルかスカラーか問題」はベクトルに関する演算子:

$${\text{grad}: \mathbb{R}\to\mathbb{R}^n,\ \text{rot}: \mathbb{R}^n\to \mathbb{R}^n,\ \text{div}:\mathbb{R}^n\to\mathbb{R},\ \text{外積}\ \times: \mathbb{R}^n\otimes\mathbb{R}^n\to \mathbb{R}^n,\ \text{内積}\ \cdot: \mathbb{R}^n\otimes\mathbb{R}^n\to \mathbb{R}}$$

及びそれらを組み合わせた演算の定義域と値域に関する問題です。コンピュータ科学なら関数の型推移に関する問題と言ってもよいかもしれません。

このベクトルの"定義"はあまり数学的ではないと思われるかもしれせんが、こういう「ベクトル」という語の用法が存在することは確かだと思います。上で引用した「線形代数学」でも最初は

一般に$${n}$$個($${n}$$は任意の正の整数)の数を一列に並べたものを$${n}$$次元のベクトルといい、その$${n}$$個の数をそのベクトルの成分という

佐武一郎「線型代数学」(裳華房)P1より

のようにベクトルを導入します。すぐにその演算に関して述べられますが、それでもまずは「数を並べたもの」として導入するのが直感的にもわかりやすいし、まずはそれで十分です。

ちなみに、数ではなく行列や演算子を並べたものもベクトルと呼ぶことがあります。例えばパウリ行列:

$$
\begin{aligned}
\sigma_1:=\begin{pmatrix}0 &1 \\1&0\end{pmatrix},  \sigma_2:=\begin{pmatrix}0 &-i \\ i&0\end{pmatrix}, \sigma_3:=\begin{pmatrix}1 &0 \\ 0&-1 \end{pmatrix}
\end{aligned}
$$

を3つならべたものを$${\boldsymbol{\sigma}:=(\sigma_1,\sigma_2,\sigma_3)}$$と書いたり、3次元の$${x,y,z}$$方向の微分演算子をならべて

$$
\boldsymbol{\partial}:=(\frac{\partial}{\partial x},\frac{\partial}{\partial y},\frac{\partial}{\partial z})
$$

と書いたりして、「パウリ行列のベクトル」「3次元微分演算子のベクトル」なんてと呼ぶこともあります。「ベクトル表記」と呼ぶこともあります。

幾何学的な「ベクトル」

絵に書く矢印としてのベクトル。これが高校生から大人までフツーに思うベクトルではないでしょうか。水野さんが述べていたのもこの意味での「ベクトル」です。

これは「ベクトル空間の元としての『ベクトル』」に含まれる概念ではありますが、このベクトルを考える際には空間にノルムや内積が導入されており、だいぶ性質のよいベクトル空間における元になります。

幾何学的な(そうじゃなくてもですけど)ベクトルは本来抽象的な概念であり、基底とは独立に存在します。フツーの$${n}$$次元空間(Euclid空間)を考え、あるベクトル$${V}$$を座標基底$${e_\mu}$$を用いて

$$
V=V^\mu e_\mu
$$

のように表します。ここで$${n}$$次元空間の場合$${\mu}$$は$${\mu=1,2,\cdots,n}$$をとります。上の式では$${\mu}$$が2回現れますが、この場合和が取られているものとします。つまり上の式は$${V=\sum_{\mu=1}^nV^\mu e_\mu}$$のことです。

一般にはこの係数$${V^\mu}$$をベクトルと呼ぶことが多いですが、本来は$${V}$$そのものを指すと思います。基底まで指定して初めてベクトルは定まります。

ベクトルの表し方は一意的ではないです。違う基底$${\tilde e_\mu}$$を用いれば

$$
V=V^\mu e_\mu=\tilde V^\mu \tilde e_\mu
$$

のように同じベクトルの違う表現を得ます。

余談ですが、多様体上の微積分を考える際には、多様体$${M}$$上の点$${p}$$における接空間と呼ばれるベクトル空間を考えます。これを$${T_pM}$$のように表します。ひとつ(局所的な)座標$${x^\mu}$$を定めれば、$${T_pM}$$上の基底ベクトル$${e_\mu}$$は微分演算子$${e_\mu=\partial/\partial x^\mu}$$になります。そして上にも述べたように、ベクトルは座標の取り方に依存しない概念です。ある接空間$${T_pM}$$上のベクトルは違う座標$${x,y}$$により

$$
X=X^\mu\frac{\partial}{\partial x^\mu}=\tilde X^\mu\frac{\partial}{\partial y^\mu}
$$

のように違う表し方ができます。このとき

$$
\tilde X^\mu = X^\nu \frac{\partial y^\mu}{\partial x^\nu}
$$

です。さらに$${T_pM}$$に双対なベクトル空間$${T^*_pM}$$なるものを考えることができます。これは$${T_pM}$$から実数$${\mathbb{R}}$$への線形関数からなるベクトル空間です。つまりは$${T_pM}$$の元と内積をとる対象が$${T^*_pM}$$だと思えばいいです。例えば縦ベクトルに左から横ベクトルをかけると数になりますが、この縦ベクトルと横ベクトルの関係のようなものです。「微小変化」$${dx^\mu}$$は$${T^*_pM}$$の双対な基底です:

$$
\left\langle dx^\mu,\frac{\partial}{\partial x^\nu}\right\rangle=\frac{\partial x^\mu}{\partial x^\nu}=\delta^\mu_\nu
$$

ここで$${\langle \ , \ \rangle}$$は内積を表す記号です。$${T_pM}$$のベクトル$${X=X^\mu\partial/\partial x^\mu}$$と同様、$${T^*_pM}$$のベクトルは$${\omega=\omega_\mu dx^\mu}$$のように表せ、その内積は

$$
\langle\omega,X\rangle=\omega_\mu X^\nu \left\langle dx^\mu,\frac{\partial}{\partial x^\nu}\right\rangle=\omega_\mu X^\mu
$$

となり、確かにフツーの「ベクトルの内積:$${\omega_\mu X^\mu}$$」になります。

Lorentz変換の表現の種類としての「ベクトル」

これがいちばん特殊な使い方かと思います。主に物理学で、特に相対論と関わる分野における用語です。この意味でのベクトルを簡単に説明すると「時間や空間と同じように回転する対象」のことです。空間の回転とはふつうの回転です。しかし時間が回転するというのはよくわからないかもしれません。相対論では違う慣性系における時間の関係は時間だけに閉じず、時間と空間の両方に依存します。時間と空間を混ぜる変換は回転のようにみなせてブースト(又はLorentzブースト)と呼ばれます。ブーストと空間回転を合わせてLorentz変換と呼びます。回転は回転の平面ごとに存在します。時間$${t}$$と空間$${x,y,z}$$の4次元における回転は$${t\text{-}x,t\text{-}y,t\text{-}z,x\text{-}y,y\text{-}z,z\text{-}x}$$の6つの回転平面で指定されます。Lorentz変換はよく$${\Lambda^\mu{}_\nu}$$のように表記されます。これは行列であり、行の足が$${\mu}$$、列の足が$${\nu}$$です。足の上下は空間の内積の定義に関わるのですが、ここでは気にしないでください。

Lorentz変換による変換の仕方を分類すると一意的ではなく様々なものが存在します。それに伴い、変換が作用する対象によって$${\Lambda^\mu{}_\nu}$$も異なります。そのうち「ベクトル」と呼ばれるものがあります。例えば$${v^\mu}$$がこの意味でのベクトルだとします(意味をはっきりさせるためLorentzベクトルと呼ぶこともあります)。このとき、時空$${x^\mu:=(ct,x,y,z)}$$($${c}$$は光速)が$${\Lambda_\text{(v)}^\mu{}_\nu}$$なる行列で

$$
x^\mu \xrightarrow{\text{Lorentz変換}}\Lambda_\text{(v)}^\mu{}_\nu x^\nu
$$

と変換するなら、$${v^\mu}$$も

$$
v^\mu \xrightarrow{\text{Lorentz変換}}\Lambda_\text{(v)}^\mu{}_\nu v^\nu
$$

で変換します。

抽象的な4次元の回転を表す記号を$${\hat\Lambda}$$としたとき、それを具体的に行列等で表現したものを$${D(\hat\Lambda)}$$と書きます。これを$${\hat\Lambda}$$の表現と呼びます。$${\hat \Lambda}$$が同じでも$${D(\hat\Lambda)}$$には様々なもの、すなわち違う表現があります。表現にはベクトルの他にもスピノルやテンソルがあります。電子はスピンを持つといいますが、スピンはLorentz変換の表現のうちのスピノルに相当するものです。不思議なことにスピノル表現は空間の360度回転に対して元に戻らず、720度回転で初めて元に戻ります。以下の資料

https://onlinelibrary.wiley.com/doi/pdf/10.1002/9783527630097.app1

に具体的なベクトルおよびスピノルの回転行列(A.27)、また実際に簡単に行える「360度回転では元に戻らないが720度回転で元に戻る現象の実験」(Figure A.1)が載っていますので、興味ある方はご参照ください。

言いたかったこと

本記事で述べたように、ベクトルと言ってもいくつか違う意味で使われます。あんまり目くじらたてずに、それぞれの立場を尊重するのがよいと思います。

おしまい。$${{}_\blacksquare}$$

この記事が気に入ったらサポートをしてみませんか?