한 가족을 생각해보자. 이 가족에는 $P_1$ 과 $P_2$라는 이름을 가진 부모가 있고, 창의력이 너무 뛰어난 나머지 아이들의 이름을 $C_1$과 $C_2$로 지었다. 이제 아이들이 매 달 용돈을 받는다고 생각해보자. 아이들이 받는 용돈도 $C_1$과 $C_2$라고 하겠다. 용돈은 부모들의 월급과 관련이 있고, 부모들의 월급도 마찬가지로 $P_1$과 $P_2$라고 쓰겠다. 아이들의 용돈은 다음과 같다.
$$C_1=\frac{1}{10}P_1+\frac{1}{6}P_2$$ (8.1.1)
$$C_2=\frac{1}{9}P_1+\frac{1}{8}P_2$$ (8.1.2)
말로 표현해보면, 아버지는 아들에게 월급의 1/10을 주고 어머니는 월급의 1/6을 주신다. 비슷하게 딸은 아버지 월급의 1/9, 어머니 월급의 1/8을 받는다.
부모님의 월급이 얼마든 상관 없이, 자식들은 항상 일정 '부분'을 받는다. 이런 경우에 우리는 변하지 않는 부분을 특정한 형태로 쓸 수가 있다. 이를 일정한 배열, 또는 '행렬'로 쓰는 것은 논리적이다.
$$M=\begin{bmatrix} \frac{1}{10} & \frac{1}{6} \\ \frac{1}{9} & \frac{1}{8} \end{bmatrix}$$ (8.1.3)
논리는 다음과 같다. 각각이 받는 용돈은 자연적으로 두 집합으로 나누어진다 : 아들이 받는 것과 딸이 받는 것. 이것이 두 행을 만든다. 각각의 행에서, 다시 또 두 집합이 있다 : 아버지가 준 것과 어머니가 준 것. 이것이 두 열을 만든다. 일반적인 경우로 확장하면, 우리는 부모님이 주는 용돈을 다음과 같이 쓸 수 있다.
$$M=\begin{bmatrix} M_{11} & M_{12} \\ M_{21} & M_{22} \end{bmatrix}$$ (8.1.4)
'행렬 요소' $M_{ij}$는 $i$행과 $j$열에 있는 것을 말하고, 자식 $i$가 부모 $j$로부터 받은 용돈을 의미한다. 우리는 이를 일반적인 경우에 다음과 같이 쓸 수 있다.
$$C_1=M_{11}P_1+M_{12}P_{2}$$ (8.1.5)
$$C_2=M_{21}P_1+M_{22}P_{2}$$ (8.1.6)
이 표현을 $m$개의 행과 $n$개의 열을 가진 행렬로 더 일반화해보자. $m$개의 행과 $n$개의 열을 가진 행렬은 $m~\mathit{by}~n$ 행렬 또는 $m \times n$ 행렬이라고 부른다. 두 개의 2 by 1 행렬을 살펴보자 :
$$C=\begin{bmatrix}C_1\\C_2\end{bmatrix}$$ (8.1.7)
$$P=\begin{bmatrix}P_1\\P_2\end{bmatrix}$$ (8.1.8)
$m=n$인 행렬은 '정사각행렬'이라고 부르고, $n=1$인 행렬은 '열벡터', $m=1$인 행렬은 '행벡터'라고 부른다. 우리는 오직 이 세 종류의 행렬들만 다룰 것이다. 추가적으로, 몇 가지 예외를 제외하고, the name matrix 는 정사각 행렬을 의미하는 데 사용되곤 할 것이며, 열과 행벡터도 마찬가지로 언급될 것이다.
다음으로 우리는 행렬을 더하고 곱하는 표기를 볼 것이다. 순수 수학의 세계에서, 규칙이 일관적이라면, 누구나 원하는 대로 규칙을 만들 수 있다. 그러나 어떤 정의들은 다른 것들보다 더 유용하다는 것이 증명되었고, 다음에 나올 정의들도 마찬가지이다.
[정의 8.1] $M$과 $N$이 같은 차원(같은 행과 열의 개수)을 가진 두 행렬이라면, 그 둘의 합 $T=M+N$은 요소들의 합 $T_{ij}=M_{ij}+N_{ij}$와 같다.
[정의 8.2] $a$가 숫자라면, $aM$은 요소들이 $(aM)_{ij}=aM_{ij}$인 행렬로 정의된다.
[정의 8.3] $M$이 $m~\mathit{by}~n$ 행렬이고, $N$이 $n~\mathit{by}~r$ 행렬이라면, 그들의 곱 $MN$은 $m~\mathit{by}~n$ 행렬이고 요소들은
$$(MN)_{ij}=\sum_{r=1}^{n} M_{ir} N_{rj}$$ (8.1.9)
합은 기억하기 쉽지만, 곱은 연습이 조금 필요하다.
곱행렬의 $ij$ 요소를 얻기 위해서, 여러분은 (벡터의 요소들이라고도 말할 수 있는) 첫 번째 행렬의 $i$번째 행과 (마찬가지로 말할 수 있는) 두 번째 행렬의 $j$번째 열을 취해야 한다.
행렬의 곱은 첫 번째 행렬의 열 개수와 두 번째 행렬의 행 개수가 같지 않으면 정의되지 않는다. 마찬가지로 행렬의 덧셈은 두 행렬이 같은 차원이어야 정의된다. 여기 몇 가지 예시가 있다.
$$\begin{bmatrix}1&2\\3&4\end{bmatrix} \begin{bmatrix}4&2\\1&3\end{bmatrix} = \begin{bmatrix}6&8\\16&18\end{bmatrix}$$ (8.1.10)
$$\begin{bmatrix}11&13&15\\17&19&21\\23&25&27\end{bmatrix} = \begin{bmatrix}1&2&3\\4&5&6\\7&8&9\end{bmatrix}+\begin{bmatrix}10&11&12\\13&14&15\\16&17&18\end{bmatrix}$$ (8.1.11)
$$\begin{bmatrix}1&2\\3&4\end{bmatrix} \begin{bmatrix}4\\1\end{bmatrix}=\begin{bmatrix}6\\16\end{bmatrix}$$ (8.1.12)
예를 들어, 식 (8.1.10)에 있는 2 by 2 행렬의 (1, 1)에 있는 숫자 6은 다음으로부터 얻어진 것이다 : $6=1\cdot 4+2 \cdot 1$. 비슷하게 (2, 1)에 있는 16은 $16=3 \cdot 4 + 4 \cdot 1$으로부터 얻어졌다. 여러분은 다른 요소들도 비슷하다는 것을 확인할 수 있을 것이다.
이제 우리는 식 (8.1.6)을 행렬의 식으로 적을 준비가 되었다 :
$$\begin{bmatrix}C_1\\C_2\end{bmatrix} = \begin{bmatrix} M_{11} & M_{12} \\ M_{21}&M_{22}\end{bmatrix} \begin{bmatrix} P_1 \\ P_2\end{bmatrix}$$ (8.1.13)
아니면 더 간단하게,
$$C=MP$$ (8.1.14)
로 적을 수도 있는데, $C$, $M$, 그리고 $P$는 위에서 정의된 요소들을 가진 행렬이다.
처음 행렬을 곱하는 규칙을 배울 때, 여러분은 어떻게 이게 자연스러운 건지, 아니면 규칙을 만들 때 어떻게 이런 방법에 도달했는지 물어볼 수도 있을 것이다. 곱의 $ij$번 째 요소는 두 행렬의 $ij$번 째 요소 두 개를 곱해서 얻는 것이 더 자연스러운 것 아닌가? 이런 정의는 (만약 받아들여진다면) 우리가 위에서 정의한 행렬곱과 같은 적용성을 가지지 않는다. 예를 들어, 월급과 용돈 관계를 간단하게 $C=MP$(식 (8.1.14))로 적었던 것은 현재의 곱셈 규칙을 사용해서 예측될 수 있다. 또 다른 장점으로, 우리의 예시에서 부모님의 모든 월급이 조부모님에게서 받는 거라고 가정해보면 다음과 같이 쓸 수 있다.
$$P=NG$$ (8.1.15)
(열벡터로 나타내지는) $G$는 조부모님의 월급이고 $N$은 분배와 관련된 행렬이다. 조부모님의 월급은, 부모님이 자식들에게 $C=MP$라는 일정한 비율로 주는 돈을 포함하고 있다. 그러면 어떻게 $C$와 $G$를 바로 연결시킬 수 있을까? 아주 간단하다 :
$$\begin{matrix} C & = & MP \\ & = & MNG\end{matrix}$$ (8.1.16) (8.1.17)
곱 $MN$은 정해진 규칙에 따라 구해진다. 만약 식(8.1.6)과 같은 분명한 형태로 돌아가서, $P_1$, $P_2$를 $G_1$, $G_2$로 표현하고, $C_1$과 $C_2$의 관계와 비교해보면, 우리는 위에 있는 것에 동의할 수 있는 결과를 발견할 것이다. 예를 들어,
$$\begin{matrix} C_1&=&M_{11}P_1+M_{12}P_2
\\ &=&M_{11} \left[ N_{11}G_1+N_{12}G_2 \right] + M_{12} \left[ N_{21}G_1+N_{22}G_2 \right]
\\ &=&\left[M_{11}N_{11}+M_{12}N_{21}\right]G_1+\left[M_{11}N_{12}+M_{12}N_{22}\right]G_2
\\ &=&(MN)_{11}G_1+(MN)_{12}G_2 \end{matrix}$$ (8.1.18)-(8.1.21)
만일 부모님의 월급을 입력값으로 보고 자식들의 용돈을 출력값으로 본다면, 행렬 $M$은 두 값과 관련이 있다. 입력값이 변하면(부모님의 월급이 변하면), 출력값도 변한다. 그러나 두 값과 관련된 행렬은 변하지 않는다. 또한 이 문제의 입력값 $P$는, 다른 것의 출력값으로도 볼 수 있다. (예 : $P=NG$) 이런 경우에 행렬곱은 두 단계의 문제를 한 단계로 전환하는 행렬을 제공한다. 우리의 예시에서는 조부모님의 월급과 자식들의 용돈에 관한 문제였다.
이제 또 다른 예시를 보자. 일반적인 직교 좌표계에서 좌표가 $(x_1, x_2)$인 평면 위의 한 점을 생각해보자. 그 좌표계와 반시계 방향으로 $\theta$만큼 회전된 다른 직교 좌표계를 사용한다고 가정하자. 기초적인 삼각법을 사용하면 같은 점이 새로운 좌표계에서 좌표 $(x_1^\prime, x_2^\prime)$로 다음과 같이 나타난다는 것을 쉽게 볼 수 있다.
$$x_1^\prime~=~x_1 \cos{\theta} + x_2 \sin{\theta}$$ (8.1.22)
$$x_2^\prime~=~-x_1 \sin{\theta} + x_2 \cos{\theta}$$ (8.1.23)
이것은 간단하게 다음과 같이 쓸 수 있다.
$$X^\prime = R_{\theta} X$$ (8.1.24)
당연하게, '회전 행렬' $R_{\theta}$는 다음과 같다.
$$R_{\theta} = \begin{bmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{bmatrix}$$ (8.1.25)
다시 한번, $X$를 입력값, $X^\prime$을 $R_{\theta}$의 출력값이라고 생각해보자. 행렬 표기의 요점은 이것이다 : 물리적 과정이 동일한 한, 다시 말해 축의 회전에서, 평면 상의 모든 점들이 새로운 좌표를 갖는다. 행렬 $R_{\theta}$는 여러분이 어떤 점에 관심있는 지는 신경쓰지 않고, 회전이 최종적으로 어떻게 되는지를 결정할 뿐이다. 비슷하게 부모님의 월급이 달라지면 자식들의 용돈이 달라진다. 그러나 행렬 $M$은 최종적으로, 자식들 용돈의 변치않는 부분을 결정한다.
축이 회전한다고 말하는 대신에, 우리는 $(x_1, x_2)$인 벡터가 시계방향으로 $\theta$만큼 회전하여 $(x_1^\prime, x_2^\prime)$이 된다고 말할 수도 있다. 이것을 '능동적 변환(active trasformation)'이라고 하고, 앞에서 했던 축이 회전하는 것을 '수동적 변환(passive transformation)'이라고 한다. 능동인 경우에, 축은 고정되어 있고 벡터들이 회전하며, 수동인 경우에 벡터들은 고정되어 있고 축들이 능동과 반대 방향으로 회전한다.
또 다른 경우로, $\theta$ 만큼 회전하고 또 $\theta^\prime$만큼 회전하는 변환 과정을 생각해보자. 이는 행렬 $R_{\theta}$와 $R_{\theta^\prime}$로 생각할 수 있다. 만약 $X^{\prime\prime}$이 최종 결과라면, 이는 행렬 $R=R_{\theta^\prime} R_{\theta}$로 $X$와 연관이 되어 있는 것이다. 이제 여러분은 결과가 $\theta+\theta^\prime$만큼의 회전이 되어야 함을 알 것이다. $R_{\theta^\prime}R_{\theta}$는 당연히 $R_{\theta+\theta^\prime}$과 같다.
[예제 8.1.1] $R_{\theta+\theta^\prime}=R_{\theta^\prime}R_{\theta}$임을 보여라.
이제 두 예시들(용돈과 회전)을 더 일반적인 뼈대에 끼워맞춰보자. 예시들은 둘 다 '선형 변환'이다. 즉, 변수들 사이에는 선형 관계가 있다. 예를 들어 새로운 좌표들은 예전 것들의 선형(일차) 조합으로 주어진다 : 눈으로 보기에도 더 높거나 낮은 지수들은 없다.
'<수리물리학> > [Shankar] 수리물리학' 카테고리의 다른 글
[Ch1.한 변수에 대한 미분법] 1.1 도입 (0) | 2023.05.02 |
---|