행렬식
정사각 행렬을 행 교환 없이 triangular matrix로 소거하였을 때 pivot의 곱은 determinant(행렬식, 결정자)이다. 이는 가우스 소거법에서 정의한 것이다. 구체화하면 determinant는 다음을 만족시켜야 한다:
- 행 교환 또는 열 교환을 하면 부호가 바뀐다.
- 각 행과 열에 대해서 multilinear이다. 예를 들어 \det \begin{pmatrix}a[A]_1+b[B]_1 & [A]_2 & \cdots & [A]_n\end{pmatrix}^T=a\det \begin{pmatrix}[A]_1 & [A]_2 & \cdots & [A]_n\end{pmatrix}^T+b\det \begin{pmatrix}[B]_1 & [A]_2 & \cdots & [A]_n\end{pmatrix}^T이다.
두 번째 조건을 예를 들어 확인해 보겠다. \displaystyle \begin{pmatrix} 6 & 5 \\ 3 & 4\end{pmatrix}를 upper triangular matrix로 만들려면 첫째 행에 1/2을 곱해 둘째 행에서 빼야 한다. 그러면 \displaystyle \begin{pmatrix} 6 & 5 \\ 0 & 1.5\end{pmatrix}이므로 determinant는 9이다. 행 교환을 하여 \displaystyle \begin{pmatrix} 3 & 4 \\ 6 & 5\end{pmatrix}를 upper triangular matrix로 만들려면 첫째 행에 2를 곱해 둘째 행에서 빼야 한다. 그러면 \displaystyle \begin{pmatrix} 3 & 4 \\ 0 & -3\end{pmatrix}이므로 determinant는 -9이다.
따라서 다음이 성립한다.
- 두 행 또는 두 열이 서로 같으면 행 교환 또는 열 교환을 해도 행렬식의 부호가 바뀌지 않으므로 행렬식은 0이다.
- 한 행 또는 한 열에서, 다른 행 또는 다른 열에 scalar를 곱한 것을 더하여도 행렬식이 바뀌지 않는다. 예를 들어 첫 번째 행을 [A]_1+b[A]_i로 만들면 b\det \begin{pmatrix}[A]_i & [A]_2 & \cdots & [A]_n\end{pmatrix}^T 부분은 [A]_i가 두 번 등장하므로 0이다.
- 한 행 또는 한 열의 모든 성분이 0이면 다른 행 또는 다른 열을 더하여 두 행 또는 두 열이 서로 같아지게 할 수 있으므로 행렬식은 0이다.
- \det A\det B=\det AB이다. 둘 다 singular가 아닌 행렬일 때 B를 고정시키면 A의 두 행을 바꿀 때 AB의 두 행이 바뀌고, A의 첫 행이 a[A]_1+c[C]_1일 때 AB의 첫 행이 (a[A]_1+c[C]_1)B이다. 이러한 alternating multilinear form은 \det I=1일 때 아래의 정의에 따라서 유일하게 존재한다. f(X)=\det XB/\det B라 하면 B는 f가 첫 번째 조건을 만족시키도록 하므로 f(X)=\det X이다.
- \det A^T=\det A이다. singular가 아닌 행렬이면 PA=LDU로 분해할 수 있으므로 L^T,\ D^T,\ U^T의 det은 L,\ D,\ U의 det과 같고, PP^T=I이므로 \det P\det P^T=1이 되려면 P=P^T이어야 한다.
치환 행렬로 정의하기
determinant의 세 번째 조건을 따라서 n\times n 행렬의 첫 번째 행을 n개의 determinant로 분리할 수 있다.
- \displaystyle \begin{vmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32}& a_{33}\end{vmatrix}=\begin{vmatrix} a_{11} & 0 & 0 \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32}& a_{33}\end{vmatrix}+\begin{vmatrix} 0 & a_{12} & 0 \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32}& a_{33}\end{vmatrix}+\begin{vmatrix} 0 & 0 & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32}& a_{33}\end{vmatrix}
다시 각 n개의 determinant에 대해서 두 번째 행을 n개의 determinant로 분리할 수 있다. 이렇게 마지막까지 전개하고 나면 n^n개의 항이 생기고 각 행에는 하나의 성분만 남는다. 따라서 한 열에 두 개 이상의 성분이 있으면 determinant가 0이다. 0이 아닌 항만 남기면 이는 n!개의 permutation matrix와 같은 꼴이다. 즉 다음과 같이 전개할 수 있다.
- \displaystyle a_{11}a_{22}a_{33}\begin{vmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1\end{vmatrix}+a_{12}a_{21}a_{33}\begin{vmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1\end{vmatrix}+a_{13}a_{22}a_{31}\begin{vmatrix} 0 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 0\end{vmatrix}+a_{11}a_{23}a_{32}\begin{vmatrix} 1 & 0 & 0 \\ 0 & 0 & 1 \\ 0 & 1 & 0\end{vmatrix}+a_{12}a_{23}a_{31}\begin{vmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 1 & 0 & 0\end{vmatrix}+a_{13}a_{21}a_{32}\begin{vmatrix} 0 & 0 & 1 \\ 1 & 0 & 0 \\ 0 & 1 & 0\end{vmatrix}
식으로 나타내면 n!개의 전단사 함수 \sigma에 대해서 \displaystyle \det A=\sum_\sigma a_{1\sigma(1)}a_{2\sigma(2)}\cdots a_{n\sigma(n)} \operatorname{sgn} \sigma이다. determinant의 두 번째 조건을 따르면 permutation matrix의 행렬식 \operatorname{sgn}\sigma는 단위 행렬에서 짝수 번 치환하면 1, 홀수 번 치환하면 -1이다.
여인자로 정의하기
치환 행렬로 정의한 행렬식을 관찰하면 n=3일 때 a_{11}이 나오는 두 항, a_{12}가 나오는 두 항, a_{13}이 나오는 두 항이 다음 규칙을 따르는 것을 알 수 있다.
- a_{1i}로 묶이는 부분은 첫 번째 행과 i번째 열을 제거한 2\times 2 행렬에 대해서 모든 permutation을 가지고 전개한 꼴이다.
이 규칙은 일반적으로 성립하며 a_{ij}로 묶이는 부분을 cofactor(여인자)라고 한다. a_{12}의 cofactor는 -a_{21}a_{33}+a_{23}a_{31}인데, 2\times 2 행렬에 대입해 보면
- \displaystyle \begin{vmatrix} a_{21} & a_{23} \\ a_{31} & a_{33}\end{vmatrix}=\begin{vmatrix} a_{21} & 0 \\ 0 & a_{33}\end{vmatrix}+\begin{vmatrix} 0 & a_{23} \\ a_{31} & 0\end{vmatrix}=a_{21}a_{33}-a_{23}a_{31}
로 세 번째 열이 두 번째 열이 되고, 두 번째 행이 첫 번째 행이 되고, 세 번째 행이 두 번째 행이 되어 홀수 번 치환한 결과로 부호가 바뀐 것을 알 수 있다. 따라서 i번째 행과 j번째 열을 제거한 부분 행렬 M_{ij}의 determinant를 (i,\ j) minor(소행렬식)라 하고 cofactor C_{ij}를 다음과 같이 쓴다:
- C_{ij}=(-1)^{i+j}\det M_{ij}
이제 determinant를 재귀적으로 정의할 수 있으며 어떤 행이나 열을 골라 \det A=a_{i1}C_{i1}+a_{i2}C_{i2}+\cdots+a_{in}C_{in}이나 \det A=a_{1i}C_{1i}+a_{2i}C_{2i}+\cdots+a_{ni}C_{ni}처럼 쓸 수 있다.
역행렬
j\neq i일 때 a_{j1}C_{i1}+a_{j2}C_{i2}+\cdots+a_{jn}C_{in}는, 각 cofactor를 i번째 행을 제거하여 계산하므로 A의 i번째 행을 j번째 행으로 대체한 것의 determinant와 같다. 그렇다면 [A]_j가 두 번 등장하여 determinant는 0이고 다음을 알 수 있다:
- \displaystyle \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{bmatrix} \begin{bmatrix} C_{11} & C_{21} & \cdots & C_{n1} \\ C_{12} & C_{22} & \cdots & C_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ C_{1n} & C_{2n} & \cdots & C_{nn} \end{bmatrix}=\begin{bmatrix} \det A & 0 & \cdots & 0 \\ 0 & \det A & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \det A \end{bmatrix}
곱해진 여인자 행렬을 adjugate matrix 또는 classical adjoint matrix(고전적 수반 행렬)라고 한다. 이를 (\operatorname{adj} A)_{ij}=C_{ji}라 쓰면 A^{-1}=\operatorname{adj} A/\det A이다.
크라메르 법칙
classical adjoint를 이용하면 Ax=b을 x=A^{-1}b=(\operatorname{adj} A)b/\det A로 나타낼 수 있으므로 각 x_i에 대한 공식을 얻을 수 있다.
- x_i=(C_{1i}b_1+C_{2i}b_2+\cdots+C_{ni}b_n)/\det A
여기에서 각 cofactor는 i번째 열을 제거하여 계산하므로 분자는 A의 i번째 열을 b로 대체한 것의 determinant와 같다. 이를 Cramer's rule(크라메르 법칙)이라 한다.
다른 성질들
- 소거법으로 얻는 i번째 pivot은 처음 i\times i 행렬의 행렬식을 처음 (i-1)\times (i-1) 행렬의 행렬식으로 나눈 값이다. 이러한 부분 행렬의 행렬식을 leading principal minor(선도 주 소행렬식)라고 한다. 여기에서 principal은 행의 index와 열의 index가 같음을 뜻한다.
- determinant가 0이 아닌 i\times i 부분 행렬이 있으면 n\times m 행렬의 rank는 i와 같거나 그보다 크고, 모든 i\times i 부분 행렬의 determinant가 0이면 rank는 i보다 작다.
- 두 벡터로 이루어진 행렬에 대한 determinant의 절댓값은 두 벡터가 만드는 평행사변형의 넓이를 구성한다. 마찬가지로, 세 벡터로 이루어진 행렬에 대한 determinant의 절댓값은 세 벡터가 만드는 평행육면체의 부피를 구성한다. 이는 벡터 b에서, 벡터 a에 scalar를 곱한 것을 더하는 작업이 determinant를 보존하므로 Gram–Schmidt process에서 각 행을 평행사변형의 높이처럼 대체할 수 있기 때문이다. 직교하는 벡터들로 이루어진 행렬 A에 대해서 \det AA^T = (\det A)^2는 각 벡터들의 크기의 제곱의 곱이다.
참고 자료
- Gilbert Strang. Linear Algebra and Its Applications.