Difference between revisions of "Definition:고유값과 고유벡터"
Line 22: | Line 22: | ||
* 의 determinant를 alternating multilinear form으로 생각하면 a_{ii}-\lambda가 들어 있는 항을 모두 제거한 항들로 나눌 수 있다. 그러면 \lambda가 없는 항은 A의 determinant이고, \lambda가 n-1개 있는 각 항은 determinant가 0인 triangular matrix들과 determinant가 a_{ii}\lambda^{n-1}인 대각 행렬로 나누어지므로 이들 항에 대한 determinant의 합은 A의 trace이다. \det(A-\lambda I)=(\lambda-\lambda_1)\cdots(\lambda-\lambda_n)라고 가정하면 Vieta's formulas에 따라서 \displaystyle \det A=\prod_i \lambda_i, \tr A=\sum_i \lambda_i이다. | * A-\lambda I의 determinant를 alternating multilinear form으로 생각하면 a_{ii}-\lambda가 들어 있는 항을 모두 제거한 항들로 나눌 수 있다. 그러면 \lambda가 없는 항은 A의 determinant이고, \lambda가 n-1개 있는 각 항은 determinant가 0인 triangular matrix들과 determinant가 a_{ii}\lambda^{n-1}인 대각 행렬로 나누어지므로 이들 항에 대한 determinant의 합은 A의 trace이다. \det(A-\lambda I)=(\lambda-\lambda_1)\cdots(\lambda-\lambda_n)라고 가정하면 Vieta's formulas에 따라서 \displaystyle \det A=\prod_i \lambda_i, \tr A=\sum_i \lambda_i이다. | ||
* A의 모든 고유값이 0이 아니면 A의 역행렬이 존재한다. A+B의 고유값의 합은 A,\ B의 고유값의 합이고 AB의 고유값의 곱은 A,\ B의 고유값의 곱이다. | * A의 모든 고유값이 0이 아니면 A의 역행렬이 존재한다. A+B의 고유값의 합은 A,\ B의 고유값의 합이고 AB의 고유값의 곱은 A,\ B의 고유값의 곱이다. | ||
− | * 연립미분방정식의 미지수가 한 개일 때 A의 고유값이 a_{11}이면 x(t)=\begin{pmatrix}x_1e^{a_{11}t}\end{pmatrix}^T에 대해서 cx(t)들이 Ax(t)=a_{11}x(t)를 만족시키는 x_1이 적어도 1차원, 많아야 1차원을 이룬다. x_1=1을 넣어 보면 모든 해는 ce^{a_{11}t}이다. 미지수가 두 개일 때 A의 고유값이 \lambda_1,\ \lambda_2이면 x=\begin{pmatrix} x_1e^{\lambda_1 t} & x_2e^{\lambda_1 t}\end{pmatrix}^T에 대해서 cx들이 Ax=\lambda_1 x를 만족시키는 (x_1,\ x_2)는 적어도 1차원, \lambda_1이 중근이면 많아야 2차원을 이루고, x=\begin{pmatrix} x_1e^{\lambda_2 t} & x_2e^{\lambda_2 t}\end{pmatrix}^T에 대해서 cx들이 Ax=\lambda_2 x를 만족시키는 (x_1,\ x_2)가 적어도 1차원, \lambda_2가 중근이면 많아야 2차원을 이룬다. 따라서 고유값이 중근이 아니라면 각 고유값에 대해서 x_1=1이나 x_2=1을 넣어 보아 하나의 해 (x_1,\ x_2)를 구한 다음, 여기에 상수를 곱한 것들은 c에 넣을 수 있고 모든 해는 c_1(x_1e^{\lambda_1 t},\ x_2e^{\lambda_1 t})+c_2(x_1e^{\lambda_2 t},\ x_2e^{\lambda_2 t})이다 | + | * 고유벡터가 서로 다른 고유값에 대응하면 서로 독립이다. |
− | + | * n개의 고유값에 대응하는 n개의 고유벡터가 독립일 때 모든 벡터 x=c_1x_1+\cdots+c_nx_n에 대해서 Ax=\lambda_1c_1x_1+\cdots+\lambda_n c_n x_n가 정해지므로 이러한 행렬은 유일하다 | |
− | + | ||
+ | === complete solution === | ||
+ | 연립미분방정식의 미지수가 한 개일 때 A의 고유값이 a_{11}이면 x(t)=\begin{pmatrix}x_1e^{a_{11}t}\end{pmatrix}^T에 대해서 cx(t)들이 Ax(t)=a_{11}x(t)를 만족시키는 x_1이 적어도 1차원, 많아야 1차원을 이룬다. x_1=1을 넣어 보면 모든 해는 ce^{a_{11}t}이다. 미지수가 두 개일 때 A의 고유값이 \lambda_1,\ \lambda_2이면 x=\begin{pmatrix} x_1e^{\lambda_1 t} & x_2e^{\lambda_1 t}\end{pmatrix}^T에 대해서 cx들이 Ax=\lambda_1 x를 만족시키는 (x_1,\ x_2)는 적어도 1차원, \lambda_1이 중근이면 많아야 2차원을 이루고, x=\begin{pmatrix} x_1e^{\lambda_2 t} & x_2e^{\lambda_2 t}\end{pmatrix}^T에 대해서 cx들이 Ax=\lambda_2 x를 만족시키는 (x_1,\ x_2)가 적어도 1차원, \lambda_2가 중근이면 많아야 2차원을 이룬다. 따라서 고유값이 중근이 아니라면 각 고유값에 대해서 x_1=1이나 x_2=1을 넣어 보아 하나의 해 (x_1,\ x_2)를 구한 다음, 여기에 상수를 곱한 것들은 c에 넣을 수 있고 모든 해는 c_1(x_1e^{\lambda_1 t},\ x_2e^{\lambda_1 t})+c_2(x_1e^{\lambda_2 t},\ x_2e^{\lambda_2 t})이다. | ||
== 대각화 == | == 대각화 == |
Revision as of 16:24, 7 February 2023
미지수가 n개인 연립미분방정식
- \displaystyle \begin{cases} a_{11}x_1(t)+a_{12}x_2(t)+\cdots+a_{1n}x_n(t)=x_1'(t) \\a_{21}x_1(t)+a_{22}x_2(t)+\cdots+a_{2n}x_n(t)=x_2'(t) \\ \quad \vdots \\a_{n1}x_1(t)+a_{n2}x_2(t)+\cdots+a_{nn}x_n(t)=x_n'(t) \end{cases}
은 다음과 같은 행렬로 나타낼 수 있다.
- \displaystyle \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{bmatrix} \begin{bmatrix} x_1(t) \\ x_2(t) \\ \vdots \\ x_n(t)\end{bmatrix}=\begin{bmatrix} x_1'(t) \\ x_2'(t) \\ \vdots \\ x_n'(t)\end{bmatrix}
미지수가 한 개일 때 x'(t)=ax(t)이므로 initial condition x(t=0)을 지정하면[1] x(t)=x(0)e^{at}이다. A는 linear이므로 superposition principle에 따라서[2] Ax(t)_1=x'(t)이고 Ax(t)_2=x'(t)이면 A(c_1x(t)_1+c_2x(t)_2)=c_1Ax(t)_1+c_2Ax(t)_2=c_1x'(t)_1+c_2x'(t)_2=(c_1x(t)_1+c_2x(t)_2)'이다. 그러므로 a를 고정하여 해의 모든 성분이 x_i(t)=x_ie^{at}라 가정하고 연립미분방정식을 풀면 해가 존재하는 a들을 찾음으로써 그 합으로 0 또는 e^{\lambda t}들로 이루어진 모든 해를 찾을 수 있다. 이러한 a=\lambda들을 행렬 A의 eigenvalue(고유값, 고윳값)라 하고, 해 x_i(t)=x_i e^{\lambda t}에서 상수 x_i들로 이루어진 벡터 x(t)를 A의 eigenvector(고유벡터)라 한다.
이 연립미분방정식의 x(t)는 initial condition x(t=0)을 포함하는 open interval에서 A의 성분이 모두 연속 함수일 때 open interval에 속하는 t마다 독립인 벡터들을 만드는 서로 다른 해들의 linear combination으로 유일하다.[3] x_i(t)=x_ie^{\lambda t}를 단순히 x_i로 대체하면 x_i'(t)=\lambda x_i e^{\lambda t}이므로 연립미분방정식은 Ax=\lambda x로 쓸 수 있다. 따라서 \lambda는 (A-\lambda I)x=O를 만족시킨다. x는 A-\lambda I의 null space의 원소이므로 x\neq 0가 존재하려면 \det(A-\lambda I)=0이어야 한다. 행렬식을 전개하면 \lambda에 대한 다항식이며 이를 A의 characteristic polynomial(특성 다항식)이라고 한다.
- A의 성분이 실수이더라도 \lambda는 복소수일 수 있다. 이제 symmetric matrix와 orthogonal matrix는 conjugate transpose와 Hermitian adjoint를 정의하여 Hermitian matrix와 unitary matrix로 확장할 이유가 생긴다.
- 각 고유값에 대응하는 고유벡터는 eigenspace A-\lambda I의 null space를 구성해야 하므로 하나가 아니다. 즉 \lambda의 고유벡터에 상수를 곱해도 \lambda의 고유벡터이고, 중근에는 독립인 여러 개의 고유벡터가 대응할 수도 있다.
- 각 행렬에 대응하는 특성 다항식은 유일하다. 그러나 \lambda_0마다 (\lambda-\lambda_0)^n이 할당되며 이 중근의 개수를 \lambda_0의 algebraic multiplicity(대수적 중복도)라 하고, \lambda마다 A-\lambda I의 null space가 할당되며 이 차원을 \lambda의 geometric multiplicity(기하적 중복도)라 한다.[4] 대수적 중복도가 1이면 simple eigenvalue이고 두 중복도가 같으면 semisimple eigenvalue이다.
성질들
- Ax=\lambda x이면 (A+cI)x=Ax+cx,\ A^2x=\lambda Ax,\ x=\lambda A^{-1}x,\ (A-\lambda I)^T=A^T-\lambda I이므로 A+cI,\ A^2,\ A^{-1},\ A^T의 고유값은 \lambda+c,\ \lambda^2,\ 1/\lambda,\ \lambda이다.
- 정의에 의해서 고유벡터는 함수 A를 취하면 고유값, 즉 상수만이 곱해지는 벡터이다. 따라서 모든 벡터는 I의 고유벡터이다.
- 평면에서 벡터를 회전시키는 행렬은 복소 고유값을 가지고, 사영 행렬은 eigenvalue \lambda와 eignevector x에 대해서 \lambda^2x=\lambda x이므로 \lambda_1=1,\ \lambda_1=0이다. 사영 행렬의 고유값이 1인 eigenspace는 사영 행렬의 column space이고, 고유값이 0인 eigenspace는 사영 행렬의 null space이다.
- triangular matrix의 고유값은 A-\lambda I의 determinant가 a_{ii}-\lambda들의 곱이므로 이를 0으로 만드는 \lambda=a_{ii}이다.
- A-\lambda I의 determinant를 alternating multilinear form으로 생각하면 a_{ii}-\lambda가 들어 있는 항을 모두 제거한 항들로 나눌 수 있다. 그러면 \lambda가 없는 항은 A의 determinant이고, \lambda가 n-1개 있는 각 항은 determinant가 0인 triangular matrix들과 determinant가 a_{ii}\lambda^{n-1}인 대각 행렬로 나누어지므로 이들 항에 대한 determinant의 합은 A의 trace이다. \det(A-\lambda I)=(\lambda-\lambda_1)\cdots(\lambda-\lambda_n)라고 가정하면 Vieta's formulas에 따라서 \displaystyle \det A=\prod_i \lambda_i, \tr A=\sum_i \lambda_i이다.
- A의 모든 고유값이 0이 아니면 A의 역행렬이 존재한다. A+B의 고유값의 합은 A,\ B의 고유값의 합이고 AB의 고유값의 곱은 A,\ B의 고유값의 곱이다.
- 고유벡터가 서로 다른 고유값에 대응하면 서로 독립이다.
- n개의 고유값에 대응하는 n개의 고유벡터가 독립일 때 모든 벡터 x=c_1x_1+\cdots+c_nx_n에 대해서 Ax=\lambda_1c_1x_1+\cdots+\lambda_n c_n x_n가 정해지므로 이러한 행렬은 유일하다
complete solution
연립미분방정식의 미지수가 한 개일 때 A의 고유값이 a_{11}이면 x(t)=\begin{pmatrix}x_1e^{a_{11}t}\end{pmatrix}^T에 대해서 cx(t)들이 Ax(t)=a_{11}x(t)를 만족시키는 x_1이 적어도 1차원, 많아야 1차원을 이룬다. x_1=1을 넣어 보면 모든 해는 ce^{a_{11}t}이다. 미지수가 두 개일 때 A의 고유값이 \lambda_1,\ \lambda_2이면 x=\begin{pmatrix} x_1e^{\lambda_1 t} & x_2e^{\lambda_1 t}\end{pmatrix}^T에 대해서 cx들이 Ax=\lambda_1 x를 만족시키는 (x_1,\ x_2)는 적어도 1차원, \lambda_1이 중근이면 많아야 2차원을 이루고, x=\begin{pmatrix} x_1e^{\lambda_2 t} & x_2e^{\lambda_2 t}\end{pmatrix}^T에 대해서 cx들이 Ax=\lambda_2 x를 만족시키는 (x_1,\ x_2)가 적어도 1차원, \lambda_2가 중근이면 많아야 2차원을 이룬다. 따라서 고유값이 중근이 아니라면 각 고유값에 대해서 x_1=1이나 x_2=1을 넣어 보아 하나의 해 (x_1,\ x_2)를 구한 다음, 여기에 상수를 곱한 것들은 c에 넣을 수 있고 모든 해는 c_1(x_1e^{\lambda_1 t},\ x_2e^{\lambda_1 t})+c_2(x_1e^{\lambda_2 t},\ x_2e^{\lambda_2 t})이다.
대각화
n개의 고유값에 대응하는 n개의 고유벡터가 독립일 때 이들이 각 열을 이루는 행렬 Q를 뒤에 곱하면 각 고유벡터는 A[Q]_i=\lambda[Q]_i를 만족하므로 이는 Q에 각 고유값이 대각 성분을 이루는 행렬 \Lambda를 뒤에 곱한 것과 같다. 따라서 AQ=Q\Lambda에서 A=Q\Lambda Q^{-1}이며 A^k=(Q\Lambda Q^{-1})^k=Q{\Lambda}^kQ^{-1}이다. 이를 A의 Eigendecomposition(고유값 분해)이라고 한다.
참고 자료
- ↑ https://math.stackexchange.com/questions/395161/whats-the-difference-between-an-initial-value-problem-and-a-boundary-value-prob
- ↑ https://en.wikipedia.org/wiki/Superposition_principle
- ↑ https://en.wikipedia.org/wiki/Linear_differential_equation
- ↑ https://en.wikipedia.org/wiki/Generalized_eigenvector
- https://people.math.wisc.edu/~aseeger/319/notes2.pdf
- Gilbert Strang. Linear Algebra and Its Applications.