다변수 함수의 미분

From Beloveds
Revision as of 15:11, 30 November 2022 by Beloveds (talk | contribs)

편미분

실수 범위에서 다변수 함수란 $f:\R^n\to \R$의 정의역을 일부 사용하는 함수이다. 특히 $f:\R^2\to \R$은 삼차원 좌표에서 도형을 표현하는 데 유용하다. 일변수 함수 $f:\R\to\R$의 $[x,\ x+h]$에서의 평균변화율은

$\displaystyle \frac{f(x+h)-f(x)}{h}$

로 잘 알려져 있다. 변수가 하나일 때에는 $x$축 방향으로 가는 수밖에 없지만, 변수가 여러 개일 때에는 $n$개의 축이 있어 $x=(x_1,\ ...,\ x_n)$가 원하는 벡터 $v$의 방향으로 갈 수 있다. 이때 평균변화율은 $x$가 벡터 $v$의 방향으로 $1$만큼 변할 때 $f(x)$가 변화하는 정도에 해당한다. 예를 들어 $f(x)=a_ix_i+b$에 대해서 $\lVert v\rVert=1$인 $v$ 방향으로의 변화량 $h$에 해당하는 평균변화율은

$\displaystyle \frac{f(x+hv)-f(x)}{h}=\sum_i \frac{a_i(x_i+hv_i)-a_ix_i}{h}=\sum_i a_iv_i$

이다. 여기에 $h\to 0$을 취하면 순간변화율 $\displaystyle \frac{\partial f}{\partial v}$가 된다. 만약 $v$가 다음과 같은 꼴이라면

$x_i=(0,\ \cdots,\ 1,\ \cdots,\ 0)$

이를 $x_i$에 대한 partial derivative(편미분, 편도함수) $\displaystyle \frac{\partial f}{\partial x_i}$이라 한다. 각 편미분들에 $x_i$에 해당하는 기저를 곱하고 더하여 열벡터로 만든 것을 gradient(그래디언트) $\nabla f$라 한다. $d$와 달리 $\partial$은 다른 변수들에 의존하는 미분이다.

전미분

일변수 함수 $f:\R\to\R$의 도함수 $f'(x)$는 다음을 만족하는 함수로 잘 알려져 있다.

$f(x+h)-f(x)=f'(x)h+o(h)$

이는 $x=a$에서 기울기가 $f'(a)$인 접선 $y=f'(a)(x-a)+f(a)$를 가진다는 의미이다. $f$가 $\R^n\to \R$의 정의역을 일부 사용하는 함수이면 정의역과 $h$를 벡터로 치환하여 같은 식으로 쓸 수 있다. 그러면 $x=a$에서 접평면 $y=f'(a)(x-a)+f(a)$을 가진다는 의미이다. 만약 $f$가 $\R^n\to \R^m$의 정의역을 일부 사용하는 함수이면 $f'(x)$를 linear operator로 사용하여 같은 식으로 쓸 수 있다. 다변수 함수에서 $o(h)$라는 것은

$\displaystyle \lim_{h\to 0} \frac{|o(h)|}{|h|}=0$

와 같은 의미이다. 이러한 선형 변환을 $f$의 total derivative(전미분, 전도함수) $df$라고 한다. $f'(a)=df_a$가 벡터 $v$에 연산자로 작용하면 $df_a(v)$로 쓴다. 전미분은 그래디언트의 전치 벡터이다. 즉 $\nabla f(a)\in T_a\R^n$이면 $df_a$는 $T_a\R^n\to \R$이다. 따라서 그래디언트는 열벡터(가정하고 있는 벡터의 기본 모습)로, 전미분은 행벡터로 나타낼 수 있다.

전미분이 존재할 때 다변수 함수가 differentiable(미분 가능)이라고 한다. 전미분이 가능하다면 편미분이 항상 가능하지만 그 역은 성립하지 않는다. 함수가 연속이 아니어도 편미분할 수 있는 경우가 있고, 함수가 연속이면서 편미분할 수 있어도 전미분이 존재하지 않는 경우가 있다. 모든 편미분이 연속이면 전미분이 존재하지만, 그 역은 성립하지 않는다.[1]

  • 함수 $f$가 $f(0,\ 0)=0$이고 그 외에서 $f(x,\ y)=xy/(x^2+y^2)$이면 $x\neq 0$일 때 $f(x,\ x)=1/2$이므로 $(0,\ 0)$에서 불연속이지만, 또한 모든 편도함수의 값이 $\displaystyle \lim_{h\to 0} \frac{(0/h^2)-0}{h}=0$으로 존재한다.
  • 함수 $f$가 $f(0,\ 0)=0$이고 그 외에서 $f(x,\ y)=x^3/(x^2+y^2)$이면 $\displaystyle \lim_{(x,\ y)\to (0,\ 0)} f(x,\ y)=\lim_{r\to 0} r \sin^3(\theta)=0$이므로 $(0,\ 0)$에서 연속이지만, 또한 $\displaystyle \frac{\partial f}{\partial x}=\lim_{h\to 0} \frac{h-0}{h}=1$이고 $\displaystyle \frac{\partial f}{\partial y}=\lim_{h\to 0} \frac{0-0}{h}=0$이므로 $(0,\ 0)$에서 전미분이 존재한다면 $h=(x,\ y)$로 쓸 때 $f(x,\ y)-x=o(x,\ y)$이므로 $\displaystyle \lim_{(x,\ y)\to(0,\ 0)} \frac{-xy^2}{(x^2+y^2)(\sqrt{x^2+y^2})}=0$이어야 한다. 그러나 $(x,\ x)\to (0,\ 0)$에서 이 극한은 $-1/(2\sqrt{2})$이므로 전미분은 존재하지 않는다.

원하는 방향으로의 미분

$\gamma$가 $\R\to \R^n$의 정의역을 일부 사용하는 미분 가능한 함수이고 $f$는 $\R^n\to \R$의 정의역을 일부 사용하는 미분 가능한 함수이면 $g(h)=f(\gamma(h))$를 미분하였을 때에 chain rule에 의해서

$\displaystyle g'(h)=f'(\gamma(h))\gamma'(h)$

이다. 이제 단위 벡터 $v$에 대해서 $\gamma(h)=x+hv$인 경우로 한정하면 모든 $h$에 대해서 $\gamma'(h)=v$이다. 그러므로 $g(h)-g(0)=f(x+hv)-f(x)$에서

$\displaystyle \{f(\gamma(h))\}'(0)=\left.\frac{d}{dh}f(x+hv)\right|_{h=0}=g'(0)=\lim_{h \to 0}\frac{f(x+hv)-f(x)}{h}=\frac{\partial f}{\partial v}$

를 얻는다. 이를 $x$에서 $v$ 방향으로의 directional derivative(방향 도함수, 방향 미분)라 한다. 전미분 $df$가 존재한다는 것은 방향 미분으로 생각하면

$\displaystyle \lim_{|hv|\to 0}\frac{f(x+hv)-f(x)}{|hv|}=\lim_{|hv|\to 0}\frac{f'(x)hv}{|hv|}$

을 만족한다는 뜻이다. $|hv|=h$이므로 다음과 같이 쓸 수 있다:

$\displaystyle \lim_{h\to 0}\frac{f(x+hv)-f(x)}{h}=f'(x)v$

이는 $\displaystyle \frac{\partial f(x)}{\partial v}=df_x(v)$라는 의미이므로 $v=x_i$로 놓으면 전미분을 편미분들로 나타낼 수 있다. 따라서 $df_x(v)=\langle\nabla f(x),\ v\rangle$이다.

참고 자료