Difference between revisions of "Definition:다변수 함수의 미분"

From Beloveds
Line 15: Line 15:
 
와 같은 의미이다. 이러한 선형 변환을 의 '''total derivative'''(전미분, 전도함수) df라고 한다. f'(a)=df_a가 벡터 v에 연산자로 작용하면 df_a(v)로 쓴다. 전미분은 그래디언트의 전치 벡터이므로 \nabla f(a)\in T_a\R^n이면 df_aT_a\R^n\to \R이다. 따라서 그래디언트는 열벡터(가정하고 있는 벡터의 기본 모습)로, 전미분은 행벡터로 나타낼 수 있다. 두 관계를 교환할 일이 있을 때에는, 전미분이 존재하지 않을 때 그래디언트를 정의하지 않는다.<ref>https://math.stackexchange.com/questions/3867940/doubt-about-the-existence-of-the-gradient</ref>
 
와 같은 의미이다. 이러한 선형 변환을 f의 '''total derivative'''(전미분, 전도함수) df라고 한다. f'(a)=df_a가 벡터 v에 연산자로 작용하면 df_a(v)로 쓴다. 전미분은 그래디언트의 전치 벡터이므로 \nabla f(a)\in T_a\R^n이면 df_aT_a\R^n\to \R이다. 따라서 그래디언트는 열벡터(가정하고 있는 벡터의 기본 모습)로, 전미분은 행벡터로 나타낼 수 있다. 두 관계를 교환할 일이 있을 때에는, 전미분이 존재하지 않을 때 그래디언트를 정의하지 않는다.<ref>https://math.stackexchange.com/questions/3867940/doubt-about-the-existence-of-the-gradient</ref>
  
전미분이 존재할 때 다변수 함수가 '''differentiable'''(미분 가능)이라고 한다. 전미분이 가능하다면 편미분이 항상 가능하지만 그 역은 성립하지 않는다. 함수가 연속이 아니어도 편미분할 수 있는 경우가 있고, 함수가 연속이면서 편미분할 수 있어도 전미분이 존재하지 않는 경우가 있다. 모든 편미분이 연속이면 전미분이 존재하지만, 그 역은 성립하지 않는다.<ref>https://mathinsight.org/differentiable_function_discontinuous_partial_derivatives</ref>
+
전미분이 존재할 때 다변수 함수가 '''differentiable'''(미분 가능)이라고 한다. 전미분이 가능하다면 편미분이 항상 가능하지만 그 역은 성립하지 않는다. 함수가 연속이 아니어도 편미분할 수 있는 경우가 있고, 함수가 연속이면서 편미분할 수 있어도 전미분이 존재하지 않는 경우가 있다. 모든 편미분이 근방에서 연속이면 전미분이 존재하지만, 그 역은 성립하지 않는다.<ref>https://mathinsight.org/differentiable_function_discontinuous_partial_derivatives</ref>
 
* 함수 ff(0,\ 0)=0이고 그 외에서 f(x,\ y)=xy/(x^2+y^2)이면 x\neq 0일 때 f(x,\ x)=1/2이므로 (0,\ 0)에서 불연속이지만, 또한 모든 편도함수의 값이 \displaystyle \lim_{h\to 0} \frac{(0/h^2)-0}{h}=0으로 존재한다.
 
* 함수 ff(0,\ 0)=0이고 그 외에서 f(x,\ y)=xy/(x^2+y^2)이면 x\neq 0일 때 f(x,\ x)=1/2이므로 (0,\ 0)에서 불연속이지만, 또한 모든 편도함수의 값이 \displaystyle \lim_{h\to 0} \frac{(0/h^2)-0}{h}=0으로 존재한다.
* 함수 ff(0,\ 0)=0이고 그 외에서 f(x,\ y)=x^3/(x^2+y^2)이면 \displaystyle \lim_{(x,\ y)\to (0,\ 0)} f(x,\ y)=\lim_{r\to 0} r \sin^3(\theta)=0이므로 (0,\ 0)에서 연속이지만, 또한 \displaystyle \frac{\partial f}{\partial x}=\lim_{h\to 0} \frac{h-0}{h}=1이고 \displaystyle \frac{\partial f}{\partial y}=\lim_{h\to 0} \frac{0-0}{h}=0이므로 (0,\ 0)에서 전미분이 존재한다면 h=(x,\ y)로 쓸 때 f(x,\ y)-x=o(x,\ y)이므로 \displaystyle \lim_{(x,\ y)\to(0,\ 0)} \frac{-xy^2}{(x^2+y^2)(\sqrt{x^2+y^2})}=0이어야 한다. 그러나 (x,\ x)\to (0,\ 0)에서 이 극한은 -1/(2\sqrt{2})이므로 전미분은 존재하지 않는다.
+
* 함수 ff(0,\ 0)=0이고 그 외에서 f(x,\ y)=x^3/(x^2+y^2)이면 \displaystyle \lim_{(x,\ y)\to (0,\ 0)} f(x,\ y)=\lim_{r\to 0} r \sin^3(\theta)=0이므로 (0,\ 0)에서 연속이지만, 또한 \displaystyle \frac{\partial f}{\partial x}=\lim_{h\to 0} \frac{h-0}{h}=1이고 \displaystyle \frac{\partial f}{\partial y}=\lim_{h\to 0} \frac{0-0}{h}=0이므로 (0,\ 0)에서 전미분이 존재한다면 h=(x,\ y)로 쓸 때 f(x,\ y)-x=o(x,\ y)이므로 \displaystyle \lim_{(x,\ y)\to(0,\ 0)} \frac{-xy^2}{(x^2+y^2)(\sqrt{x^2+y^2})}=0이어야 한다. 그러나 (x,\ x)\to (0,\ 0)에서 이 극한은 -1/(2\sqrt{2})이므로 전미분이 존재하지 않는다.
  
 
== 원하는 방향으로의 미분 ==
 
== 원하는 방향으로의 미분 ==

Revision as of 15:21, 30 November 2022

편미분

실수 범위에서 다변수 함수란 f:\R^n\to \R의 정의역을 일부 사용하는 함수이다. 특히 f:\R^2\to \R은 삼차원 좌표에서 도형을 표현하는 데 유용하다. 일변수 함수 f:\R\to\R[x,\ x+h]에서의 평균변화율은

\displaystyle \frac{f(x+h)-f(x)}{h}

로 잘 알려져 있다. 변수가 하나일 때에는 x축 방향으로 가는 수밖에 없지만, 변수가 여러 개일 때에는 n개의 축이 있어 x=(x_1,\ ...,\ x_n)가 원하는 벡터 v의 방향으로 갈 수 있다. 이때 평균변화율은 x가 벡터 v의 방향으로 1만큼 변할 때 f(x)가 변화하는 정도에 해당한다. 예를 들어 f(x)=a_ix_i+b에 대해서 \lVert v\rVert=1v 방향으로의 변화량 h에 해당하는 평균변화율은

\displaystyle \frac{f(x+hv)-f(x)}{h}=\sum_i \frac{a_i(x_i+hv_i)-a_ix_i}{h}=\sum_i a_iv_i

이다. 여기에 h\to 0을 취하면 순간변화율 \displaystyle \frac{\partial f}{\partial v}가 된다. 만약 v가 다음과 같은 꼴이라면

x_i=(0,\ \cdots,\ 1,\ \cdots,\ 0)

이를 x_i에 대한 partial derivative(편미분, 편도함수) \displaystyle \frac{\partial f}{\partial x_i}이라 한다. d와 달리 \partial은 다른 변수들에 의존하는 미분이다. 각 편미분들에 x_i에 해당하는 기저를 곱하고 더하여 열벡터로 만든 것을 gradient(그래디언트) \nabla f라 한다.

전미분

일변수 함수 f:\R\to\R의 도함수 f'(x)는 다음을 만족하는 함수로 잘 알려져 있다.

f(x+h)-f(x)=f'(x)h+o(h)

이는 x=a에서 기울기가 f'(a)인 접선 y=f'(a)(x-a)+f(a)를 가진다는 의미이다. f\R^n\to \R의 정의역을 일부 사용하는 함수이면 정의역과 h를 벡터로 치환하여 같은 식으로 쓸 수 있다. 그러면 x=a에서 접평면 y=f'(a)(x-a)+f(a)을 가진다는 의미이다. 만약 f\R^n\to \R^m의 정의역을 일부 사용하는 함수이면 f'(x)를 linear operator로 사용하여 같은 식으로 쓸 수 있다. 다변수 함수에서 o(h)라는 것은

\displaystyle \lim_{h\to 0} \frac{|o(h)|}{|h|}=0

와 같은 의미이다. 이러한 선형 변환을 ftotal derivative(전미분, 전도함수) df라고 한다. f'(a)=df_a가 벡터 v에 연산자로 작용하면 df_a(v)로 쓴다. 전미분은 그래디언트의 전치 벡터이므로 \nabla f(a)\in T_a\R^n이면 df_aT_a\R^n\to \R이다. 따라서 그래디언트는 열벡터(가정하고 있는 벡터의 기본 모습)로, 전미분은 행벡터로 나타낼 수 있다. 두 관계를 교환할 일이 있을 때에는, 전미분이 존재하지 않을 때 그래디언트를 정의하지 않는다.[1]

전미분이 존재할 때 다변수 함수가 differentiable(미분 가능)이라고 한다. 전미분이 가능하다면 편미분이 항상 가능하지만 그 역은 성립하지 않는다. 함수가 연속이 아니어도 편미분할 수 있는 경우가 있고, 함수가 연속이면서 편미분할 수 있어도 전미분이 존재하지 않는 경우가 있다. 모든 편미분이 근방에서 연속이면 전미분이 존재하지만, 그 역은 성립하지 않는다.[2]

  • 함수 ff(0,\ 0)=0이고 그 외에서 f(x,\ y)=xy/(x^2+y^2)이면 x\neq 0일 때 f(x,\ x)=1/2이므로 (0,\ 0)에서 불연속이지만, 또한 모든 편도함수의 값이 \displaystyle \lim_{h\to 0} \frac{(0/h^2)-0}{h}=0으로 존재한다.
  • 함수 ff(0,\ 0)=0이고 그 외에서 f(x,\ y)=x^3/(x^2+y^2)이면 \displaystyle \lim_{(x,\ y)\to (0,\ 0)} f(x,\ y)=\lim_{r\to 0} r \sin^3(\theta)=0이므로 (0,\ 0)에서 연속이지만, 또한 \displaystyle \frac{\partial f}{\partial x}=\lim_{h\to 0} \frac{h-0}{h}=1이고 \displaystyle \frac{\partial f}{\partial y}=\lim_{h\to 0} \frac{0-0}{h}=0이므로 (0,\ 0)에서 전미분이 존재한다면 h=(x,\ y)로 쓸 때 f(x,\ y)-x=o(x,\ y)이므로 \displaystyle \lim_{(x,\ y)\to(0,\ 0)} \frac{-xy^2}{(x^2+y^2)(\sqrt{x^2+y^2})}=0이어야 한다. 그러나 (x,\ x)\to (0,\ 0)에서 이 극한은 -1/(2\sqrt{2})이므로 전미분이 존재하지 않는다.

원하는 방향으로의 미분

\gamma\R\to \R^n의 정의역을 일부 사용하는 미분 가능한 함수이고 f\R^n\to \R의 정의역을 일부 사용하는 미분 가능한 함수이면 g(h)=f(\gamma(h))를 미분하였을 때에 chain rule에 의해서

\displaystyle g'(h)=f'(\gamma(h))\gamma'(h)

이다. 이제 단위 벡터 v에 대해서 \gamma(h)=x+hv인 경우로 한정하면 모든 h에 대해서 \gamma'(h)=v이다. 그러므로 g(h)-g(0)=f(x+hv)-f(x)에서

\displaystyle \{f(\gamma(h))\}'(0)=\left.\frac{d}{dh}f(x+hv)\right|_{h=0}=g'(0)=\lim_{h \to 0}\frac{f(x+hv)-f(x)}{h}=\frac{\partial f}{\partial v}

를 얻는다. 이를 x에서 v 방향으로의 directional derivative(방향 도함수, 방향 미분)라 한다. 전미분 df가 존재한다는 것은 방향 미분으로 생각하면

\displaystyle \lim_{|hv|\to 0}\frac{f(x+hv)-f(x)}{|hv|}=\lim_{|hv|\to 0}\frac{f'(x)hv}{|hv|}

을 만족한다는 뜻이다. |hv|=h이므로 다음과 같이 쓸 수 있다:

\displaystyle \lim_{h\to 0}\frac{f(x+hv)-f(x)}{h}=f'(x)v

이는 \displaystyle \frac{\partial f(x)}{\partial v}=df_x(v)라는 의미이므로 v=x_i로 놓으면 전미분을 편미분들로 나타낼 수 있다. 따라서 df_x(v)=\langle\nabla f(x),\ v\rangle이다.

참고 자료