1 분 소요

다변수 함수의 미분

  • 정의역을 기준으로 하는 함수의 종류와 미분 \(f : \mathbb{R} \rightarrow \mathbb{R}, \, x_0 \in \mathbb{R}, \, L \in \mathbb{R} \\ \lim_{x \rightarrow x_0} \frac{f(x)-f(x_0)}{x-x_0} = L = f'(x_0) \\ \Leftrightarrow \lim_{x \rightarrow x_0} \frac{f(x)-f(x_0)}{x-x_0} - L = 0 \\ \Leftrightarrow \lim_{x \rightarrow x_0} \frac{f(x)-f(x_0)-L(x - x_0)}{x-x_0} = 0 \\ \Leftrightarrow \lim_{x \rightarrow x_0} \frac{f(x)-(f(x_0)+L(x - x_0))}{x-x_0} = 0\)

  • 다변수 함수에서 선형 근사식
    1변수 함수에서의 선형근사 \(y - f(x_0) = f'(x_0)(x-x_0) \Leftrightarrow y = f'(x_0)(x-x_0) + f(x_0)\) 다변수 함수에서의 선형근사 \(f : \mathbb{R^n} \rightarrow \mathbb{R^m}, \, x_0 \in \mathbb{R^n}, \, L : \mathbb{R^n} \rightarrow \mathbb{R^m} \\ \\ \Leftrightarrow \lim_{x \rightarrow x_0} \left\vert\left\vert\frac{f(x)-(f(x_0)+L(x - x_0))}{x-x_0}\right\vert\right\vert = 0\) 미분 행렬, 야코비 행렬
    $L(x) = [L]x = D\cdot f(x_0)x$

    $x_0$에서의 선형근사
    $M(x) = f(x_0) + L(x-x_0) = f(x_0)+Df(x_0)(x-x_0)$

  • 방향 도함수와 기울기 벡터(Gradient)
    방향 도함수
    $\vec u = \langle a,\,b \rangle$일 때, \(D_uf(x_0, y_0) = \lim_{h \rightarrow 0} \frac{f(x_0+ha, \, y_0+hb)-f(x_0, \, y_0)}{h}\) 이변수함수 $f$가 $x$와 $y$의 미분가능한 함수이면 $f$는 모든 단위벡터 $\vec u = <a,\,b>$ 방향으로 방향 도함수가 존재하고 방향도함수 $D_uf = f_x(x,y)a + f_y(x,y)b$이다.

    기울기 벡터(Gradient) $\nabla f = \langle f_x(x,y),\, f_y(x,y)\rangle = \frac{\partial f}{\partial x}i + \frac{\partial f}{\partial y}j$

    $\therefore D_uf = \nabla f \cdot \vec u$
    $\left\vert\left\vert D_uf \right\vert\right\vert = \left\vert\left\vert \nabla f \cdot \vec u \right\vert\right\vert = \left\vert \nabla f \right\vert \left\vert \vec u \right\vert \left\vert \cos\theta \right\vert$

  • 미분의 행렬 표현
    $ f \in P^2, \, f(x) = ax^2 + bx +c$
    $ D(f(x)) = 2ax + b $
    $ \beta = {1, x, x^2}$
    $[D(f(x))] = \begin{bmatrix} 0&b&0 \ 0&0& 2a \ 0&0&0\end{bmatrix}$

  • 단순 선형 회귀 $ f(x) = wx + b $
    \(l(w, b) = \sum_{i=1}^n(f(x_i)-y_i)^2 = \sum_{k=1}^n (wx_i + b - y_i)^2\) \(\nabla l(w,b) = \left( \sum_{i=1}^n 2(wx_i + b - y_i)x_i, \, \sum_{i=1}^n 2(wx_i+b-y_i) \right) = (0, \,0)\)

  • 다중 선형 회귀(다변수, 행렬식)
    $ Y = X\beta + \epsilon $
    $ \epsilon = Y - \hat Y$
    $ S = \epsilon’ \epsilon$ $ = (Y - X\beta)^T(Y-X\beta)$
    $\hat\beta = (X^TX)^{-1}X^TY $

  • 경사하강법(Gradient Descent)
    1차 선형 근사식 : $x_{n+1} = x_n - \frac{f(x_0)}{f’(x_0)}$
    Gradient Descent : $X_{n+1} = X_n -\alpha \nabla f(X_n)$

오늘의 회고

  • 선형 대수학과 더불어 다변수 함수에서의 미분을 하였고 미분을 통해 최소값을 찾는 과정을 살펴보면서 경사하강법까지 훑어볼 수 있는 시간이었다.