1 概述
在看机器学习的算法时,深感数学真是烂呀,所以,回头看了一整遍
1.1 研究对象
初等数学中研究了函数的问题,但无法解决类似经典的阿基里斯悖论
公元前5世纪,芝诺发表了著名的阿基里斯悖论:他提出让乌龟在阿基里斯前面1000米处开始,和阿基里斯赛跑,并且假定阿基里斯的速度是乌龟的10倍。当比赛开始后,若阿基里斯跑了1000米,设所用的时间为t,此时乌龟便领先他100米;当阿基里斯跑完下一个100米时,他所用的时间为t/10,乌龟仍然前于他10米。当阿基里斯跑完下一个10米时,他所用的时间为t/100,乌龟仍然前于他1米…… 芝诺认为,阿基里斯能够继续逼近乌龟,但决不可能追上它
所以,高等数学恰恰要解决的就是这个问题——无穷
- 趋向于无限时值是多少(极限)
- 两个无穷小的商是什么(导数)
- 无穷个无穷量相加是多少(积分)
高等数学让初等中的静态数学引导到了动态的数学中去,并进一步将初等数学的单元分析引导到了多元分析中。
1.2 应用
高等数学的应用可牛逼了
- 求最值,神经网络学习,线性回归,你能想到的绝大部份问题都可以最终转换为一个求最值的模型。
- 函数分析,泰勒级数与傅立叶变换,将函数切换到另外一个角度来思考,尤其是,傅立叶变换深刻地影响了整个图像和音频的发展
2 极限
2.1 极限定义
2.1.1 数列极限
设{\(x_n\)}是一个数列,\(a\)是一个常数,若对任意给定的正数\(\epsilon\),总存在正整数N,使得当n>N时,有
\[ |x_n-a|<\epsilon \]
则称\(a\)为数列{\(x_n\)}的极限,或者说{\(x_n\)}收敛于\(a\),记作
\[ \lim_{n \to \infty} x_n = a \]
或
\[ x_n \to a (n \to \infty) \]
如果数列{\(x_n\)}没有极限,则称它时发散的或发散数列
从定义中可以看出,极限是一个动态的概念,它要求的是{\(x_n\)}与\(a\)的距离能少于任意的\(\epsilon\),只需要\(n\)大于某个数就可以了
2.1.2 函数极限
设\(f(x)\)在点\(x_0\)的某个去心领域内有定义,\(A\)是一个常数。若对任意给定的正数\(\epsilon\),总存在整数\(\delta\),使得当\(0<\lvert{x-x_0}\rvert<\delta\)时,就有
\[ \lvert{f(x)-A}\rvert<\epsilon \]
则称A为函数f(x)当\(x \to x_0\)时的极限,或称当\(x \to x_0\)时,函数\(f(x)\)的极限是A,记作
\[ \lim_{x \to x_0} f(x) = A \]
或
\[ f(x) \to A (x \to x_0) \]
从定义中可以看出,函数极限跟数列极限的定义基本上是一样的,只是改了一下说法而已。
2.2 极限性质
2.2.1 唯一性
若极限 \(\lim\limits_{x \to x_0} f(x)\)存在,则该极限是唯一的。
这是显然的
2.2.2 局部有界性
若\(\lim\limits_{x \to x_0} f(x)\)存在,则存在\(x_0\)的某个去心领域\(N(\hat x_0,\delta)\)内有界,即存在整数M,对于\(N(\hat x_0,\delta)\)中的每个\(x\),有\(\lvert f(x) \rvert <= M\)
这也是显然的
2.2.3 局部保号性
若\(\lim\limits_{x \to x_0} f(x) = A >0\)或\((A<0)\),则对任意正数\(r(0<r<\lvert A \rvert)\),存在\(x_0\)的某个去心领域\(N(\hat x_0,\delta)\),使对一切\(x \in N(\hat x_0,\delta)\),恒有\(f(x)>r>0\)或\(f(x)< -r < 0\)
显然,只需要将\(\epsilon\)缩小到一个较小的范围就可以证明了
2.2.4 反向保号性
如果函数\(f(x)\)在点x_0的某个去心领域内满足\(f(x)>=0\)(或\(f(x)<=0\)),且
\[ \lim\limits_{x \to x_0} f(x) = A \]
则 \(A>=0\)(或\(A<=0\))
这也是显然的
2.3 无穷定义
2.3.1 无穷小
若\(\lim\limits f(x) = 0\),则称\(f(x)\)为自变量\(x\)在某种趋向下的无穷小量,简称无穷小
注意,无穷小并不是一个很小的量,而是指某个变量的极限是0,能无限地接近0。当然,常数0也是一个无穷小。
2.3.2 无穷大
设函数\(f(x)\)在\(x_0\)的某个去心领域内有定义,如果对任意给定的正数\(M\),总存在正数\(\delta\),使得当\(0<\lvert x - x_0 \rvert<\delta\)时,就有
\[ \lvert f(x) \rvert > M \]
则称函数\(f(x)\)当\(x \to x_0\)时为无穷大量,简称无穷大,记作
\[ \lim\limits_{x \to x_0} f(x) = \infty \]
或
\[ f(x) \to \infty (x \to x_0) \]
2.4 极限的运算
2.4.1 极限与无穷小
\(\lim\limits f(x) = A\)的充分必要条件是\(f(x) = A + \alpha\),其中\(\lim\limits \alpha = 0\)
这个定理能将极限转换为常数与无穷小的想加,这能将所有的极限运算问题都转化为无穷小的问题
2.4.2 无穷小的运算
- 定理1 有限个无穷小的代数和仍是无穷小
- 定理2 有界函数与无穷小的乘积是无穷小
- 推论1 常数与无穷小的乘积是无穷小
- 推论2 无穷小的乘积是无穷小
- 推论3 无穷小与以非0常数为极限的函数之商是无穷小
2.4.3 极限四则运算
设\(\lim\limits f(x) = A\),\(\lim\limits g(x) = B\),则
- \(\lim\limits [f(x) \pm g(x)] = \lim\limits f(x) \pm \lim\limits g(x)=A \pm B\)
- \(\lim\limits [f(x) g(x)] = \lim\limits f(x) \lim\limits g(x) = AB\)
- \(\lim\limits \frac {f(x)} {g(x)} = \frac {\lim\limits f(x)} {\lim\limits g(x)} = \frac A B\),其中\(B \neq 0\)
证明时只需要套用2.4.1定理就可以了,简单暴力,这个定理基本能证明绝大部分的极限了,除了一个,就是分子为无穷小的极限,这是不能解决的
2.4.4 复合函数的极限
设函数\(u=\varphi (x)\)当\(x \to x_0\)时极限存在且等于\(a\),即\(\lim\limits_{x \to x_0} \varphi(x) = a\),但在\(x_0\)的某个去心领域内\(\varphi(x) \neq a\),又\(\lim\limits_{u \to a}f(u) = A\),则复合函数\(f[\varphi(x)]\) 当\(x \to x_0\)时极限也存在,且
\[ \lim\limits_{x \to x_0} f[\varphi(x)] = \lim\limits_{u \to x_0} f(u) = A \]
这是显然的
2.5 极限存在性
2.5.1 夹逼准则
如果当\(x \in N(\hat x_0,\delta)\)或($x > X $)时,有
- \(g(x) <= f(x) <= h(x)\)
- \(\lim\limits_{x \to x_0}g(x) = A,\lim\limits_{x \to x_0}h(x) = A\)
则\(\lim\limits_{x \to x_0}f(x)\)存在,且等于A
这也是显然的
2.5.2 单调有界准则
单调有界数列必有极限
这也是显然的
2.5.3 两个重要极限
\[ \lim\limits_{x \to 0} \frac {sinx} {x} = 1 \]
这是用夹逼准则推导出来的
\[ \lim\limits_{x \to \infty} (1+\frac 1 x)^x = e \]
这是先将其转为数列形式,数列形式使用单调有界推导出是有极限,然后用夹逼准则推导出来。注意,自然常数的原始定义\(e\)是由这个极限中定义出来的
2.6 无穷小的比较
2.6.1 无穷小比较的定义
设\(\alpha\),\(\beta\)是同一变化过程的两个无穷小,且\(\alpha \neq 0\)
- 如果\(\lim\limits \frac \beta \alpha = 0\),则称\(\beta\)是比\(\alpha\)较高阶无穷小,记为\(\beta = o(\alpha)\)
- 如果\(\lim\limits \frac \beta \alpha = \infty\),则称\(\beta\)是比\(\alpha\)较低阶无穷小
- 如果\(\lim\limits \frac \beta \alpha = c \neq 0\),则称\(\beta\)是\(\alpha\)的同阶无穷小
更为细致的分类定义
- 如果\(\lim\limits \frac \beta {\alpha^k} = c \neq 0\),\(k>0\),则称\(\beta\)是\(\alpha\)的k阶无穷小
- 如果\(\lim\limits \frac \beta {\alpha^k} = 1\),则称\(\beta\)是\(\alpha\)的等价无穷小,记作\(\alpha \sim \beta\)
注意,从定义中可以看出,如果\(\alpha\)与\(\beta\)都是无穷小量,那么\(\alpha \beta\)都是比\(\alpha\)与\(\beta\)更高阶的无穷小量,验证的话只需要除一下就可以了
2.6.2 等价无穷小替换定理
设\(\alpha \sim {\alpha}'\),\(\beta \sim \beta'\)且\(\lim\limits \frac {\beta'} {\alpha'}\)存在,则
\[ \lim\limits \frac \beta \alpha = \lim\limits \frac {\beta'} {\alpha'} \]
这是显然的,而且这个定理非常有用,能很好地解决极限四则运算中商为0的极限求解问题
2.6.3 常见的同阶无穷小
- \(sin x \sim x\)
- \(tan x \sim x\)
- \(1 - cos x \sim \frac 1 2 x^2\)
- $ln(1+x) x $
- \(a^x-1 \sim xlna\)
- \(e^x-1 \sim x\)
因为三角函数,指数函数,对数函数都能化解为幂函数的等价无穷小,所以一般情况下只需要将把这些函数都化解为幂函数等价形式就能求解商为0的极限问题了
3 连续函数
3.1 连续函数的定义
3.1.1 连续的定义
设函数\(y=f(x)\)在点\(x_0\)的某一领域内有定义,如果函数\(f(x)\)当\(x \to x_0\)时极限存在,且等于它在点\(x_0\)处的函数值\(f(x_0)\),即
\[ \lim\limits_{x \to x_0} f(x) = f(x_0) \]
则称函数\(y=f(x)\)在点\(x_0\)连续
从未想到连续可以用这么简单地用极限就能定义出来了
3.1.2 间断点的定义
函数不能在某点\(x_0\)不能连续,不外乎下面的几种情况
- 若\(\lim\limits_{x \to x_0} f(x) = A \neq f(x_0)\)或(\(f(x_0)\)不存在),则称点\(x_0\)为\(f(x)\)的可去间断点,简单来说就是,在该点极限是存在的,只是函数值不等于极限值而已。
- 若\(f(x)\)在点\(x_0\)的左、右极限都存在,但\(f(x_0 - 0) \neq f(x_0 + 0)\),则称\(x_0\)为\(f(x)\)的跳跃间断点
- 若\(f(x_0 - 0)\)与\(f(x_0 + 0)\)至少有一个为无穷大,则称点\(x_0\)为\(f(x)\)的无穷间断点
- 若\(f(x_0 - 0)\)与\(f(x_0 + 0)\)中至少又一个震荡发散,则称\(x_0\)为\(f(x)\)的震荡间断点
并且,将可去间断点,与跳跃间断点,都称为第一类间断点,其他都称为第二类间断点
3.2 连续函数的运算
3.2.1 连续函数的四则运算
- 有限个在某点连续的函数的代数和是一个在该点连续的函数
- 有限个在某点连续的函数的乘积是一个在该点连续的函数
- 有限个在某点连续的函数的商是一个在该点连续的函数,只要分母在该点不为0
很明显,用极限的四则运算就可以推导到这个了
3.2.2 反函数的连续性
如果函数\(y=f(x)\)在区间上\(I_x\)上单调且连续,那么它的反函数\(x=\varphi(y)\)在对应的区间\(I_y=\lbrace y \vert f(x),x \in I_x \rbrace\)上单调且连续
显然,反函数只是换了一个方向看函数而已,连续性没有改变
3.2.3 复合函数的连续性
设函数\(u=\varphi(x)\)当\(x \to x_0\)时极限存在且等于\(a\),即
\[ \lim\limits_{x \to x_0} \varphi(x) = a \]
而函数\(y=f(u)\)在点\(u=a\)连续,那么复合函数\(y=f[\varphi(x)]\)当\(x \to x_0\)时的极限也存在且等于\(f(a)\),即
\[ \lim\limits_{x \to x_0} f[\varphi(x)]= f[\lim\limits_{x \to x_0} \varphi(x)] = f(a) \]
结论是显然的,复合连续函数的极限可以表达为内部函数极限的函数值,注意,这里跟复合函数的极限不一样
3.2.4 处等函数的连续性
常量函数,幂函数,指数函数,对数函数,三角函数以及反三角函数在它们的定义域内都是连续的,它们都称为基本初等函数
而这些基本初等函数经过有限次四则预算及复合所构成的函数,称为初等函数
显然,初等函数在其定义区间上是连续的
3.3 连续函数的性质
3.3.1 最值定理
在闭区间上连续的函数在该区间上一定有最大值和最小值
显然,由于定义域是闭区间,所以,两头端点都不可能是\(\infty\)(如果是,就不连续),所以必然有最大值和最小值
3.3.2 介值定理
设函数\(f(x)\)在闭区间\([a,b]\)上连续,且在区间的端点取不同的函数值\(f(a) = A\)及\(f(b) = B\),那么,对于\(A\)与\(B\)之间的任意一个实数\(C\),在开区间\((a,b)\)内至少有一点\(\xi\),使得
\[ f(\xi) = C (a < \xi < b) \]
这是显然的,这个结论说明了,在某个闭区间的连续函数中,最大值与最小值之间的任意一个数值都必然可以取得到的。
4 导数
4.1 导数的定义
4.1.1 导数的定义
设函数\(y=f(x)\)在点\(x_0\)的某个邻域内有定义,当自变量\(x\)在\(x_0\)处取得增量\(\Delta x\)(点\(x_0+\Delta x\)仍在该邻域内)时,相应地函数\(y\)取得增量\(\Delta y = f(x_0+\Delta x)-f(x_0)\)。如果极限
\[ \lim\limits_{\Delta x \to 0} \frac {\Delta y} {\Delta x} = \lim\limits_{\Delta x \to 0} \frac {f(x_0 + \Delta x) - f(x_0)} {\Delta x} \]
存在且有限,则函数\(y=f(x)\)在点\(x_0\)可导,并称这个极限值为函数\(y=f(x)\)在点\(x_0\)的导数或微商,记为\(\left. y' \right\vert_{x=x_0}\),即
\[ \left. y' \right\vert_{x=x_0}=\lim\limits_{\Delta x \to 0} \frac {\Delta y} {\Delta x} = \lim\limits_{\Delta x \to 0} \frac {f(x_0 + \Delta x) - f(x_0)} {\Delta x} \]
也可记作\(f'(x_0)\),\(\left.\frac {dy} {dx} \right\vert_{x=x_0}\)或\(\left.\frac {df(x)} {dx} \right\vert_{x=x_0}\)
4.1.2 导数的几何意义
导数其实是无穷小的因变量差值与无穷小的自变量差值的商,描述的是,函数的增长率。从几何意义上看,导数就是函数在该点的切线的斜率
4.2 导数的性质
若\(f(x)\)在点\(x_0\)可导,则它在点\(x_0\)必连续
证明:
\[ \begin{align} \lim\limits_{\Delta x \to 0}[f(x+\Delta x) - f(x_0)] & = \lim\limits_{\Delta x \to 0} \Delta y \\ & = \lim\limits_{\Delta x \to 0}(\frac {\Delta y} {\Delta x} \cdot \Delta x) \\ & = \lim\limits_{\Delta x \to 0} \frac {\Delta y} {\Delta x} \cdot \lim\limits_{\Delta x \to 0} {\Delta x} \\ & = 0\end{align} \] 显然,可导是比连续更强的性质
4.3 导数的运算
4.3.1 四则运算求导
设函数\(u(x),v(x)\)在点\(x\)可导,则\(u(x) \pm v(x)\)在点\(x\)可导,且有
- \([u(x) \pm v(x)]' = u'(x) + v'(x)\)
- \([u(x)v(x)]' = u'(x)v(x) + u(x)v'(x)\)
- \([\frac {u(x)} {v(x)}]' = \frac {u'(x)v(x) - u(x)v'(x)} {v^2(x)}\),当\(v(x) \neq 0\)
证明的方法直接套导数的定义就可以了,要注意商的时候不为0才可以套商的导数公式
4.3.2 反函数求导
如果函数\(x=\varphi(y)\)在区间\(I_y\)上严格单调、可导且\(\varphi'(y) \neq 0\),则它的反函数\(y=f(x)\)在对应的区间\(I_x=x \vert y= f(x)\),\(y \in I_y\)上也可导,且有
\[ f'(x) = \frac {1} {\varphi(y)'} \]
即反函数的导数等于直接函数导数的导数
显然可得,反函数与原函数是同一个函数,反函数就是x与y旋转了而已,那么斜率也是倒数,导数也就是倒数了
4.3.3 复合函数求导
如果函数\(u=\varphi(x)\)在点\(x_0\)可导,而函数\(y=f(u)\)在点\(u_0=\varphi(x_0)\)可导,则复合函数\(y=f[\varphi(x)]\)在点\(x_0\)可导,且有
\[ \left.\frac {dy} {dx} \right\vert_{x=x_0} = f'(u_0) \cdot \varphi(x_0) \]
证明相当巧妙,套用了极限与无穷小的转化
\[ \because \lim\limits_{\Delta u \to 0} \frac {\Delta y} {\Delta u} = f'(u_0) \\ \therefore \frac {\Delta y} {\Delta u} = f'(u_0) + o \\ \therefore \Delta y = f'(u_0) \cdot \Delta u + o \cdot \Delta u \\ \therefore \frac {\Delta y} {\Delta x} = f'(u_0) \cdot \frac {\Delta u} {\Delta x} + o \cdot \frac {\Delta u} {\Delta x} \]
显然后面的项为0,第一项就是结果了
4.3.4 隐函数求导
隐函数就是一类\(F(x,y)=0\)的函数,这类函数中\(y\)难以转为为\(y=f(x)\)的函数,这时候要求\(y'\),解决办法是,直接对\(F(x,y)=0\)两边求导就可以了。
就这么简单,注意,由于\(y\)不是自变量,其值受\(x\)的限制,所以,在求导的时候,不能将\(y\)看成常数,然后直接求导省略掉了。应该将\(y\)函数是关于\(x\)的函数,套用复合函数的公式。
4.3.5 参数方程的求导
已知方程组
\[ \begin{cases} x = \varphi(t),\\ y = \psi(t) \end{cases} \]
则
\[ y'= \frac {\psi(t)'} {\varphi(t)'} \]
证明:
\[ \because x'(x) = \varphi'(t)\\ y'(x) = \psi'(t) \\ \therefore \Delta x = \varphi'(t)\Delta t + o(\Delta t) \\ \Delta y = \psi'(t)\Delta t + o(\Delta t) \\ \begin{align} \frac {\Delta y} {\Delta x} & = \frac {\psi'(t)\Delta t + o(\Delta t)} {\varphi'(t)\Delta t + o(\Delta t)} \\ & = \frac {\psi'(t)+o} {\varphi'(t)+o} \\ & = \frac {\psi'(t)} {\varphi'(t)}\end{align} \] 证明依然是很简单的,套用极限与无穷小的转化就可以了
4.3.5 导数公式
- \((C)' = 0\)
- \((x^u)' = ux^{u-1}\),(\(x>0\),\(u\)为任意实数)
- \((a^x)'=a^xlna\) (\(a>0,a \neq 1\)),\((e^x)'=e^x\)
- \((log_ax)'=\frac {1} {xlna}\) (\(a>0, a\neq 1\)),\((lnx)'=\frac {1} {x}\)
- \((sinx)' = cosx\),\((cosx)' = -sinx\)
- \((tanx)'=sec^2x\),\((cotx)'=-csc^2x\)
- \((secx)'=secxtanx\),\((cscx)'=-cscxcotx\)
你看到了很多自然对数\(e\)再一次出现在导数公式上
4.4 高阶导数
4.4.1 二阶导数
若函数\(y=f'(x)\)的导函数在点\(x\)可导,即极限
\[ \lim\limits_{\Delta x \to 0} \frac {f'(x +\Delta x) - f'(x)} {\Delta x} \]
存在且有限,则称函数\(y=f(x)\)在点\(x\)二阶可导,且称此极限为函数\(y=f(x)\)在点\(x\)的二阶导数,记作
\[ f''(x),y'',\frac {d^2 y} {d x^2} 或 \frac {d^2 f} {d x^2} \]
从定义中可以看出,二阶导数其实就是导数的变化率。从几何上看来,
如果
\[ y_0=f(x_0),y_1=f(x_1),y_2=f(x_2) \]
那么
\[ y_0' = \frac {y_1-y_0} {x_1-x_0} \\ y_1' = \frac {y_2-y_1} {x_2-x_1} \\ y_0'' = \frac {y_1'-y_0'} {x_2-x_1} = \frac {\frac {y_2-y_1} {x_2-x_1}-\frac {y_1-y_0} {x_1-x_0}} {x_2-x_1} \]
4.4.2 高阶导数
那么二阶导数的变化率就是三阶导数,类似地,可以定义\(y=f(x)\)的\(n-1\)阶导数的导数称为\(f(x)\)的\(n\)阶导数,记作
\[ f^{(n)}(x),y^{(n)},\frac {d^n y} {d x^n}或\frac {d^n f} {d x^n} \]
并且,统称\(f(x)\)的二阶和二阶以上的导数为\(f(x)\)的高阶导数
4.4.3 高阶导数的运算
- \((Cu)^{(n)}=Cu^{(n)}\)
- \((u \pm v)^{(n)}=u^{(n)} \pm v^{(n)}\)
- \((uv)^{(n)}=\sum\limits_{k=0}^{n} C_n^k u^{(n-k)}v^{(k)}\)
前两条还比较好证明,第三条要用数学归纳法来证明
5 微分
5.1 微分定义
5.1.1 微分的定义
设函数\(y=f(x)\)在区间\(I\)上有定义,\(x\),\(x_0+\Delta x \in I\),如果函数的增量\(\Delta y = f(x_0+\Delta x) - f(x_0)\)可表示为
\[ \Delta y = A\Delta x + o(\Delta x) \]
其中A是不依赖于\(\Delta x\)的常数,那么称函数\(y=f(x)\)在点\(\Delta x_0\)可微,\(A\Delta x\)称为函数\(f(x)\)在点\(x_0\)相对于自变量增量\(\Delta x\)的微分,记作\(dy\),即
\[ dy=A\Delta x \]
微分\(dy\)是\(\Delta x\)的线性函数,称为增量\(\Delta y\)的线性主部,而\(\Delta y - dy = o\Delta x\)是比\(\Delta x\)较高阶的无穷小
一句言之,\(dy\)就是函数增量的线性主要部分
5.1.2 微分的几何意义
\(\Delta y\)就是真实的函数增量,\(dy\)就是函数增量的线性增量,当\(\Delta x\)趋向于0时,\(\Delta y - dy\)是比\(\Delta x\)更高阶的无穷小
所以,在几何意义上,\(dy\)在极小的\(\Delta x\)增量下,\(dy = \Delta y\)
5.1.3 微分与导数
函数\(y=f(x)\)在点\(x_0\)可微的充分必要条件是\(f(x)\)在点\(x_0\)可导
证明也是用到了极限与无穷小转化的定理
\[ \because \lim\limits_{\Delta x \to 0} \frac {\Delta y} {\Delta x} = f'(x) \\ \therefore \frac {\Delta y} {\Delta x} = f'(x_0) + \alpha\\ \Delta y = f'(x_0) \cdot \Delta x + \alpha \cdot \Delta x\\ \Delta y = f'(x_0) \cdot \Delta x + \alpha(\Delta x)\\ \therefore dy = f'(x_0) \Delta x \]
证得充分性
\[ \because dy = f'(x_0) \Delta x \\ \therefore \Delta y = f'(x_0) \cdot \Delta x + \alpha(\Delta x) \\ \frac {\Delta y} {\Delta x} = f'(x_0) + \frac {\alpha(\Delta x)} {\Delta x} \\ \lim\limits_{\Delta x \to 0} \frac {\Delta y} {\Delta x} = f'(x) \]
证得必要性
所以,可微,与,可导,是同一个函数性质的不同描述而已。而且,这个定理也告诉我们微分的线性主要部分\(A\)就是该点的导数值
5.1.4 微分的四则运算
- \(d(u \pm v) = du \pm dv\)
- \(d(Cu) = Cd(u)\)
- \(d(uv) = vdu + udv\)
- \(d(\frac u v) = \frac {vdu-udv} {v^2}\),其中\(v \neq 0\)
5.1.5 微分的复合法则
设\(y=f[\varphi(x)]\)是由可微函数\(y=f(u)\)和\(u=\varphi(x)\)复合而成,则\(y=f[\varphi(x)]\)对\(x\)可微,且
\[ d(f[\varphi(x)]) = f'[\varphi(x)]\varphi'(x)dx \]
5.1.6 微分公式
- \(d(C)' = 0\)
- \(d(x^u)' = ux^{u-1}dx\),(\(x>0\),\(u\)为任意实数)
- \(d(a^x)'=a^xlnadx\) (\(a>0,a \neq 1\)),\(d(e^x)'=e^xdx\)
- \(d(log_ax)'=\frac {1} {xlna}dx\) (\(a>0, a\neq 1\)),\(d(lnx)'=\frac {1} {x}dx\)
- \(d(sinx)' = cosxdx\),\(d(cosx)' = -sinxdx\)
- \(d(tanx)'=sec^2xdx\),\(d(cotx)'=-csc^2xdx\)
- \(d(secx)'=secxtanxdx\),\(d(cscx)'=-cscxcotxdx\)
5.1.7 微分的意义
就像极限与无穷小的意义一样,引入无穷小,能将很多的极限问题转化为无穷小的问题,就能大大减少证明的难度了。所以,在引入微分的概念后,我们就将很多的导数甚至积分的问题转化为微分的问题
例如
\[ \begin{cases} x = \varphi(t),\\ y = \psi(t) \end{cases} \]
则
\[ y'= \frac {\psi'(t)} {\varphi'(t)} \]
证明
\[ \because x = \varphi(t),\\ y = \psi(t) \\ \therefore dx = \varphi'(t)dt \\ dy = \psi'(t)dt \\ \frac {dy} {dx} = \frac {\psi'(t)dt} {\varphi'(t)dt} \\ \frac {dy} {dx} = \frac {\psi'(t)} {\varphi'(t)} \]
由于我们知道微分之商就是导数,所以,可以求出结果
\[ y'= \frac {\psi'(t)} {\varphi'(t)} \]
可以比较下两种不同证明方法下的原理与异同
5.2 微分中值定理
5.2.1 罗尔定理
如果函数\(f(x)\)满足
- 在闭区间\([a,b]\)上连续
- 在开区间\((a,b)\)上可导
- 在区间端点的函数值相等,即\(f(a)=f(b)\)
则至少有一点\(\xi(a<\xi<b)\),使得\(f'(\xi)=0\)
证明分两种情况,根据介值定理,因为\(f(x)\)是闭区间上的连续函数,必然有最大值\(M\)和最小值\(m\)
- 当\(M=m\)时,显然函数图像为一条直线,导数处处为0
- 当\(M \neq m\)时,而且\(f(a) = f(b)\),所以\(f(a)\)与\(f(b)\)肯定不会同时能取到M与m两个值,所以必然存在一个\(\xi\),使得\(f(\xi)\)为M或m,而在这个最值的点上,根据导数定义,此处的导数必为0
所以得证。
这个定理,看起来很简单,但其最重要的一点是,它是沟通了函数值与导数值之间的桥梁
换一个更直观的证明是
- 如果\(f'(x) = 0\),整条函数都是直线,显然成立
- 如果\(f'(x) \neq 0\),那么必然存在两点\(f'(c)>0\)且\(f'(d)<0\),(因为如果都大于0或都少于0,函数图像就是远离x轴,不可能会有\(f(a)=f(b)=0\)),所以,根据连续函数的介值定理,必定存在\(c<e<d\),使得\(f'(e) = 0\)
所以得证。
5.2.2 拉格朗日中值定理
如果函数\(f(x)\)满足
- 在闭区间\([a,b]\)上连续
- 在开区间\((a,b)\)上可导
则至少存在有一点\(\xi(a<\xi<b)\),使得
\[ f(b)-f(a)=f'(\xi)(b-a) \]
证明是显然的,只需要将函数图像进行坐标系转换,使得\(f(a)=f(b)\),然后再调用罗尔定理就可以了
换一种证法就是
- 如果\(f'(x) = \frac {f(b)-f(a)} {b-a}\),整条函数都是斜直线,显然成立
- 如果\(f'(x) \neq \frac {f(b)-f(a)} {b-a}\),那么必然存在两点\(f'(c)>\frac {f(b)-f(a)} {b-a}\)且\(f'(d)<\frac {f(b)-f(a)} {b-a}\),(因为如果都大于\(\frac {f(b)-f(a)} {b-a}\)或都少于\(\frac {f(b)-f(a)} {b-a}\),函数图像就是远离\(f(b)与f(a)\)的连线,不可能会有a与b两处都在\(f(x)\)上),所以,根据连续函数的介值定理,必定存在\(c<e<d\),使得\(f'(e) = \frac {f(b)-f(a)} {b-a}\)
所以得证
显然,拉格朗日定理是罗尔定理的推广,其放宽了\(f(a)=f(b)\)的条件,适用于更大的范围,也被称为微分中值定理。其重要性在于,它是沟通原函数与导数的桥梁
5.2.3 柯西中值定理
如果函数\(f(x)\)及\(F(x)\)满足
- 在闭区间\([a,b]\)上连续
- 在开区间\((a,b)\)内可导
- \(F'(x)\)在\((a,b)\)内的每一点处均不等于零
则在\((a,b)\)内至少有一点\(\xi\),使得
\[ \frac {f(b) - f(a)} {F(b) - F(a)} = \frac {f'(\xi)} {F'(\xi)} \]
证明也是显然的,其是拉格朗日中值定理的推广,将分母从\(x\)轴扩展到了任意的可导函数
5.3 洛必达法则
设函数\(f(x)\)和\(F(x)\)满足下列条件:
- 当\(x \to a\)时,函数\(f(x)\)及\(F(x)\)都趋向于零
- 在点\(a\)的某个去心邻域内,\(f'(x)\)及\(F'(x)\)都存在且\(F'(x) \neq 0\)
- \(\lim\limits_{x \to a} \frac {f'(x)} {F'(x)}\)存在(或为无穷大)
那么
\[ \lim\limits_{x \to a} \frac {f(x)} {F(x)} = \lim\limits_{x \to a} \frac {f'(x)} {F'(x)} \]
证明:
\[ \because \lim\limits_{x \to a} f(x) = 0 且 \lim\limits_{x \to a} F(x) = 0 \\ \therefore f(a) = 0 且 F(a) = 0 \\ \begin{align}\lim\limits_{x \to a}\frac {f(x)} {F(x)} &= \lim\limits_{x \to a} \frac {f(x) - f(a)} {F(x) - f(b)} \\ &= \lim\limits_{x \to a} \frac {f'(\xi)} {F'(\xi)} \\ &= \lim\limits_{x \to a} \frac {f'(x)} {F'(x)}\end{align} \]
所以得证,就是直接套了柯西中值定理而已。
这个定理的意义在于,等阶无穷小的极限无法解决以下问题
\[ \lim\limits_{x \to 0} \frac {x-sinx} {sin^3x} \]
你会发现套了四则运算和等阶无穷替换定理后,依然得出一个\(\infty - \infty\)的答案,无法求解。但是你直接套了洛必达法则后,就能全部解决这类问题,简直就是神器。但要注意的是,洛必达只能解决\(\frac {0} {0}\)与\(\frac {\infty} {\infty}\)类型的极限,如果是\(\infty - \infty\),\(0 \cdot \infty\)等的未定式需要先转为以上定式才能得套洛必达法则
最后就是,有了洛必达法则后,你可以扔掉等阶无穷替换定理了,因为洛必达法则已经包含了它,不相信的话可以试试。
5.4 泰勒公式
5.4.1 定理
如果函数\(f(x)\)在\(x_0\)的某个开区间\((a,b)\)内具有直到\((n+1)\)阶导数,则当\(x\)在\((a,b)\)内时,\(f(x)\)可以表示为\((x-x_0)\)的一个\(n\)次多项式\(p_n(x)\)与一个余项\(R_n(x)\)之和,即
\[ f(x) = f(x_0) + f'(x_0)(x-x_0) + \frac {f''(x_0)} {2!}(x-x_0)^2+\cdots+\frac {f^{(n)}(x_0)} {n!}(x-x_0)^n+R_n(x) \]
其中
\[ R_n(x) = o[(x-x_0)^n] \]
这时的\(R_n(x)\)称为佩亚诺余项
\[ R_n(x) = \frac {f^{(n+1)}(\xi)} {(n+1)!} (x-x_0)^{n+1},(\xi在x_0与x之间) \]
这时的\(R_n(x)\)称为拉格朗日余项
5.4.2 证明
各项的系数推导
\[ \because R_2(x) = f(x)-f(x_0)-f'(x_0)(x-x_0) - \frac {f''(x_0)} {2!}(x-x_0)^2 \\ \therefore \begin{align} \lim\limits_{x \to x_0} \frac {R_2(x)} {(x-x_0)^2} &= \lim\limits_{x \to x_0} \frac {f(x)-f(x_0)-f'(x_0)(x-x_0) - \frac {f''(x_0)} {2!}(x-x_0)^2} {(x-x_0)^2} \\ &= \lim\limits_{x \to x_0} \frac {f'(x) - f'(x_0) - f''(x_0)(x-x_0)} {2(x-x_0)}\\ & = \lim\limits_{x \to x_0} \frac {f''(x) - f''(x_0)} {2} \\ & = 0 \end{align} \\ \therefore R_2(x) = o[(x-x_0)^2] \]
以上是2阶的佩亚诺余项推导,n阶以此类推,简单来说就是不断用洛必达法则就可以了
\[ \because R_2(x) = f(x)-f(x_0)-f'(x_0)(x-x_0) - \frac {f''(x_0)} {2!}(x-x_0)^2 \\ \therefore \begin{align} \frac {R_2(x)} {(x-x_0)^3} &= \frac {f(x)-P_2(x)} {(x-x_0)^3 - (x_0-x_0)^3} \\ &= \frac {f(x)-P_2(x)-(f'(x_0)-P_2'(x_0))} {(x-x_0)^3 - (x_0-x_0)^3} \\ &= \frac {f'(\xi)-P_2'(\xi)} {3(\xi-x_0)^2} \\ &= \frac {f'(\xi)-P_2'(\xi)-(f'(x_0)-P_2'(x_0))} {3(\xi-x_0)^2-3(x_0-x_0)^2}\\ &= \frac {f''(\varphi)-P_2''(\varphi)} {3\cdot2\cdot(\varphi-x_0)} \\ &= \frac {f''(\varphi)-P_2''(\varphi)-(f''(x_0)-P_2''(x_0))} {3\cdot2\cdot(\varphi-x_0)-3\cdot2\cdot(x _0-x_0)} \\ &= \frac {f^{(3)}(\psi)-P_2^{(3)}(\psi)} {3\cdot2\cdot1} \\ &= \frac {f^{(3)}(\psi)} {3\cdot2\cdot1} \end{align} \\ \therefore R_2(x) = \frac {f^{(3)}(\psi)} {3\cdot2\cdot1} (x-x_0)^3 \]
以上是2阶的拉格朗日余项推导,n阶以此类推,简单来说,就是不断用柯西中值定理就可以了
5.4.3 应用
泰勒公式超级强,它本质上是用一个多项式来逼近任意一个函数
- 来近似地计算任意一个函数
- 抛开无穷小与极限的转换定理吧,泰勒公式能让你将任意一个函数转化为多项式函数加任意次方的同阶无穷小,能大幅简化后面更多的公式证明
5.5 单调性
5.5.1 单调的定义
设函数\(f(x)\)的定义域为\(D\),区间\(I \subset D\)
- 如果对于区间\(I\)上任意两点\(x_1\)和\(x_2\),当\(x_1<x_2\)时,恒有\(f(x_1)<f(x_2)\),则称函数\(f(x)\)在区间\(I\)上是单调增加的
- 如果对于区间\(I\)上任意两点\(x_1\)和\(x_2\),当\(x_1<x_2\)时,恒有\(f(x_1)>f(x_2)\),则称函数\(f(x)\)在区间\(I\)上是单调减少的
单调增加和单调减少的函数统称为单调函数
定义还是很简单的
5.5.2 单调性的充分条件
设函数\(f(x)\)在\([a,b]\)上连续,在\((a,b)\)内可导
- 如果在\((a,b)\)内\(f'(x)>0\),那么函数\(y=f(x)\)在\([a,b]\)上单调增加
- 如果在\((a,b)\)内\(f'(x)<0\),那么函数\(y=f(x)\)在\([a,b]\)上单调减少
证明是显然的,直接套导数定义就可以了
5.5.2 极值的定义
设函数\(f(x)\)在区间\((a,b)\)内连续,\(x_0\)是\((a,b)\)内的一个点
- 若存在点\(x_0\)的一个去心邻域,对于此去心邻域的任何点\(x\),\(f(x)<f(x_0)\)均成立,则称\(f(x_0)\)是函数\(f(x)\)的一个极大值
- 若存在点\(x_0\)的一个去心邻域,对于此去心邻域的任何点\(x\),\(f(x)>f(x_0)\)均成立,则称\(f(x_0)\)是函数\(f(x)\)的一个极小值
函数的极大值和极小值统称为函数的极值
定义比较优雅
5.5.3 极值存在的必要条件
设函数\(f(x)\)在点\(x_0\)可导,且在\(x_0\)处取得极值,那么函数\(f(x)\)在点\(x_0\)处的导数为零,即\(f'(x)=0\)
证明是显然的,直接套导数和极值的定义就可以了
5.5.4 极值存在的第一充分条件
设函数\(f(x)\)在点\(x_0\)的一个邻域内可导且\(f'(x_0)=0\)
- 如果\(x\)取\(x_0\)左侧邻近的值时,\(f'(x)\)恒为正,当\(x\)取\(x_0\)右侧邻近的值时,\(f'(x)\)恒为负,那么函数\(f(x)\)在\(x_0\)处取得极大值
- 如果\(x\)取\(x_0\)左侧邻近的值时,\(f'(x)\)恒为负,当\(x\)取\(x_0\)右侧邻近的值时,\(f'(x)\)恒为正,那么函数\(f(x)\)在\(x_0\)处取得极小值
- 如果当\(x\)取\(x_0\)左、右两侧邻近的值时,\(f'(x)\)恒为正或恒为负,那么函数\(f(x)\)在\(x_0\)处没有极值
这是显然的
5.5.5 极值存在的第二充分条件
设函数\(f(x)\)在点\(x_0\)处具有二阶导数且\(f'(x_0)=0\),\(f''(x_0) \neq 0\),那么
- 当\(f''(x_0)<0\)时,函数\(f(x)\)在点\(x_0\)处取得极大值
- 当\(f''(x_0)>0\)时,函数\(f(x)\)在点\(x_0\)处取得极小值
这是显然的,注意,这个定理并没有说明当\(f''(x_0)=0\)时极值是不存在的,相反的,当\(f''(x_0)=0\)只是需要进一步判断而已
设函数\(f(x)\)在\(x_0\)有\(2n\)阶函数,且
\[ f'(x_0)=f''(x_0)=\cdots=f^{(2n-1)}(x_0) = 0 \]
- 若\(f^{(2n)}(x_0)<0\),则\(x_0\)为\(f(x)\)的极大值点
- 若\(f^{(2n)}(x_0)>0\),则\(x_0\)为\(f(x)\)的极小值点
但是,如果
\[ f'(x_0)=f''(x_0)=\cdots=f^{(2n)}(x_0) = 0 \]
- 若\(f^{(2n+1)}(x_0) \neq 0\),则\(x_0\)不是\(f(x)\)的极值点
总结来说,就是,找出第一个阶数不为0的导数
- 如果这个阶是奇数,则该点的极值不存在
- 如果这个阶是导数,且导数值少于0,则该点为极大值
- 如果这个阶是导数,且导数值大于0,则该点为极小值
这个定理的证明直接套泰勒公式前\(2n\)阶就可以了
5.6 凹凸性
5.6.1 凹凸性的定义
设函数\(f(x)\)在区间\(I\)上连续,如果对\(I\)上任意两点\(x_1\),\(x_2\),恒有
\[ f(\frac {x_1+x_2} {2}) < \frac {f(x_1)+f(x_2)} {2} \]
则称函数\(f(x)\)在\(I\)上的曲线是凹的,如果恒有
\[ f(\frac {x_1+x_2} {2}) < \frac {f(x_1)+f(x_2)} {2} \]
则称函数\(f(x)\)在\(I\)上的曲线是凸的
5.6.2 凹凸性判断定理
设函数\(f(x)\)在\([a,b]\)上连续,在\((a,b)\)内具有一阶和二阶导数,那么
- 若在\((a,b)\)内\(f''(x)>0\),则\(f(x)\)在\([a,b]\)上的曲线是凹的
- 若在\((a,b)\)内\(f''(x)<0\),则\(f(x)\)在\([a,b]\)上的曲线是凸的
证明
\[ f(x_2)+f(x_1)-2f(\frac {x_2+x_1} {2}) \\ =f(x_2)-f(\frac {x_2+x_1} {2})-(f(\frac {x_2+x_1} {2})-f(x_1)) \\ \because x_0= x_1+\frac {x_2-x_1} {2} \\ \theta = \frac {x_2-x_1} {2} \\ \therefore = f(x_0+\theta) - f(x_0) - (f(x_0)-f(x_0-\theta)) \\ = f'(\xi_0)\theta-f'(\xi_1)\theta \\ = f''(\psi)\theta^2 \]
所以,等式的等号与二阶导数等号,所以,得证
5.7 曲率
5.7.1 曲率的定义
设函数\(y=f(x)\)是定义在\([a,b]\)上的连续函数,且在\((a,b)\)内具有二阶导数,任取固定\(x_0 \in (a,b)\),并考虑改变量\(\Delta x\),使\(x_0+\Delta x \in(a,b)\),那么这两点的切线方向改变量为\(\Delta \varphi\),圆弧改变量为\(\Delta s\),那么
\[ K = \lim\limits_{\Delta x \to 0} \frac {\lvert \Delta \varphi \rvert} {\lvert \Delta s \rvert} \]
称为圆弧在点\(x_0\)点的曲率
从定义中可以看出,曲率实际上就是单位圆弧长度下的角度改变率
5.7.2 曲率公式
从曲率定义中我们可以算出,函数\(f(x)\)在任意一点的曲率公式为
\[ K = \frac {\lvert y'' \rvert} {(1+(y')^2)^{\frac 3 2}} \]
推导直接套曲率定义就可以了,注意分子是绝对值的函数
- 本文作者: fishedee
- 版权声明: 本博客所有文章均采用 CC BY-NC-SA 3.0 CN 许可协议,转载必须注明出处!