导数的定义、法则与局部线性化 | 实分析 I | 自在学

导数的定义、法则与局部线性化

导数在微积分里常被当作一张公式表：多项式怎么求，乘积怎么求，复合函数怎么求。实分析要做的事不同。我们从极限定义重新建造导数，弄清楚每条法则为什么成立，也弄清楚它们需要哪些假设。

这一章只研究实函数在一点附近的可导性。设函数 $f$ 在包含 $c$ 的某个邻域内有定义，至少在 $c$ 附近除 $c$ 外也能取值。导数讨论的是当 $x$ 越来越靠近 $c$ 时，函数增量和自变量增量之间的比值有没有稳定下来。

差商极限

在点 $c$ 附近，割线斜率是

\frac{f(x)-f(c)}{x-c}

其中 $x\neq c$ 。如果这个比值在 $x\to c$ 时有极限，我们把这个极限称为 $f$ 在 $c$ 处的导数，记作 $f'(c)$ ：

f'(c)=\lim_{x\to c}\frac{f(x)-f(c)}{x-c}

也常把 $x$ 写成 $c+h$ 。这时 $h\to 0$ 且 $h\neq 0$ ，定义变成

f'(c)=\lim_{h\to 0}\frac{f(c+h)-f(c)}{h}

两个形式完全等价。 $x$ 形式强调“移动点向固定点靠近”， $h$ 形式强调“增量趋向零”。证明中通常用 $h$ 形式更方便，讨论图像时用 $x$ 形式更直观。

割线到切线的极限过程

差商极限的 h 形式

导数不是先有切线再有斜率，而是先有差商极限，再把这个极限解释为切线斜率。图像直觉很有用，但定义真正检查的是一个函数极限是否存在。

下面的交互把 $h$ 作为可调参数。留意 $|x|$ 在 $0$ 处的表现：左右两边的割线斜率分别趋向不同的数，所以差商没有极限。

从定义证明简单函数可导

证明 $f(x)=x^2$ 在任意 $c\in\mathbb{R}$ 处可导，不需要求导表，只需要整理差商：

\frac{f(c+h)-f(c)}{h} =\frac{(c+h)^2-c^2}{h} =\frac{2ch+h^2}{h} =2c+h

当 $h\to 0$ 时， $2c+h\to 2c$ ，所以

f'(c)=2c

同样，若 $f(x)=ax+b$ ，则

\frac{f(c+h)-f(c)}{h} =\frac{a(c+h)+b-(ac+b)}{h} =a

因此 $f'(c)=a$ 。这说明直线函数的导数就是它的固定斜率。

不可导的典型信号

函数 $f(x)=|x|$ 在 $0$ 处连续，但不可导。它的差商是

\frac{|0+h|-|0|}{h}=\frac{|h|}{h}

当 $h>0$ 时这个比值等于 $1$ ，当 $h<0$ 时等于 $-1$ 。左右极限不同，所以导数不存在。

“图像有尖点”不是证明。真正的证明要回到差商，说明差商极限不存在。尖点只是提醒我们应该检查左右趋近时的差商。

可导与连续

可导比连续强。直观上，若函数在 $c$ 附近能被一条斜率有限的直线捕捉，它不可能在 $c$ 处突然跳开。严格证明也很短，但它揭示了导数定义里最重要的结构。

可导推出连续的证明结构

定理与证明

若 $f$ 在 $c$ 处可导，则 $f$ 在 $c$ 处连续。

要证明连续，只需证明当 $x\to c$ 时， $f(x)-f(c)\to 0$ 。

这证明了 $f$ 在 $c$ 处连续。

注意证明没有使用图像，也没有使用任何求导公式。它只用到了“差商有有限极限”这一件事。反过来不成立：连续函数未必可导， $|x|$ 在 $0$ 处就是最小反例。

不要把“连续，所以可导”当作默认规则。连续只控制函数值靠近，导数还要控制靠近的速度是否稳定。

求导法则从哪里来

求导法则不是独立记忆项。每条法则都来自差商的代数拆分，再用已经学过的函数极限法则收尾。下面把最常用的几条法则从定义中推出来。

线性法则

若 $f$ 和 $g$ 在 $c$ 处可导， $\alpha,\beta\in\mathbb{R}$ ，则 $\alpha f+\beta g$ 在处可导，且

(\alpha f+\beta g)'(c)=\alpha f'(c)+\beta g'(c)

证明直接来自差商：

\frac{(\alpha f+\beta g)(c+h)-(\alpha f+\beta g)(c)}{h} =\alpha\frac{f(c+h)-f(c)}{h} +\beta\frac{g(c+h)-g(c)}{h}

两项分别取极限即可。

乘积法则

若 $f$ 和 $g$ 在 $c$ 处可导，则 $fg$ 在 $c$ 处可导，且

(fg)'(c)=f'(c)g(c)+f(c)g'(c)

乘积法则的关键是加上再减去同一项：

\frac{f(c+h)g(c+h)-f(c)g(c)}{h}

=\frac{f(c+h)g(c+h)-f(c)g(c+h)+f(c)g(c+h)-f(c)g(c)}{h}

=g(c+h)\frac{f(c+h)-f(c)}{h} +f(c)\frac{g(c+h)-g(c)}{h}

因为可导推出连续，所以 $g(c+h)\to g(c)$ 。再令 $h\to 0$ ，得到乘积法则。

乘积法则的增量拆分

图里的小矩形 $\Delta f\,\Delta g$ 对应“二阶小量”。在严格证明中它没有被随手扔掉，而是通过差商拆分和极限运算自然消失。

倒数与商法则

若 $g$ 在 $c$ 处可导且 $g(c)\neq 0$ ，则 $1/g$ 在 $c$ 处可导。先看差商：

\frac{\frac{1}{g(c+h)}-\frac{1}{g(c)}}{h} =-\frac{g(c+h)-g(c)}{h}\cdot\frac{1}{g(c+h)g(c)}

因为 $g$ 在 $c$ 处连续且 $g(c)\neq 0$ ，所以 $h$ 足够小时 $g(c+h)$ 不为，并且。于是

\left(\frac{1}{g}\right)'(c)=-\frac{g'(c)}{g(c)^2}

把乘积法则应用到 $f\cdot(1/g)$ ，得到商法则：

\left(\frac{f}{g}\right)'(c) =\frac{f'(c)g(c)-f(c)g'(c)}{g(c)^2}

商法则必须假设 $g(c)\neq 0$ 。这个条件不是技术细节，而是保证 $1/g$ 在 $c$ 附近有意义并且极限运算可以进行。

用法则计算，但记得它们的来源

例如 $p(x)=3x^3-2x+5$ 。已经从定义知道 $x^2$ 的导数，也可以类似证明 $x^n$ 的导数为。结合线性法则，得到

p'(x)=9x^2-2

实分析中，计算不是目标本身。我们更关心的是：这些公式之所以可靠，是因为差商极限与连续性、代数拆分配合得很好。

链式法则的严格讨论

链式法则说，若 $g$ 在 $c$ 处可导， $f$ 在 $g(c)$ 处可导，则复合函数 $f\circ g$ 在 $c$ 处可导，且

(f\circ g)'(c)=f'(g(c))g'(c)

直觉上， $x$ 的小变化先经过 $g$ 变成 $u$ 的小变化，再经过 $f$ 变成函数值的变化。变化率相乘，就是复合函数的变化率。

链式法则中的变量变化链

常见但不严谨的写法

很多人会写

\frac{f(g(x))-f(g(c))}{x-c} =\frac{f(g(x))-f(g(c))}{g(x)-g(c)} \cdot \frac{g(x)-g(c)}{x-c}

然后让 $x\to c$ 。这个想法是对的，但写法有漏洞：可能存在许多 $x\neq c$ 使 $g(x)=g(c)$ ，此时第一项分母为 $0$ ，不能直接这样拆。

严格证明要避免这个漏洞。

用辅助函数证明

令 $u_0=g(c)$ 。因为 $f$ 在 $u_0$ 处可导，定义辅助函数

\Phi(u)= \begin{cases} \dfrac{f(u)-f(u_0)}{u-u_0}, & u\neq u_0,\\ f'(u_0), & u=u_0. \end{cases}

由导数定义可知， $\Phi$ 在 $u_0$ 处连续。并且对所有靠近 $u_0$ 的 $u$ ，都有

f(u)-f(u_0)=\Phi(u)(u-u_0)

把 $u=g(x)$ 代入：

f(g(x))-f(g(c))=\Phi(g(x))(g(x)-g(c))

当 $x\neq c$ 时除以 $x-c$ ：

\frac{f(g(x))-f(g(c))}{x-c} =\Phi(g(x))\frac{g(x)-g(c)}{x-c}

因为 $g$ 在 $c$ 处可导，所以 $g$ 在 $c$ 处连续，故 $g(x)\to g(c)=u_0$ 。又因为在处连续，

\Phi(g(x))\to \Phi(u_0)=f'(u_0)=f'(g(c))

同时

\frac{g(x)-g(c)}{x-c}\to g'(c)

两者相乘，得到链式法则。

下面的交互把这个证明拆成可移动的逻辑块。重点不是背公式，而是看见“内层变化先有线性近似，外层变化再吃掉这个近似”的顺序。

辅助函数 $\Phi$ 的作用，是把“外层函数在 $u_0$ 附近可线性化”写成一个处处有意义的等式。这样即使 $g(x)=g(c)$ ，证明也不会被零分母卡住。

高阶导数

如果 $f$ 在一个区间上可导，那么 $f'$ 本身也是一个函数。若 $f'$ 在 $c$ 处可导，就称 $f$ 在处二阶可导，并记

f''(c)=(f')'(c)

继续下去，可以定义三阶导数、四阶导数和一般的 $n$ 阶导数：

f^{(n)}=(f^{(n-1)})'

其中 $f^{(0)}=f$ 。

高阶导数与斜率变化

一阶导数描述函数值的瞬时变化率。二阶导数描述一阶导数的变化率，也就是斜率怎样变化。若 $f''(c)>0$ ，通常表示在 $c$ 附近斜率正在增加；若 $f''(c)<0$ ，通常表示斜率正在减少。严格的凹凸性质会在后续中值定理和 Taylor 估计中进一步讨论。

例子

设

f(x)=x^4-3x^2

则

f'(x)=4x^3-6x

并且

f''(x)=12x^2-6

在 $x=0$ 处， $f''(0)=-6$ ，说明一阶导数在 $0$ 附近以负方向变化。图像上这对应函数在 $0$ 附近向下弯。

“ $f$ 可导”不自动保证 “ $f'$ 连续”，也不自动保证二阶导数存在。高阶导数每升一阶，都需要重新检查上一阶导数是否可导。

局部线性化

导数最有力量的解释是局部线性化。若 $f$ 在 $c$ 处可导，那么

L(x)=f(c)+f'(c)(x-c)

是 $f$ 在 $c$ 附近的一阶线性近似。更精确地说，存在误差函数 $r(x)$ ，使得

f(x)=f(c)+f'(c)(x-c)+r(x)

并且

\lim_{x\to c}\frac{r(x)}{x-c}=0

这句话比“曲线看起来像切线”更严格。它说误差不仅趋于 $0$ ，而且误差相对于 $|x-c|$ 还要更小。

局部线性化中的误差

可导性的等价说法

下面的命题经常比差商定义更好用： $f$ 在 $c$ 处可导，当且仅当存在实数 $A$ 和误差函数 $r$ ，使

f(c+h)=f(c)+Ah+r(h)

且

\lim_{h\to 0}\frac{r(h)}{h}=0

这时 $A=f'(c)$ 。

从导数定义出发，取

r(h)=f(c+h)-f(c)-f'(c)h

则

\frac{r(h)}{h} =\frac{f(c+h)-f(c)}{h}-f'(c)\to 0

反过来，如果有这样的表示，则

\frac{f(c+h)-f(c)}{h} =A+\frac{r(h)}{h}\to A

所以 $f'(c)=A$ 。

误差视角的价值

差商定义告诉我们“斜率极限存在”。局部线性化告诉我们“函数在足够小的尺度下等于线性部分加上更小的误差”。很多后续定理都会沿着这个想法展开：中值定理把局部斜率和整体增量联系起来，Taylor 定理则把一次线性化推广为高阶多项式近似。

证明练习

练习的重点不是算得快，而是把每个结论放回定义。遇到求导公式时，先问：这个公式来自哪一个差商拆分？

练习：三次函数

用定义证明 $f(x)=x^3$ 在任意 $c$ 处可导，并求 $f'(c)$ 。

从差商开始：

\frac{(c+h)^3-c^3}{h} =\frac{3c^2h+3ch^2+h^3}{h} =3c^2+3ch+h^2

练习：连续但不可导

证明 $f(x)=|x|$ 在 $0$ 处连续，但在 $0$ 处不可导。

连续性来自

\lim_{x\to 0}|x|=0=|0|

不可导性来自差商

\frac{|h|-0}{h}

练习：乘积法则的一个应用

已知 $f$ 和 $g$ 在 $c$ 处可导，且 $f(c)=0$ 。证明

(fg)'(c)=f'(c)g(c)

由乘积法则，

(fg)'(c)=f'(c)g(c)+f(c)g'(c)

练习：链式法则的特殊情形

设 $g(c)=0$ ， $g$ 在 $c$ 处可导， $f(u)=u^2$ 。用定义证明 $($ 。

因为 $f(g(x))=g(x)^2$ ，所以

\frac{f(g(c+h))-f(g(c))}{h} =\frac{g(c+h)^2-g(c)^2}{h}

本章小结

导数的定义是差商极限：

f'(c)=\lim_{h\to 0}\frac{f(c+h)-f(c)}{h}

一旦这个极限存在，函数在该点必定连续。求导法则来自差商的代数拆分；乘积法则需要用到可导推出连续，商法则还需要分母在研究点不为零。链式法则的严格证明最好使用辅助函数，避免在 $g(x)=g(c)$ 时出现非法除法。

局部线性化把导数理解为最佳一阶近似：

f(c+h)=f(c)+f'(c)h+r(h)

其中

\frac{r(h)}{h}\to 0

这会成为后续中值定理、Taylor 估计和误差分析的入口。

c

f

\circ

g

)^{'}

(

c

)

=

0

(f\circ g)'(c)=0