导数的定义、法则与局部线性化
导数在微积分里常被当作一张公式表:多项式怎么求,乘积怎么求,复合函数怎么求。实分析要做的事不同。我们从极限定义重新建造导数,弄清楚每条法则为什么成立,也弄清楚它们需要哪些假设。
这一章只研究实函数在一点附近的可导性。设函数 f 在包含 c 的某个邻域内有定义,至少在 c 附近除 c 外也能取值。导数讨论的是当 x 越来越靠近 c 时,函数增量和自变量增量之间的比值有没有稳定下来。
差商极限
在点 c 附近,割线斜率是
x−cf(x)−f(c)
其中 x=c。如果这个比值在 x→c 时有极限,我们把这个极限称为 f 在 c 处的导数,记作 f:
f′(c)=x→climx−c
也常把 x 写成 c+h。这时 h→0 且 h=0,定义变成
f′(c)=h→0limhf
两个形式完全等价。x 形式强调“移动点向固定点靠近”,h 形式强调“增量趋向零”。证明中通常用 h 形式更方便,讨论图像时用 x 形式更直观。


导数不是先有切线再有斜率,而是先有差商极限,再把这个极限解释为切线斜率。图像直觉很有用,但定义真正检查的是一个函数极限是否存在。
下面的交互把 h 作为可调参数。留意 ∣x∣ 在 0 处的表现:左右两边的割线斜率分别趋向不同的数,所以差商没有极限。
从定义证明简单函数可导
证明 f(x)=x2 在任意 c∈R 处可导,不需要求导表,只需要整理差商:
hf(c+h)−f(c)=
当 h→0 时,2c+h→2c,所以
f′(c)=2c
同样,若 f(x)=ax+b,则
hf(c+h)−f(c)=h
因此 f′(c)=a。这说明直线函数的导数就是它的固定斜率。
不可导的典型信号
函数 f(x)=∣x∣ 在 0 处连续,但不可导。它的差商是
h∣0+h∣−∣0∣=h∣h∣
当 h>0 时这个比值等于 1,当 h<0 时等于 −1。左右极限不同,所以导数不存在。
“图像有尖点”不是证明。真正的证明要回到差商,说明差商极限不存在。尖点只是提醒我们应该检查左右趋近时的差商。
可导与连续
可导比连续强。直观上,若函数在 c 附近能被一条斜率有限的直线捕捉,它不可能在 c 处突然跳开。严格证明也很短,但它揭示了导数定义里最重要的结构。

定理与证明
若 f 在 c 处可导,则 f 在 c 处连续。
要证明连续,只需证明当 x→c 时,f(x)−f(c)→0。
这证明了 f 在 c 处连续。
注意证明没有使用图像,也没有使用任何求导公式。它只用到了“差商有有限极限”这一件事。反过来不成立:连续函数未必可导,∣x∣ 在 0 处就是最小反例。
不要把“连续,所以可导”当作默认规则。连续只控制函数值靠近,导数还要控制靠近的速度是否稳定。
求导法则从哪里来
求导法则不是独立记忆项。每条法则都来自差商的代数拆分,再用已经学过的函数极限法则收尾。下面把最常用的几条法则从定义中推出来。
线性法则
若 f 和 g 在 c 处可导,α,β∈R,则 αf+βg 在 处可导,且
(αf+βg)′(c)=αf′(c)+
证明直接来自差商:
h(αf+βg)(c+h)−(α
两项分别取极限即可。
乘积法则
若 f 和 g 在 c 处可导,则 fg 在 c 处可导,且
(fg)′(c)=f′(c)g(c)+f(c
乘积法则的关键是加上再减去同一项:
hf(c+h)g(c+h)−f(c)g(c)
=hf(c+h)g(c+h)−f(c)g
=g(c+h)hf(c+h)−f(c)
因为可导推出连续,所以 g(c+h)→g(c)。再令 h→0,得到乘积法则。

图里的小矩形 ΔfΔg 对应“二阶小量”。在严格证明中它没有被随手扔掉,而是通过差商拆分和极限运算自然消失。
倒数与商法则
若 g 在 c 处可导且 g(c)=0,则 1/g 在 c 处可导。先看差商:
hg(c+h)1
因为 g 在 c 处连续且 g(c)=0,所以 h 足够小时 g(c+ 不为 ,并且 。于是
(g1)′(c)=−
把乘积法则应用到 f⋅(1/g),得到商法则:
(gf)′(c)=
商法则必须假设 g(c)=0。这个条件不是技术细节,而是保证 1/g 在 c 附近有意义并且极限运算可以进行。
用法则计算,但记得它们的来源
例如 p(x)=3x3−2x+5。已经从定义知道 x2 的导数,也可以类似证明 x 的导数为 。结合线性法则,得到
p′(x)=9x2−2
实分析中,计算不是目标本身。我们更关心的是:这些公式之所以可靠,是因为差商极限与连续性、代数拆分配合得很好。
链式法则的严格讨论
链式法则说,若 g 在 c 处可导,f 在 g(c) 处可导,则复合函数 f∘g 在 c 处可导,且
(f∘g)′(c)=f′(g(c))g
直觉上,x 的小变化先经过 g 变成 u 的小变化,再经过 f 变成函数值的变化。变化率相乘,就是复合函数的变化率。

常见但不严谨的写法
很多人会写
x−cf(g(x))−f(g(
然后让 x→c。这个想法是对的,但写法有漏洞:可能存在许多 x=c 使 g(x)=g(c),此时第一项分母为 ,不能直接这样拆。
严格证明要避免这个漏洞。
用辅助函数证明
令 u0=g(c)。因为 f 在 u0 处可导,定义辅助函数
Φ(u)=⎩⎨
由导数定义可知,Φ 在 u0 处连续。并且对所有靠近 u0 的 u,都有
f(u)−f(u0)=Φ(u)(u−u0)
把 u=g(x) 代入:
f(g(x))−f(g(c))=Φ(g(x))(g(x)−g(c))
当 x=c 时除以 x−c:
x−cf(g(x))−f(g(c))=
因为 g 在 c 处可导,所以 g 在 c 处连续,故 g(x)→g(c)=u。又因为 在 处连续,
Φ(g(x))→Φ(u0)=f′(u
同时
x−cg(x)−g(c)→g′(c)
两者相乘,得到链式法则。
下面的交互把这个证明拆成可移动的逻辑块。重点不是背公式,而是看见“内层变化先有线性近似,外层变化再吃掉这个近似”的顺序。
辅助函数 Φ 的作用,是把“外层函数在 u0 附近可线性化”写成一个处处有意义的等式。这样即使 g(x)=g(c),证明也不会被零分母卡住。
高阶导数
如果 f 在一个区间上可导,那么 f′ 本身也是一个函数。若 f′ 在 c 处可导,就称 f 在 处二阶可导,并记
f′′(c)=(f′)′(c)
继续下去,可以定义三阶导数、四阶导数和一般的 n 阶导数:
f(n)=(f(n−1))′
其中 f(0)=f。

一阶导数描述函数值的瞬时变化率。二阶导数描述一阶导数的变化率,也就是斜率怎样变化。若 f′′(c)>0,通常表示在 c 附近斜率正在增加;若 f′′(c)<,通常表示斜率正在减少。严格的凹凸性质会在后续中值定理和 Taylor 估计中进一步讨论。
例子
设
f(x)=x4−3x2
则
f′(x)=4x3−6x
并且
f′′(x)=12x2−6
在 x=0 处,f′′(0)=−6,说明一阶导数在 0 附近以负方向变化。图像上这对应函数在 0 附近向下弯。
“f 可导”不自动保证 “f′ 连续”,也不自动保证二阶导数存在。高阶导数每升一阶,都需要重新检查上一阶导数是否可导。
局部线性化
导数最有力量的解释是局部线性化。若 f 在 c 处可导,那么
L(x)=f(c)+f′(c)(x−c)
是 f 在 c 附近的一阶线性近似。更精确地说,存在误差函数 r(x),使得
f(x)=f(c)+f′(c)(x−c)+r(x)
并且
x→climx−cr(x)=0
这句话比“曲线看起来像切线”更严格。它说误差不仅趋于 0,而且误差相对于 ∣x−c∣ 还要更小。

可导性的等价说法
下面的命题经常比差商定义更好用:f 在 c 处可导,当且仅当存在实数 A 和误差函数 r,使
f(c+h)=f(c)+Ah+r(h)
且
h→0limhr(h)=0
这时 A=f′(c)。
从导数定义出发,取
r(h)=f(c+h)−f(c)−f′(c)h
则
hr(h)=hf(c+h)
反过来,如果有这样的表示,则
hf(c+h)−f(c)=A+h
所以 f′(c)=A。
误差视角的价值
差商定义告诉我们“斜率极限存在”。局部线性化告诉我们“函数在足够小的尺度下等于线性部分加上更小的误差”。很多后续定理都会沿着这个想法展开:中值定理把局部斜率和整体增量联系起来,Taylor 定理则把一次线性化推广为高阶多项式近似。
证明练习
练习的重点不是算得快,而是把每个结论放回定义。遇到求导公式时,先问:这个公式来自哪一个差商拆分?
练习:三次函数
用定义证明 f(x)=x3 在任意 c 处可导,并求 f′(c)。
从差商开始:
h(c+h)3−c3
练习:连续但不可导
证明 f(x)=∣x∣ 在 0 处连续,但在 0 处不可导。
连续性来自
x→0lim∣x∣=0=∣0∣不可导性来自差商
h
练习:乘积法则的一个应用
已知 f 和 g 在 c 处可导,且 f(c)=0。证明
(fg)′(c)=f′(c)g(c)
由乘积法则,
(fg)′(c)=f′(c)g(c)+f(
练习:链式法则的特殊情形
设 g(c)=0,g 在 c 处可导,f(u)=u2。用定义证明 。
因为 f(g(x))=g(x)2,所以
本章小结
导数的定义是差商极限:
f′(c)=h→0limhf
一旦这个极限存在,函数在该点必定连续。求导法则来自差商的代数拆分;乘积法则需要用到可导推出连续,商法则还需要分母在研究点不为零。链式法则的严格证明最好使用辅助函数,避免在 g(x)=g(c) 时出现非法除法。
局部线性化把导数理解为最佳一阶近似:
f(c+h)=f(c)+f′(c)h+r(h)
其中
hr(h)→0
这会成为后续中值定理、Taylor 估计和误差分析的入口。