导数的概念：从平均变化率到瞬时变化率

一辆小车沿直线运动。我们每隔一段时间记录它离起点的距离，于是得到一个位置函数 $s(t)$ 。如果问“小车从第 2 秒到第 3 秒的平均速度是多少”，答案很直接：用距离变化除以时间变化。

但如果问“小车在第 2 秒这一瞬间的速度是多少”，问题就变得微妙了。一个瞬间没有长度，不能直接拿“这一瞬间的位移”除以“这一瞬间的时间”。导数要解决的正是这个问题：用越来越短的时间段，去逼近某一点附近真正的局部变化率。

平均变化率从哪里来

先看熟悉的平均速度。若物体在 $t_1$ 时刻的位置是 $s(t_1)$ ，在 $t_2$ 时刻的位置是 $s(t_2)$ ，那么这段时间内的平均速度是

\frac{s(t_2)-s(t_1)}{t_2-t_1}

这里的分子是位置的变化，分母是时间的变化。它没有说物体每一刻都以这个速度运动，只说明“这一整段时间平均起来”的变化程度。

把位置函数换成一般函数 $f(x)$ ，把时间区间换成输入区间 $[a,b]$ ，平均变化率就是

\frac{f(b)-f(a)}{b-a}

在图像上，这个式子还有一个几何解释：它是连接 $(a,f(a))$ 和 $(b,f(b))$ 这两个点的直线斜率。这条直线叫割线。

平均变化率不是导数的“低级版本”。它是导数的原材料。导数只是把这段区间不断缩短，观察平均变化率会不会稳定到一个确定的数。

从割线靠近切线

固定图像上的一点 $P=(a,f(a))$ ，再取附近另一个点 $Q=(a+h,f(a+h))$ 。这两个点之间的割线斜率是

\frac{f(a+h)-f(a)}{h}

这个式子叫差商。它仍然是一个平均变化率，只是把区间写成了从 $a$ 到 $a+h$ 。

割线逐渐逼近切线，展示从平均变化率到瞬时变化率的直观过程。

当 Q 沿曲线靠近固定点 P 时，割线的斜率逐渐趋近于 P 点切线的斜率。

当 $h$ 比较大时，割线描述的是一段较宽区间的整体变化。让 $h$ 变小，点 $Q$ 向 $P$ 靠近，割线会不断转动。如果这些割线的斜率趋近于一个确定的数，我们就把这个数看作曲线在 $P$ 点的切线斜率。

差商结构示意图，展示两点之间的输入变化 h、输出变化 f(a+h)-f(a)，以及差商公式与割线斜率的对应关系。

差商把输出变化除以输入变化，表示函数在区间上的平均变化率，也就是割线斜率。

在差商里， $h$ 不能直接等于 $0$ 。如果一开始就把 $h$ 代成 $0$ ，分母会变成 $0$ ，式子没有意义。正确做法是先在 $h\ne 0$ 的条件下化简，再观察 $h$ 趋近于 $0$ 时差商趋向哪里。

导数的定义

如果下面的极限存在，函数 $f$ 在 $x=a$ 处的导数定义为

f'(a)=\lim_{h\to 0}\frac{f(a+h)-f(a)}{h}

同一个定义也常写成

f'(a)=\lim_{x\to a}\frac{f(x)-f(a)}{x-a}

两种写法说的是同一件事：让另一个点不断靠近 $a$ ，看割线斜率是否趋近于一个确定值。

导数为什么叫“瞬时变化率”？因为它不是用一整段区间描述变化，而是用无限缩小的区间刻画某一点附近的变化。如果 $x$ 表示时间， $f(x)$ 表示位置，那么 $f'(a)$ 就是 $a$ 时刻的瞬时速度。如果 $x$ 表示产量， $f(x)$ 表示成本，那么 $f'(a)$ 就是在产量 $a$ 附近成本对产量的局部变化率。

三联图展示曲线在目标点附近逐步放大后越来越像切线，说明导数是局部变化率。

曲线在一点附近不断放大，局部图像逐渐贴近一条直线，这条直线的斜率刻画该点的瞬时变化率。

导数还有一个很有用的理解：在可导的点附近，曲线放大看会越来越像一条直线。这条直线就是切线，它的方程可以写成

y=f(a)+f'(a)(x-a)

这不是说曲线真的变成直线，而是说在足够小的范围内，切线能给出曲线的局部近似。

例题：用位置函数估计某时刻速度

小球沿竖直方向运动，离地高度用函数

s(t)=40-4t^2

表示，其中 $t$ 的单位是秒， $s(t)$ 的单位是米。估计并求出 $t=2$ 秒时小球的瞬时速度。

位置函数 s(t)=40-4t² 在 t=2 处的切线与平均速度表，展示区间缩短时平均速度接近 -16。

区间缩短，平均速度接近 -16。

先算目标时刻的位置。因为 $s(2)=40-4\cdot 2^2=24$ ，所以小球在第 2 秒时离地 $24$ 米。

用靠近 $2$ 的右侧区间估计平均速度。比如从 $2$ 秒到 $3$ 秒，

\frac{s(3)-s(2)}{3-2}=\frac{4-24}{1}=-20

从 $2$ 秒到 $2.5$ 秒，

\frac{s(2.5)-s(2)}{2.5-2}=\frac{15-24}{0.5}=-18

区间缩短后，平均速度已经向某个数靠近。

用差商写出一般形式。令第二个时刻为 $2+h$ ，则

\frac{s(2+h)-s(2)}{h} = \frac{40-4(2+h)^2-24}{h}

展开分子：

40-4(4+4h+h^2)-24=-16h-4h^2

所以当 $h\ne 0$ 时，

\frac{s(2+h)-s(2)}{h}=-16-4h

让 $h$ 趋近于 $0$ ，得到

s'(2)=\lim_{h\to 0}(-16-4h)=-16

因此第 2 秒时的瞬时速度是 $-16$ 米/秒。负号表示高度正在降低。

这个例题中，平均速度的单位是“米/秒”，导数的单位仍然是“米/秒”。导数不是把单位丢掉，而是把同一种变化率压缩到一个时刻附近。

例题：用差商定义求导数

用导数定义求函数

f(x)=x^2+3x

的导数。

从定义出发，先写出差商：

\frac{f(x+h)-f(x)}{h}

这里要求的是一般位置 $x$ 处的导数，所以固定的是 $x$ ，靠近的是 $x+h$ 。

计算 $f(x+h)$ 。把函数表达式中的每个 $x$ 都换成 $x+h$ ：

f(x+h)=(x+h)^2+3(x+h)

展开得到

f(x+h)=x^2+2xh+h^2+3x+3h

代回差商并化简：

\frac{f(x+h)-f(x)}{h} = \frac{x^2+2xh+h^2+3x+3h-(x^2+3x)}{h}

分子中 $x^2$ 与 $3x$ 抵消，剩下

\frac{2xh+h^2+3h}{h} = 2x+h+3

最后让 $h$ 趋近于 $0$ ：

f'(x)=\lim_{h\to 0}(2x+h+3)=2x+3

所以 $f(x)=x^2+3x$ 的导数是 $f'(x)=2x+3$ 。

用定义求导的关键步骤通常不是“代极限”，而是先把差商化简到可以取极限的形式。只要分母里还孤零零地留着那个导致 $0$ 的 $h$ ，就说明代数整理还没做完。

可导与不可导

函数在 $a$ 处可导，意思是 $f'(a)$ 这个极限存在，并且是一个有限的数。这个条件比“图像在这里连着”更强。

四个并列图示展示可导、折角左右斜率不同、竖切线斜率趋于无穷和断点不连续的典型情况。

可导与不可导的典型图像原因：平滑曲线可导，折角、竖切线和不连续点不可导。

常见的不可导情况有三类。第一类是折角或尖点，例如 $f(x)=|x|$ 在 $0$ 处左边斜率趋近 $-1$ ，右边斜率趋近 $1$ ，左右不一致。第二类是竖切线，例如某些函数在目标点附近越来越陡，斜率没有趋近一个有限数。第三类是不连续，如果函数在某点连函数值附近的极限都不稳定，就更谈不上切线斜率。

左右差商斜率比较：平滑曲线左右趋于同一切线斜率，尖点处左右斜率不一致。

判断可导时，需要比较左右两侧差商是否趋于同一个斜率。

“图像不断开”不等于“处处可导”。可导要求左侧和右侧靠近时的差商趋向同一个有限值。折角处可以连续，但没有唯一的切线斜率。

以 $f(x)=|x|$ 为例，在 $0$ 处的差商是

\frac{|0+h|-|0|}{h}=\frac{|h|}{h}

当 $h>0$ 时，这个差商等于 $1$ ；当 $h<0$ 时，它等于 $-1$ 。左右两侧给出的结果不同，所以 $f'(0)$ 不存在。

做题时的判断顺序

遇到导数定义题，可以按下面的顺序处理。

先确认研究的是哪个点：是求 $f'(a)$ ，还是求一般的 $f'(x)$ 。
写出差商，不要省略 $h\ne 0$ 这个前提。
展开、通分、因式分解或有理化，让分子中出现可以约掉的 $h$ 。
约掉公共因子后，再让 $h\to 0$ 。
如果图像有折角、竖切线或断点，要分别看左右两侧是否给出同一个有限斜率。

这个顺序也能帮助你区分平均变化率和瞬时变化率。平均变化率停在一个确定区间上；瞬时变化率还要继续做极限。

练习

求 $f(x)=x^2$ 在区间 $[1,3]$ 上的平均变化率。

平均变化率为

\frac{f(3)-f(1)}{3-1} = \frac{9-1}{2} =4

所以这段区间上的平均变化率是 $4$ 。

设 $s(t)=30+5t-2t^2$ 。用区间 $[1,1.1]$ 的平均速度估计 $t=1$ 时的瞬时速度，再用导数定义求精确值。

先算平均速度：

s(1)=33,\qquad s(1.1)=30+5.5-2(1.21)=33.08

因此

\frac{s(1.1)-s(1)}{1.1-1}=\frac{0.08}{0.1}=0.8

用定义计算：

\frac{s(1+h)-s(1)}{h} = \frac{30+5(1+h)-2(1+h)^2-33}{h} = 1-2h

让 $h\to 0$ ，得到 $s'(1)=1$ 。所以区间估计是 $0.8$ ，精确瞬时速度是 $1$ 。

用定义求 $f(x)=x^2-4x$ 在 $x=a$ 处的导数。

写出差商：

\frac{f(a+h)-f(a)}{h} = \frac{(a+h)^2-4(a+h)-(a^2-4a)}{h}

化简分子：

a^2+2ah+h^2-4a-4h-a^2+4a=2ah+h^2-4h

所以

\frac{f(a+h)-f(a)}{h}=2a+h-4

让 $h\to 0$ ，得到 $f'(a)=2a-4$ 。

判断 $f(x)=|x|$ 在 $x=0$ 处是否可导，并说明理由。

在 $0$ 处的差商是

\frac{|h|-0}{h}=\frac{|h|}{h}

当 $h>0$ 时它等于 $1$ ；当 $h<0$ 时它等于 $-1$ 。左右两侧趋向不同，所以 $f(x)=|x|$ 在 $0$ 处不可导。

用定义求 $f(x)=\frac{1}{x}$ 在 $x=2$ 处的导数。

差商为

\frac{f(2+h)-f(2)}{h} = \frac{\frac{1}{2+h}-\frac{1}{2}}{h}

先通分：

\frac{\frac{2-(2+h)}{2(2+h)}}{h} = \frac{-h}{2(2+h)h} = -\frac{1}{2(2+h)}

让 $h\to 0$ ，得到

f'(2)=-\frac{1}{4}

某物体的位置数据如下表。估计 $t=3$ 时的瞬时速度。

$t$	2.8	2.9	3.0	3.1	3.2
$s(t)$	8.64	8.19	7.80	7.47	7.20

用 $3$ 附近的对称区间估计较稳妥：

\frac{s(3.1)-s(2.9)}{3.1-2.9} = \frac{7.47-8.19}{0.2} =-3.6

所以 $t=3$ 时的瞬时速度可估计为约 $-3.6$ 。只用右侧区间 $[3,3.1]$ 会得到 $-3.3$ ，只用左侧区间 $[2.9,3]$ 会得到 $-3.9$ ；把两侧信息合起来通常更接近目标时刻的局部变化。