导数的概念:从平均变化率到瞬时变化率
一辆小车沿直线运动。我们每隔一段时间记录它离起点的距离,于是得到一个位置函数 s(t)。如果问“小车从第 2 秒到第 3 秒的平均速度是多少”,答案很直接:用距离变化除以时间变化。
但如果问“小车在第 2 秒这一瞬间的速度是多少”,问题就变得微妙了。一个瞬间没有长度,不能直接拿“这一瞬间的位移”除以“这一瞬间的时间”。导数要解决的正是这个问题:用越来越短的时间段,去逼近某一点附近真正的局部变化率。
平均变化率从哪里来
先看熟悉的平均速度。若物体在 t1 时刻的位置是 s(t1),在 t2 时刻的位置是 s(t2),那么这段时间内的平均速度是
t2−t1s(t2)−s(t1)
这里的分子是位置的变化,分母是时间的变化。它没有说物体每一刻都以这个速度运动,只说明“这一整段时间平均起来”的变化程度。
把位置函数换成一般函数 f(x),把时间区间换成输入区间 [a,b],平均变化率就是
b−af(b)−f(a)
在图像上,这个式子还有一个几何解释:它是连接 (a,f(a)) 和 (b,f(b)) 这两个点的直线斜率。这条直线叫割线。
平均变化率不是导数的“低级版本”。它是导数的原材料。导数只是把这段区间不断缩短,观察平均变化率会不会稳定到一个确定的数。
从割线靠近切线
固定图像上的一点 P=(a,f(a)),再取附近另一个点 Q=(a+h,f(a+h))。这两个点之间的割线斜率是
hf(a+h)−f(a)
这个式子叫差商。它仍然是一个平均变化率,只是把区间写成了从 a 到 a+h。

当 Q 沿曲线靠近固定点 P 时,割线的斜率逐渐趋近于 P 点切线的斜率。
当 h 比较大时,割线描述的是一段较宽区间的整体变化。让 h 变小,点 Q 向 P 靠近,割线会不断转动。如果这些割线的斜率趋近于一个确定的数,我们就把这个数看作曲线在 P 点的切线斜率。

差商把输出变化除以输入变化,表示函数在区间上的平均变化率,也就是割线斜率。
在差商里,h 不能直接等于 0。如果一开始就把 h 代成 0,分母会变成 0,式子没有意义。正确做法是先在 h=0 的条件下化简,再观察 h 趋近于 0 时差商趋向哪里。
导数的定义
如果下面的极限存在,函数 f 在 x=a 处的导数定义为
f′(a)=h→0limhf(a+h)−f(a)
同一个定义也常写成
f′(a)=x→alimx−af(x)−f(a)
两种写法说的是同一件事:让另一个点不断靠近 a,看割线斜率是否趋近于一个确定值。
导数为什么叫“瞬时变化率”?因为它不是用一整段区间描述变化,而是用无限缩小的区间刻画某一点附近的变化。如果 x 表示时间,f(x) 表示位置,那么 f′(a) 就是 a 时刻的瞬时速度。如果 x 表示产量,f(x) 表示成本,那么 f′(a) 就是在产量 a 附近成本对产量的局部变化率。

曲线在一点附近不断放大,局部图像逐渐贴近一条直线,这条直线的斜率刻画该点的瞬时变化率。
导数还有一个很有用的理解:在可导的点附近,曲线放大看会越来越像一条直线。这条直线就是切线,它的方程可以写成
y=f(a)+f′(a)(x−a)
这不是说曲线真的变成直线,而是说在足够小的范围内,切线能给出曲线的局部近似。
例题:用位置函数估计某时刻速度
小球沿竖直方向运动,离地高度用函数
s(t)=40−4t2
表示,其中 t 的单位是秒,s(t) 的单位是米。估计并求出 t=2 秒时小球的瞬时速度。

区间缩短,平均速度接近 -16。
先算目标时刻的位置。因为 s(2)=40−4⋅22=24,所以小球在第 2 秒时离地 24 米。
用靠近 2 的右侧区间估计平均速度。比如从 2 秒到 3 秒,
3−2s(3)−s(2)=14−24=−20从 2 秒到 2.5 秒,
2.5−2s(2.5)−s(2)=0.515−24=−18区间缩短后,平均速度已经向某个数靠近。
用差商写出一般形式。令第二个时刻为 2+h,则
hs(2+h)−s(2)=h40−4(2+h)2−24展开分子:
40−4(4+4h+h2)−24=−16h−4h2所以当 h=0 时,
hs(2+h)−s(2)=−16−4h让 h 趋近于 0,得到
s′(2)=h→0lim(−16−4h)=−16因此第 2 秒时的瞬时速度是 −16 米/秒。负号表示高度正在降低。
这个例题中,平均速度的单位是“米/秒”,导数的单位仍然是“米/秒”。导数不是把单位丢掉,而是把同一种变化率压缩到一个时刻附近。
例题:用差商定义求导数
用导数定义求函数
f(x)=x2+3x
的导数。
从定义出发,先写出差商:
hf(x+h)−f(x)这里要求的是一般位置 x 处的导数,所以固定的是 x,靠近的是 x+h。
计算 f(x+h)。把函数表达式中的每个 x 都换成 x+h:
f(x+h)=(x+h)2+3(x+h)展开得到
f(x+h)=x2+2xh+h2+3x+3h代回差商并化简:
hf(x+h)−f(x)=hx2+2xh+h2+3x+3h−(x2+3x)分子中 x2 与 3x 抵消,剩下
h2xh+h2+3h=2x+h+3最后让 h 趋近于 0:
f′(x)=h→0lim(2x+h+3)=2x+3所以 f(x)=x2+3x 的导数是 f′(x)=2x+3。
用定义求导的关键步骤通常不是“代极限”,而是先把差商化简到可以取极限的形式。只要分母里还孤零零地留着那个导致 0 的 h,就说明代数整理还没做完。
可导与不可导
函数在 a 处可导,意思是 f′(a) 这个极限存在,并且是一个有限的数。这个条件比“图像在这里连着”更强。

可导与不可导的典型图像原因:平滑曲线可导,折角、竖切线和不连续点不可导。
常见的不可导情况有三类。第一类是折角或尖点,例如 f(x)=∣x∣ 在 0 处左边斜率趋近 −1,右边斜率趋近 1,左右不一致。第二类是竖切线,例如某些函数在目标点附近越来越陡,斜率没有趋近一个有限数。第三类是不连续,如果函数在某点连函数值附近的极限都不稳定,就更谈不上切线斜率。

判断可导时,需要比较左右两侧差商是否趋于同一个斜率。
“图像不断开”不等于“处处可导”。可导要求左侧和右侧靠近时的差商趋向同一个有限值。折角处可以连续,但没有唯一的切线斜率。
以 f(x)=∣x∣ 为例,在 0 处的差商是
h∣0+h∣−∣0∣=h∣h∣
当 h>0 时,这个差商等于 1;当 h<0 时,它等于 −1。左右两侧给出的结果不同,所以 f′(0) 不存在。
做题时的判断顺序
遇到导数定义题,可以按下面的顺序处理。
- 先确认研究的是哪个点:是求 f′(a),还是求一般的 f′(x)。
- 写出差商,不要省略 h=0 这个前提。
- 展开、通分、因式分解或有理化,让分子中出现可以约掉的 h。
- 约掉公共因子后,再让 h→0。
- 如果图像有折角、竖切线或断点,要分别看左右两侧是否给出同一个有限斜率。
这个顺序也能帮助你区分平均变化率和瞬时变化率。平均变化率停在一个确定区间上;瞬时变化率还要继续做极限。
练习
- 求 f(x)=x2 在区间 [1,3] 上的平均变化率。
平均变化率为
3−1f(3)−f(1)=29−1=4所以这段区间上的平均变化率是 4。
- 设 s(t)=30+5t−2t2。用区间 [1,1.1] 的平均速度估计 t=1 时的瞬时速度,再用导数定义求精确值。
先算平均速度:
s(1)=33,s(1.1)=30+5.5−2(1.21)=33.08因此
1.1−1s(1.1)−s(1)=0.10.08=0.8用定义计算:
hs(1+h)−s(1)=h30+5(1+h)−2(1+h)2−33=1−2h让 h→0,得到 s′(1)=1。所以区间估计是 0.8,精确瞬时速度是 1。
- 用定义求 f(x)=x2−4x 在 x=a 处的导数。
写出差商:
hf(a+h)−f(a)=h(a+h)2−4(a+h)−(a2−4a)化简分子:
a2+2ah+h2−4a−4h−a2+4a=2ah+h2−4h所以
hf(a+h)−f(a)=2a+h−4让 h→0,得到 f′(a)=2a−4。
- 判断 f(x)=∣x∣ 在 x=0 处是否可导,并说明理由。
在 0 处的差商是
h∣h∣−0=h∣h∣当 h>0 时它等于 1;当 h<0 时它等于 −1。左右两侧趋向不同,所以 f(x)=∣x∣ 在 0 处不可导。
- 用定义求 f(x)=x1 在 x=2 处的导数。
差商为
hf(2+h)−f(2)=h2+h1−21先通分:
h2(2+h)2−(2+h)=2(2+h)h−h=−2(2+h)1让 h→0,得到
f′(2)=−41
- 某物体的位置数据如下表。估计 t=3 时的瞬时速度。
用 3 附近的对称区间估计较稳妥:
3.1−2.9s(3.1)−s(2.9)=0.27.47−8.19=−3.6所以 t=3 时的瞬时速度可估计为约 −3.6。只用右侧区间 [3,3.1] 会得到 −3.3,只用左侧区间 [2.9,3] 会得到 −3.9;把两侧信息合起来通常更接近目标时刻的局部变化。