自在学
分类课程智能体订阅
分类课程AI导师价格
课程进度
8 / 25
上一节偏导数:沿坐标方向看变化下一节多变量链式法则与隐函数求导
自在学

© 2025 - 2026 自在学,保留所有权利。

公网安备湘公网安备43020302000292号 | 湘ICP备2025148919号-1

关于我们隐私政策使用条款

© 2025 自在学,保留所有权利。

公网安备湘公网安备43020302000292号湘ICP备2025148919号-1

数学多变量微积分 I:偏导数、重积分与向量场切平面、线性近似与全微分

切平面、线性近似与全微分

上一章把偏导数解释成“沿坐标方向的变化率”。这一章要把两个方向的变化率合在一起,回答一个更几何的问题:曲面上一点附近,能不能用一个平面替代那一小块曲面?

答案在足够光滑的地方是可以的。这个平面叫切平面;把切平面写成函数,就是线性化;把输入的小变化写成 dx,dydx,dydx,dy,输出的线性变化写成 dzdzdz,就是全微分。

二元函数曲面 z=f(x,y) 在点 P 附近由半透明切平面作局部近似的三维示意图。

切平面不是为了描述整张曲面,而是为了描述点附近的一小块。


从曲面的一小块开始

设二元函数 z=f(x,y)z=f(x,y)z=f(x,y) 的图像是一张曲面。点 (a,b)(a,b)(a,b) 在输入平面上,对应曲面上的点是

P=(a,b,f(a,b)).P=(a,b,f(a,b)).P=(a,b,f(a,b)).

如果只固定 y=by=by=b,让 xxx 变化,就得到曲面上的一条截线。这条截线在 PPP 点的斜率是 fx(a,b)f_x(a,b)fx​(a,b)。如果只固定 x=ax=ax=a,让 yyy 变化,就得到另一条截线,它在 PPP 点的斜率是 fy(a,b)f_y(a,b)fy​(a,b)。

这两个斜率给出了切平面在两个坐标方向上的倾斜程度。切平面要通过 PPP,并且沿 xxx 方向的斜率等于 fx(a,b)f_x(a,b)fx​(a,b),沿 yyy 方向的斜率等于 fy(a,b)f_y(a,b)fy​(a,b)。

曲面在点 P 处由固定 y=b 与固定 x=a 的两条截线切线共同确定切平面。

单变量里,一条切线用“点 + 斜率”确定。二元函数里,一个切平面用“点 + 两个独立方向上的斜率”确定。这里的两个方向通常取 xxx 方向和 yyy 方向。


切平面方程

在点 (a,b)(a,b)(a,b) 处,如果 fff 可微,曲面 z=f(x,y)z=f(x,y)z=f(x,y) 的切平面方程是

z=f(a,b)+fx(a,b)(x−a)+fy(a,b)(y−b).z=f(a,b)+f_x(a,b)(x-a)+f_y(a,b)(y-b).z=f(a,b)+fx​(a,b)(x−a)+fy​(a,b)(y−b).

这个公式可以直接从“平面的一般形式”看出来。一个通过 (a,b,f(a,b))(a,b,f(a,b))(a,b,f(a,b)) 的平面,如果沿 xxx 方向斜率是 AAA、沿 yyy 方向斜率是 BBB,就可以写成

z=f(a,b)+A(x−a)+B(y−b).z=f(a,b)+A(x-a)+B(y-b).z=f(a,b)+A(x−a)+B(y−b).

把 A=fx(a,b)A=f_x(a,b)A=fx​(a,b)、B=fy(a,b)B=f_y(a,b)B=fy​(a,b) 代入,就得到切平面公式。

例题:求切平面

求曲面

z=x2+xy+2y2z=x^2+xy+2y^2z=x2+xy+2y2

在点 (1,−1)(1,-1)(1,−1) 上方的切平面方程。

先求曲面上的高度:

f(1,−1)=12+1⋅(−1)+2(−1)2=2.f(1,-1)=1^2+1\cdot(-1)+2(-1)^2=2.f(1,−1)=12+1⋅(−1)+2(−1)2=2.

所以切平面经过点 (1,−1,2)(1,-1,2)(1,−1,2)。

再求两个偏导数:

fx(x,y)=2x+y,fy(x,y)=x+4y.f_x(x,y)=2x+y,\qquad f_y(x,y)=x+4y.fx​(x,y)=2x+y,fy​(x,y)=x+4y.

在 (1,−1)(1,-1)(1,−1) 处,

fx(1,−1)=1,fy(1,−1)=−3.f_x(1,-1)=1,\qquad f_y(1,-1)=-3.fx​(1,−1)=1,fy​(1,−1)=−3.

把点和两个斜率代入切平面公式:

z=2+1(x−1)−3(y+1).z=2+1(x-1)-3(y+1).z=2+1(x−1)−3(y+1).

化简得到

z=x−3y−2.z=x-3y-2.z=x−3y−2.

这个平面只在 (1,−1)(1,-1)(1,−1) 附近可靠。离这个点越远,曲面的弯曲影响越明显,平面近似通常就越粗糙。


线性化

切平面方程右边只含 xxx、yyy 的一次项。把它看成一个新的函数,就得到 fff 在 (a,b)(a,b)(a,b) 处的线性化:

L(x,y)=f(a,b)+fx(a,b)(x−a)+fy(a,b)(y−b).L(x,y)=f(a,b)+f_x(a,b)(x-a)+f_y(a,b)(y-b).L(x,y)=f(a,b)+fx​(a,b)(x−a)+fy​(a,b)(y−b).

当 (x,y)(x,y)(x,y) 很接近 (a,b)(a,b)(a,b) 时,可以用

f(x,y)≈L(x,y)f(x,y)\approx L(x,y)f(x,y)≈L(x,y)

来做近似计算。

曲面与切平面示意图,展示输入变化 Δx、Δy 如何通过线性化 L(x,y) 产生近似输出变化。

如果令

Δx=x−a,Δy=y−b,\Delta x=x-a,\qquad \Delta y=y-b,Δx=x−a,Δy=y−b,

线性化公式也可以写成

f(a+Δx,b+Δy)≈f(a,b)+fx(a,b)Δx+fy(a,b)Δy.f(a+\Delta x,b+\Delta y)\approx f(a,b)+f_x(a,b)\Delta x+f_y(a,b)\Delta y.f(a+Δx,b+Δy)≈f(a,b)+fx​(a,b)Δx+fy​(a,b)Δy.

这个写法更接近实际使用:从已知点出发,输入变化一点点,输出大约变化多少?

例题:用线性化近似函数值

用线性化近似

f(x,y)=xy+1f(x,y)=\sqrt{xy+1}f(x,y)=xy+1​

在 (2.98,5.04)(2.98,5.04)(2.98,5.04) 处的函数值。选择附近容易计算的点 (3,5)(3,5)(3,5)。

在基准点计算函数值:

f(3,5)=3⋅5+1=4.f(3,5)=\sqrt{3\cdot5+1}=4.f(3,5)=3⋅5+1​=4.

求偏导数:

fx(x,y)=y2xy+1,fy(x,y)=x2xy+1.f_x(x,y)=\frac{y}{2\sqrt{xy+1}},\qquad f_y(x,y)=\frac{x}{2\sqrt{xy+1}}.fx​(x,y)=2xy+1​y​,fy​(x,y)=2xy+1​x​.

在 (3,5)(3,5)(3,5) 处,

fx(3,5)=58,fy(3,5)=38.f_x(3,5)=\frac{5}{8},\qquad f_y(3,5)=\frac{3}{8}.fx​(3,5)=85​,fy​(3,5)=83​.

写出输入变化:

Δx=2.98−3=−0.02,Δy=5.04−5=0.04.\Delta x=2.98-3=-0.02,\qquad \Delta y=5.04-5=0.04.Δx=2.98−3=−0.02,Δy=5.04−5=0.04.

使用线性化:

f(2.98,5.04)≈4+58(−0.02)+38(0.04)=4.0025.f(2.98,5.04)\approx 4+\frac{5}{8}(-0.02)+\frac{3}{8}(0.04)=4.0025.f(2.98,5.04)≈4+85​(−0.02)+83​(0.04)=4.0025.

所以近似值是 4.00254.00254.0025。


误差为什么会变小

线性近似的依据不是“看起来差不多”,而是可微性带来的误差结构。若 fff 在 (a,b)(a,b)(a,b) 可微,则

f(a+h,b+k)=f(a,b)+fx(a,b)h+fy(a,b)k+R(h,k),f(a+h,b+k)=f(a,b)+f_x(a,b)h+f_y(a,b)k+R(h,k),f(a+h,b+k)=f(a,b)+fx​(a,b)h+fy​(a,b)k+R(h,k),

并且余项满足

R(h,k)h2+k2→0当(h,k)→(0,0).\frac{R(h,k)}{\sqrt{h^2+k^2}}\to 0 \quad \text{当}\quad (h,k)\to(0,0).h2+k2​R(h,k)​→0当(h,k)→(0,0).

这句话的意思是:输入距离足够小时,剩下的误差比输入距离本身还要小一阶。曲面当然可能弯,但在足够小的观察窗口里,弯曲造成的误差会被压到更低层次。

三联图展示在点 P 附近逐步放大光滑曲面,曲率逐渐减弱,最后曲面近似为切平面。

线性近似的可靠范围不是固定的。曲面弯得越厉害,或者远离基准点越多,误差通常越明显。做近似时要同时说明“在哪个点线性化”和“输入变化有多小”。


全微分

线性化公式中的输入小变化常写成 dx,dydx,dydx,dy,输出的线性主部写成 dzdzdz:

dz=fx(x,y) dx+fy(x,y) dy.dz=f_x(x,y)\,dx+f_y(x,y)\,dy.dz=fx​(x,y)dx+fy​(x,y)dy.

这就是全微分。这里的 dzdzdz 不是精确变化量的另一个名字,而是精确变化量 Δz\Delta zΔz 的线性近似:

Δz=f(x+dx,y+dy)−f(x,y),\Delta z=f(x+dx,y+dy)-f(x,y),Δz=f(x+dx,y+dy)−f(x,y),

而

dz=fx(x,y) dx+fy(x,y) dy.dz=f_x(x,y)\,dx+f_y(x,y)\,dy.dz=fx​(x,y)dx+fy​(x,y)dy.

当 dx,dydx,dydx,dy 很小时,常用 dzdzdz 估计 Δz\Delta zΔz。

全微分用于测量误差估计的示意图,左侧为测量值 x、y 及误差 dx、dy,中间公式 dQ=f_x dx+f_y dy,右侧为估计输出误差 dQ。

全微分的读法

公式

dz=fx dx+fy dydz=f_x\,dx+f_y\,dydz=fx​dx+fy​dy

可以按“敏感度乘以变化量再相加”来读。fxf_xfx​ 表示 zzz 对 xxx 的敏感度,dxdxdx 是 xxx 的小变化;fyf_yfy​ 表示 zzz 对 yyy 的敏感度,dydydy 是 yyy 的小变化。两个贡献相加,得到输出的线性估计。

全微分是切平面的增量形式。切平面给出高度近似,线性化给出函数近似,全微分给出变化量近似。它们是同一个局部线性思想的三种说法。


测量误差估计

实际测量中,我们往往不知道误差的正负,只知道输入误差的最大范围。若

∣dx∣≤ϵx,∣dy∣≤ϵy,|dx|\leq \epsilon_x,\qquad |dy|\leq \epsilon_y,∣dx∣≤ϵx​,∣dy∣≤ϵy​,

则常用

∣Δz∣≈∣dz∣≤∣fx(x,y)∣ϵx+∣fy(x,y)∣ϵy|\Delta z|\approx |dz|\leq |f_x(x,y)|\epsilon_x+|f_y(x,y)|\epsilon_y∣Δz∣≈∣dz∣≤∣fx​(x,y)∣ϵx​+∣fy​(x,y)∣ϵy​

估计输出误差的上界。这里使用绝对值,是因为两个输入误差可能同向放大输出,也可能互相抵消;做保守估计时不能假设抵消一定发生。

例题:圆柱体体积的误差

圆柱体体积为

V=πr2h.V=\pi r^2h.V=πr2h.

测得 r=5r=5r=5、h=12h=12h=12,半径误差不超过 0.020.020.02,高度误差不超过 0.050.050.05。估计体积误差。

先求全微分:

dV=Vr dr+Vh dh=2πrh dr+πr2 dh.dV=V_r\,dr+V_h\,dh=2\pi rh\,dr+\pi r^2\,dh.dV=Vr​dr+Vh​dh=2πrhdr+πr2dh.

做最大误差估计时取绝对值:

∣dV∣≤2πrh∣dr∣+πr2∣dh∣.|dV|\leq 2\pi rh|dr|+\pi r^2|dh|.∣dV∣≤2πrh∣dr∣+πr2∣dh∣.

代入 r=5r=5r=5、h=12h=12h=12、∣dr∣≤0.02|dr|\leq0.02∣dr∣≤0.02、∣dh∣≤0.05|dh|\leq0.05∣dh∣≤0.05:

∣dV∣≤2π⋅5⋅12⋅0.02+π⋅25⋅0.05=3.65π.|dV|\leq 2\pi\cdot5\cdot12\cdot0.02+\pi\cdot25\cdot0.05=3.65\pi.∣dV∣≤2π⋅5⋅12⋅0.02+π⋅25⋅0.05=3.65π.

因此体积误差约不超过 11.4711.4711.47 个体积单位。

原体积为

V=300π.V=300\pi.V=300π.

相对误差约为

3.65π300π≈1.22%.\frac{3.65\pi}{300\pi}\approx 1.22\%.300π3.65π​≈1.22%.

可微性与偏导存在

切平面公式里出现了 fx(a,b)f_x(a,b)fx​(a,b) 和 fy(a,b)f_y(a,b)fy​(a,b),但只有这两个偏导数存在,还不能保证曲面真的有一个能代表所有方向的切平面。

真正需要的是可微性。对二元函数来说,fff 在 (a,b)(a,b)(a,b) 可微,意思是存在一个线性主部

fx(a,b)h+fy(a,b)kf_x(a,b)h+f_y(a,b)kfx​(a,b)h+fy​(a,b)k

使得

f(a+h,b+k)−f(a,b)−fx(a,b)h−fy(a,b)kf(a+h,b+k)-f(a,b)-f_x(a,b)h-f_y(a,b)kf(a+h,b+k)−f(a,b)−fx​(a,b)h−fy​(a,b)k

比 h2+k2\sqrt{h^2+k^2}h2+k2​ 更快趋近于 000。

双栏教学图,对比光滑曲面在点 P 有唯一切平面与尖点曲面在点 P 附近没有统一局部平面,说明偏导数存在也可能不可微。

一个常用判别条件

如果 fxf_xfx​ 和 fyf_yfy​ 不仅存在,而且在 (a,b)(a,b)(a,b) 附近存在并在 (a,b)(a,b)(a,b) 连续,那么 fff 在 (a,b)(a,b)(a,b) 可微。

这个条件很常用,因为它容易检查。多数由多项式、指数、三角函数、对数函数通过基本运算组成的函数,只要定义域内没有分母为零、根号无意义等问题,偏导数连续的地方就可微。

偏导存在但不可微的例子

定义

f(x,y)={xyx2+y2,(x,y)≠(0,0),0,(x,y)=(0,0).f(x,y)= \begin{cases} \dfrac{xy}{\sqrt{x^2+y^2}}, & (x,y)\neq(0,0),\\ 0, & (x,y)=(0,0). \end{cases}f(x,y)=⎩⎨⎧​x2+y2​xy​,0,​(x,y)=(0,0),(x,y)=(0,0).​

在原点,沿 xxx 轴和 yyy 轴都有 f=0f=0f=0,所以

fx(0,0)=0,fy(0,0)=0.f_x(0,0)=0,\qquad f_y(0,0)=0.fx​(0,0)=0,fy​(0,0)=0.

如果它在原点可微,线性主部就应为 000。但沿路径 (t,t)(t,t)(t,t),

f(t,t)=t22t2=∣t∣2.f(t,t)=\frac{t^2}{\sqrt{2t^2}}=\frac{|t|}{\sqrt2}.f(t,t)=2t2​t2​=2​∣t∣​.

输入距离是

t2+t2=2∣t∣.\sqrt{t^2+t^2}=\sqrt2|t|.t2+t2​=2​∣t∣.

于是

∣f(t,t)−0∣t2+t2=12,\frac{|f(t,t)-0|}{\sqrt{t^2+t^2}}=\frac{1}{2},t2+t2​∣f(t,t)−0∣​=21​,

它没有趋向 000。所以这个函数在原点偏导数存在,但不可微,也就不能用一个切平面统一描述所有方向上的局部变化。

常见错误是看到 fx(a,b)f_x(a,b)fx​(a,b)、fy(a,b)f_y(a,b)fy​(a,b) 存在,就立刻写切平面。切平面代表的是所有足够小方向上的统一线性近似,不只是两个坐标方向上的切线。


练习

练习 1 求

f(x,y)=ln⁡(x+2y)f(x,y)=\ln(x+2y)f(x,y)=ln(x+2y)

在 (1,1)(1,1)(1,1) 处的切平面方程。

先算 f(1,1)=ln⁡3f(1,1)=\ln3f(1,1)=ln3。偏导数为

fx(x,y)=1x+2y,fy(x,y)=2x+2y.f_x(x,y)=\frac{1}{x+2y},\qquad f_y(x,y)=\frac{2}{x+2y}.fx​(x,y)=x+2y1​,fy​(x,y)=x+2y2​.

所以

fx(1,1)=13,fy(1,1)=23.f_x(1,1)=\frac13,\qquad f_y(1,1)=\frac23.fx​(1,1)=31​,fy​(1,1)=32​.

切平面方程是

z=ln⁡3+13(x−1)+23(y−1).z=\ln3+\frac13(x-1)+\frac23(y-1).z=ln3+31​(x−1)+32​(y−1).

练习 2 用线性化近似

x+2y\sqrt{x+2y}x+2y​

在 (6.1,4.95)(6.1,4.95)(6.1,4.95) 处的值。建议选基准点 (6,5)(6,5)(6,5)。

令 f(x,y)=x+2yf(x,y)=\sqrt{x+2y}f(x,y)=x+2y​。在 (6,5)(6,5)(6,5) 处,

f(6,5)=4.f(6,5)=4.f(6,5)=4.

偏导数为

fx=12x+2y,fy=1x+2y.f_x=\frac{1}{2\sqrt{x+2y}},\qquad f_y=\frac{1}{\sqrt{x+2y}}.fx​=2x+2y​1​,fy​=x+2y​1​.

因此

fx(6,5)=18,fy(6,5)=14.f_x(6,5)=\frac18,\qquad f_y(6,5)=\frac14.fx​(6,5)=81​,fy​(6,5)=41​.

输入变化为 Δx=0.1\Delta x=0.1Δx=0.1、Δy=−0.05\Delta y=-0.05Δy=−0.05,所以

f(6.1,4.95)≈4+18(0.1)+14(−0.05)=4.f(6.1,4.95)\approx 4+\frac18(0.1)+\frac14(-0.05)=4.f(6.1,4.95)≈4+81​(0.1)+41​(−0.05)=4.

这个近似结果刚好等于 444,因为一阶变化相互抵消。

练习 3 长方形面积 A=xyA=xyA=xy。测得 x=30x=30x=30、y=20y=20y=20,并且 ∣dx∣≤0.1|dx|\leq0.1∣dx∣≤0.1、∣dy∣≤0.08|dy|\leq0.08∣dy∣≤0.08。估计面积误差的上界。

面积的全微分是

dA=y dx+x dy.dA=y\,dx+x\,dy.dA=ydx+xdy.

做最大误差估计:

∣dA∣≤∣y∣∣dx∣+∣x∣∣dy∣.|dA|\leq |y||dx|+|x||dy|.∣dA∣≤∣y∣∣dx∣+∣x∣∣dy∣.

代入数据:

∣dA∣≤20(0.1)+30(0.08)=4.4.|dA|\leq 20(0.1)+30(0.08)=4.4.∣dA∣≤20(0.1)+30(0.08)=4.4.

所以面积误差约不超过 4.44.44.4 个面积单位。

练习 4 判断函数

f(x,y)=x2y+exyf(x,y)=x^2y+e^{xy}f(x,y)=x2y+exy

在 (0,0)(0,0)(0,0) 是否可微,并写出切平面。

这个函数由多项式和指数函数复合而成,偏导数在整个平面连续,所以它在 (0,0)(0,0)(0,0) 可微。

先算

f(0,0)=1.f(0,0)=1.f(0,0)=1.

偏导数为

fx=2xy+yexy,fy=x2+xexy.f_x=2xy+ye^{xy},\qquad f_y=x^2+xe^{xy}.fx​=2xy+yexy,fy​=x2+xexy.

在 (0,0)(0,0)(0,0) 处,

fx(0,0)=0,fy(0,0)=0.f_x(0,0)=0,\qquad f_y(0,0)=0.fx​(0,0)=0,fy​(0,0)=0.

切平面方程为

z=1.z=1.z=1.

练习 5 判断下面说法是否正确:只要 fx(a,b)f_x(a,b)fx​(a,b) 和 fy(a,b)f_y(a,b)fy​(a,b) 都存在,曲面 z=f(x,y)z=f(x,y)z=f(x,y) 在对应点就一定有切平面。

这个说法不正确。偏导数只检查两个坐标方向上的变化。切平面要求所有足够小方向上的变化都能被同一个线性函数近似。偏导存在但不可微的函数可以没有这样的统一切平面。

  • 从曲面的一小块开始
  • 切平面方程
    • 例题:求切平面
  • 线性化
    • 例题:用线性化近似函数值
  • 误差为什么会变小
  • 全微分
    • 全微分的读法
  • 测量误差估计
    • 例题:圆柱体体积的误差
  • 可微性与偏导存在
    • 一个常用判别条件
    • 偏导存在但不可微的例子
  • 练习

目录

  • 从曲面的一小块开始
  • 切平面方程
    • 例题:求切平面
  • 线性化
    • 例题:用线性化近似函数值
  • 误差为什么会变小
  • 全微分
    • 全微分的读法
  • 测量误差估计
    • 例题:圆柱体体积的误差
  • 可微性与偏导存在
    • 一个常用判别条件
    • 偏导存在但不可微的例子
  • 练习