切平面、线性近似与全微分

上一章把偏导数解释成“沿坐标方向的变化率”。这一章要把两个方向的变化率合在一起，回答一个更几何的问题：曲面上一点附近，能不能用一个平面替代那一小块曲面？

答案在足够光滑的地方是可以的。这个平面叫切平面；把切平面写成函数，就是线性化；把输入的小变化写成 $dx,dy$ ，输出的线性变化写成 $dz$ ，就是全微分。

二元函数曲面 z=f(x,y) 在点 P 附近由半透明切平面作局部近似的三维示意图。

切平面不是为了描述整张曲面，而是为了描述点附近的一小块。

从曲面的一小块开始

设二元函数 $z=f(x,y)$ 的图像是一张曲面。点 $(a,b)$ 在输入平面上，对应曲面上的点是

P=(a,b,f(a,b)).

如果只固定 $y=b$ ，让 $x$ 变化，就得到曲面上的一条截线。这条截线在 $P$ 点的斜率是 $f_x(a,b)$ 。如果只固定 $x=a$ ，让 $y$ 变化，就得到另一条截线，它在 $P$ 点的斜率是 $f_y(a,b)$ 。

这两个斜率给出了切平面在两个坐标方向上的倾斜程度。切平面要通过 $P$ ，并且沿 $x$ 方向的斜率等于 $f_x(a,b)$ ，沿 $y$ 方向的斜率等于 $f_y(a,b)$ 。

曲面在点 P 处由固定 y=b 与固定 x=a 的两条截线切线共同确定切平面。

单变量里，一条切线用“点 + 斜率”确定。二元函数里，一个切平面用“点 + 两个独立方向上的斜率”确定。这里的两个方向通常取 $x$ 方向和 $y$ 方向。

切平面方程

在点 $(a,b)$ 处，如果 $f$ 可微，曲面 $z=f(x,y)$ 的切平面方程是

z=f(a,b)+f_x(a,b)(x-a)+f_y(a,b)(y-b).

这个公式可以直接从“平面的一般形式”看出来。一个通过 $(a,b,f(a,b))$ 的平面，如果沿 $x$ 方向斜率是 $A$ 、沿 $y$ 方向斜率是 $B$ ，就可以写成

z=f(a,b)+A(x-a)+B(y-b).

把 $A=f_x(a,b)$ 、 $B=f_y(a,b)$ 代入，就得到切平面公式。

例题：求切平面

求曲面

z=x^2+xy+2y^2

在点 $(1,-1)$ 上方的切平面方程。

先求曲面上的高度：

f(1,-1)=1^2+1\cdot(-1)+2(-1)^2=2.

所以切平面经过点 $(1,-1,2)$ 。

再求两个偏导数：

f_x(x,y)=2x+y,\qquad f_y(x,y)=x+4y.

在 $(1,-1)$ 处，

f_x(1,-1)=1,\qquad f_y(1,-1)=-3.

把点和两个斜率代入切平面公式：

z=2+1(x-1)-3(y+1).

化简得到

z=x-3y-2.

这个平面只在 $(1,-1)$ 附近可靠。离这个点越远，曲面的弯曲影响越明显，平面近似通常就越粗糙。

线性化

切平面方程右边只含 $x$ 、 $y$ 的一次项。把它看成一个新的函数，就得到 $f$ 在 $(a,b)$ 处的线性化：

L(x,y)=f(a,b)+f_x(a,b)(x-a)+f_y(a,b)(y-b).

当 $(x,y)$ 很接近 $(a,b)$ 时，可以用

f(x,y)\approx L(x,y)

来做近似计算。

曲面与切平面示意图，展示输入变化 Δx、Δy 如何通过线性化 L(x,y) 产生近似输出变化。

如果令

\Delta x=x-a,\qquad \Delta y=y-b,

线性化公式也可以写成

f(a+\Delta x,b+\Delta y)\approx f(a,b)+f_x(a,b)\Delta x+f_y(a,b)\Delta y.

这个写法更接近实际使用：从已知点出发，输入变化一点点，输出大约变化多少？

例题：用线性化近似函数值

用线性化近似

f(x,y)=\sqrt{xy+1}

在 $(2.98,5.04)$ 处的函数值。选择附近容易计算的点 $(3,5)$ 。

在基准点计算函数值：

f(3,5)=\sqrt{3\cdot5+1}=4.

求偏导数：

f_x(x,y)=\frac{y}{2\sqrt{xy+1}},\qquad f_y(x,y)=\frac{x}{2\sqrt{xy+1}}.

在 $(3,5)$ 处，

f_x(3,5)=\frac{5}{8},\qquad f_y(3,5)=\frac{3}{8}.

写出输入变化：

\Delta x=2.98-3=-0.02,\qquad \Delta y=5.04-5=0.04.

使用线性化：

f(2.98,5.04)\approx 4+\frac{5}{8}(-0.02)+\frac{3}{8}(0.04)=4.0025.

所以近似值是 $4.0025$ 。

误差为什么会变小

线性近似的依据不是“看起来差不多”，而是可微性带来的误差结构。若 $f$ 在 $(a,b)$ 可微，则

f(a+h,b+k)=f(a,b)+f_x(a,b)h+f_y(a,b)k+R(h,k),

并且余项满足

\frac{R(h,k)}{\sqrt{h^2+k^2}}\to 0 \quad \text{当}\quad (h,k)\to(0,0).

这句话的意思是：输入距离足够小时，剩下的误差比输入距离本身还要小一阶。曲面当然可能弯，但在足够小的观察窗口里，弯曲造成的误差会被压到更低层次。

三联图展示在点 P 附近逐步放大光滑曲面，曲率逐渐减弱，最后曲面近似为切平面。

线性近似的可靠范围不是固定的。曲面弯得越厉害，或者远离基准点越多，误差通常越明显。做近似时要同时说明“在哪个点线性化”和“输入变化有多小”。

全微分

线性化公式中的输入小变化常写成 $dx,dy$ ，输出的线性主部写成 $dz$ ：

dz=f_x(x,y)\,dx+f_y(x,y)\,dy.

这就是全微分。这里的 $dz$ 不是精确变化量的另一个名字，而是精确变化量 $\Delta z$ 的线性近似：

\Delta z=f(x+dx,y+dy)-f(x,y),

而

dz=f_x(x,y)\,dx+f_y(x,y)\,dy.

当 $dx,dy$ 很小时，常用 $dz$ 估计 $\Delta z$ 。

全微分用于测量误差估计的示意图，左侧为测量值 x、y 及误差 dx、dy，中间公式 dQ=f_x dx+f_y dy，右侧为估计输出误差 dQ。

全微分的读法

公式

dz=f_x\,dx+f_y\,dy

可以按“敏感度乘以变化量再相加”来读。 $f_x$ 表示 $z$ 对 $x$ 的敏感度， $dx$ 是 $x$ 的小变化； $f_y$ 表示 $z$ 对 $y$ 的敏感度， $dy$ 是 $y$ 的小变化。两个贡献相加，得到输出的线性估计。

全微分是切平面的增量形式。切平面给出高度近似，线性化给出函数近似，全微分给出变化量近似。它们是同一个局部线性思想的三种说法。

测量误差估计

实际测量中，我们往往不知道误差的正负，只知道输入误差的最大范围。若

|dx|\leq \epsilon_x,\qquad |dy|\leq \epsilon_y,

则常用

|\Delta z|\approx |dz|\leq |f_x(x,y)|\epsilon_x+|f_y(x,y)|\epsilon_y

估计输出误差的上界。这里使用绝对值，是因为两个输入误差可能同向放大输出，也可能互相抵消；做保守估计时不能假设抵消一定发生。

例题：圆柱体体积的误差

圆柱体体积为

V=\pi r^2h.

测得 $r=5$ 、 $h=12$ ，半径误差不超过 $0.02$ ，高度误差不超过 $0.05$ 。估计体积误差。

先求全微分：

dV=V_r\,dr+V_h\,dh=2\pi rh\,dr+\pi r^2\,dh.

做最大误差估计时取绝对值：

|dV|\leq 2\pi rh|dr|+\pi r^2|dh|.

代入 $r=5$ 、 $h=12$ 、 $|dr|\leq0.02$ 、 $|dh|\leq0.05$ ：

|dV|\leq 2\pi\cdot5\cdot12\cdot0.02+\pi\cdot25\cdot0.05=3.65\pi.

因此体积误差约不超过 $11.47$ 个体积单位。

原体积为

V=300\pi.

相对误差约为

\frac{3.65\pi}{300\pi}\approx 1.22\%.

可微性与偏导存在

切平面公式里出现了 $f_x(a,b)$ 和 $f_y(a,b)$ ，但只有这两个偏导数存在，还不能保证曲面真的有一个能代表所有方向的切平面。

真正需要的是可微性。对二元函数来说， $f$ 在 $(a,b)$ 可微，意思是存在一个线性主部

f_x(a,b)h+f_y(a,b)k

使得

f(a+h,b+k)-f(a,b)-f_x(a,b)h-f_y(a,b)k

比 $\sqrt{h^2+k^2}$ 更快趋近于 $0$ 。

双栏教学图，对比光滑曲面在点 P 有唯一切平面与尖点曲面在点 P 附近没有统一局部平面，说明偏导数存在也可能不可微。

一个常用判别条件

如果 $f_x$ 和 $f_y$ 不仅存在，而且在 $(a,b)$ 附近存在并在 $(a,b)$ 连续，那么 $f$ 在 $(a,b)$ 可微。

这个条件很常用，因为它容易检查。多数由多项式、指数、三角函数、对数函数通过基本运算组成的函数，只要定义域内没有分母为零、根号无意义等问题，偏导数连续的地方就可微。

偏导存在但不可微的例子

定义

f(x,y)= \begin{cases} \dfrac{xy}{\sqrt{x^2+y^2}}, & (x,y)\neq(0,0),\\ 0, & (x,y)=(0,0). \end{cases}

在原点，沿 $x$ 轴和 $y$ 轴都有 $f=0$ ，所以

f_x(0,0)=0,\qquad f_y(0,0)=0.

如果它在原点可微，线性主部就应为 $0$ 。但沿路径 $(t,t)$ ，

f(t,t)=\frac{t^2}{\sqrt{2t^2}}=\frac{|t|}{\sqrt2}.

输入距离是

\sqrt{t^2+t^2}=\sqrt2|t|.

于是

\frac{|f(t,t)-0|}{\sqrt{t^2+t^2}}=\frac{1}{2},

它没有趋向 $0$ 。所以这个函数在原点偏导数存在，但不可微，也就不能用一个切平面统一描述所有方向上的局部变化。

常见错误是看到 $f_x(a,b)$ 、 $f_y(a,b)$ 存在，就立刻写切平面。切平面代表的是所有足够小方向上的统一线性近似，不只是两个坐标方向上的切线。

练习

练习 1 求

f(x,y)=\ln(x+2y)

在 $(1,1)$ 处的切平面方程。

先算 $f(1,1)=\ln3$ 。偏导数为

f_x(x,y)=\frac{1}{x+2y},\qquad f_y(x,y)=\frac{2}{x+2y}.

所以

f_x(1,1)=\frac13,\qquad f_y(1,1)=\frac23.

切平面方程是

z=\ln3+\frac13(x-1)+\frac23(y-1).

练习 2 用线性化近似

\sqrt{x+2y}

在 $(6.1,4.95)$ 处的值。建议选基准点 $(6,5)$ 。

令 $f(x,y)=\sqrt{x+2y}$ 。在 $(6,5)$ 处，

f(6,5)=4.

偏导数为

f_x=\frac{1}{2\sqrt{x+2y}},\qquad f_y=\frac{1}{\sqrt{x+2y}}.

因此

f_x(6,5)=\frac18,\qquad f_y(6,5)=\frac14.

输入变化为 $\Delta x=0.1$ 、 $\Delta y=-0.05$ ，所以

f(6.1,4.95)\approx 4+\frac18(0.1)+\frac14(-0.05)=4.

这个近似结果刚好等于 $4$ ，因为一阶变化相互抵消。

练习 3 长方形面积 $A=xy$ 。测得 $x=30$ 、 $y=20$ ，并且 $|dx|\leq0.1$ 、 $|dy|\leq0.08$ 。估计面积误差的上界。

面积的全微分是

dA=y\,dx+x\,dy.

做最大误差估计：

|dA|\leq |y||dx|+|x||dy|.

代入数据：

|dA|\leq 20(0.1)+30(0.08)=4.4.

所以面积误差约不超过 $4.4$ 个面积单位。

练习 4 判断函数

f(x,y)=x^2y+e^{xy}

在 $(0,0)$ 是否可微，并写出切平面。

这个函数由多项式和指数函数复合而成，偏导数在整个平面连续，所以它在 $(0,0)$ 可微。

先算

f(0,0)=1.

偏导数为

f_x=2xy+ye^{xy},\qquad f_y=x^2+xe^{xy}.

在 $(0,0)$ 处，

f_x(0,0)=0,\qquad f_y(0,0)=0.

切平面方程为

z=1.

练习 5 判断下面说法是否正确：只要 $f_x(a,b)$ 和 $f_y(a,b)$ 都存在，曲面 $z=f(x,y)$ 在对应点就一定有切平面。

这个说法不正确。偏导数只检查两个坐标方向上的变化。切平面要求所有足够小方向上的变化都能被同一个线性函数近似。偏导存在但不可微的函数可以没有这样的统一切平面。

切平面、线性近似与全微分

二元函数曲面 z=f(x,y) 在点 P 附近由半透明切平面作局部近似的三维示意图。

切平面不是为了描述整张曲面，而是为了描述点附近的一小块。

从曲面的一小块开始

设二元函数 $z=f(x,y)$ 的图像是一张曲面。点 $(a,b)$ 在输入平面上，对应曲面上的点是

P=(a,b,f(a,b)).

这两个斜率给出了切平面在两个坐标方向上的倾斜程度。切平面要通过 $P$ ，并且沿 $x$ 方向的斜率等于 $f_x(a,b)$ ，沿 $y$ 方向的斜率等于 $f_y(a,b)$ 。

曲面在点 P 处由固定 y=b 与固定 x=a 的两条截线切线共同确定切平面。

切平面方程

在点 $(a,b)$ 处，如果 $f$ 可微，曲面 $z=f(x,y)$ 的切平面方程是

z=f(a,b)+f_x(a,b)(x-a)+f_y(a,b)(y-b).

这个公式可以直接从“平面的一般形式”看出来。一个通过 $(a,b,f(a,b))$ 的平面，如果沿 $x$ 方向斜率是 $A$ 、沿 $y$ 方向斜率是 $B$ ，就可以写成

z=f(a,b)+A(x-a)+B(y-b).

把 $A=f_x(a,b)$ 、 $B=f_y(a,b)$ 代入，就得到切平面公式。

例题：求切平面

求曲面

z=x^2+xy+2y^2

在点 $(1,-1)$ 上方的切平面方程。

先求曲面上的高度：

f(1,-1)=1^2+1\cdot(-1)+2(-1)^2=2.

所以切平面经过点 $(1,-1,2)$ 。

再求两个偏导数：

f_x(x,y)=2x+y,\qquad f_y(x,y)=x+4y.

在 $(1,-1)$ 处，

f_x(1,-1)=1,\qquad f_y(1,-1)=-3.

把点和两个斜率代入切平面公式：

z=2+1(x-1)-3(y+1).

化简得到

z=x-3y-2.

这个平面只在 $(1,-1)$ 附近可靠。离这个点越远，曲面的弯曲影响越明显，平面近似通常就越粗糙。

线性化

切平面方程右边只含 $x$ 、 $y$ 的一次项。把它看成一个新的函数，就得到 $f$ 在 $(a,b)$ 处的线性化：

L(x,y)=f(a,b)+f_x(a,b)(x-a)+f_y(a,b)(y-b).

当 $(x,y)$ 很接近 $(a,b)$ 时，可以用

f(x,y)\approx L(x,y)

来做近似计算。

曲面与切平面示意图，展示输入变化 Δx、Δy 如何通过线性化 L(x,y) 产生近似输出变化。

如果令

\Delta x=x-a,\qquad \Delta y=y-b,

线性化公式也可以写成

f(a+\Delta x,b+\Delta y)\approx f(a,b)+f_x(a,b)\Delta x+f_y(a,b)\Delta y.

这个写法更接近实际使用：从已知点出发，输入变化一点点，输出大约变化多少？

例题：用线性化近似函数值

用线性化近似

f(x,y)=\sqrt{xy+1}

在 $(2.98,5.04)$ 处的函数值。选择附近容易计算的点 $(3,5)$ 。

在基准点计算函数值：

f(3,5)=\sqrt{3\cdot5+1}=4.

求偏导数：

f_x(x,y)=\frac{y}{2\sqrt{xy+1}},\qquad f_y(x,y)=\frac{x}{2\sqrt{xy+1}}.

在 $(3,5)$ 处，

f_x(3,5)=\frac{5}{8},\qquad f_y(3,5)=\frac{3}{8}.

写出输入变化：

\Delta x=2.98-3=-0.02,\qquad \Delta y=5.04-5=0.04.

使用线性化：

f(2.98,5.04)\approx 4+\frac{5}{8}(-0.02)+\frac{3}{8}(0.04)=4.0025.

所以近似值是 $4.0025$ 。

误差为什么会变小

线性近似的依据不是“看起来差不多”，而是可微性带来的误差结构。若 $f$ 在 $(a,b)$ 可微，则

f(a+h,b+k)=f(a,b)+f_x(a,b)h+f_y(a,b)k+R(h,k),

并且余项满足

\frac{R(h,k)}{\sqrt{h^2+k^2}}\to 0 \quad \text{当}\quad (h,k)\to(0,0).

三联图展示在点 P 附近逐步放大光滑曲面，曲率逐渐减弱，最后曲面近似为切平面。

全微分

线性化公式中的输入小变化常写成 $dx,dy$ ，输出的线性主部写成 $dz$ ：

dz=f_x(x,y)\,dx+f_y(x,y)\,dy.

这就是全微分。这里的 $dz$ 不是精确变化量的另一个名字，而是精确变化量 $\Delta z$ 的线性近似：

\Delta z=f(x+dx,y+dy)-f(x,y),

而

dz=f_x(x,y)\,dx+f_y(x,y)\,dy.

当 $dx,dy$ 很小时，常用 $dz$ 估计 $\Delta z$ 。

全微分用于测量误差估计的示意图，左侧为测量值 x、y 及误差 dx、dy，中间公式 dQ=f_x dx+f_y dy，右侧为估计输出误差 dQ。

全微分的读法

公式

dz=f_x\,dx+f_y\,dy

全微分是切平面的增量形式。切平面给出高度近似，线性化给出函数近似，全微分给出变化量近似。它们是同一个局部线性思想的三种说法。

测量误差估计

实际测量中，我们往往不知道误差的正负，只知道输入误差的最大范围。若

|dx|\leq \epsilon_x,\qquad |dy|\leq \epsilon_y,

则常用

|\Delta z|\approx |dz|\leq |f_x(x,y)|\epsilon_x+|f_y(x,y)|\epsilon_y

估计输出误差的上界。这里使用绝对值，是因为两个输入误差可能同向放大输出，也可能互相抵消；做保守估计时不能假设抵消一定发生。

例题：圆柱体体积的误差

圆柱体体积为

V=\pi r^2h.

测得 $r=5$ 、 $h=12$ ，半径误差不超过 $0.02$ ，高度误差不超过 $0.05$ 。估计体积误差。

先求全微分：

dV=V_r\,dr+V_h\,dh=2\pi rh\,dr+\pi r^2\,dh.

做最大误差估计时取绝对值：

|dV|\leq 2\pi rh|dr|+\pi r^2|dh|.

代入 $r=5$ 、 $h=12$ 、 $|dr|\leq0.02$ 、 $|dh|\leq0.05$ ：

|dV|\leq 2\pi\cdot5\cdot12\cdot0.02+\pi\cdot25\cdot0.05=3.65\pi.

因此体积误差约不超过 $11.47$ 个体积单位。

原体积为

V=300\pi.

相对误差约为

\frac{3.65\pi}{300\pi}\approx 1.22\%.

可微性与偏导存在

切平面公式里出现了 $f_x(a,b)$ 和 $f_y(a,b)$ ，但只有这两个偏导数存在，还不能保证曲面真的有一个能代表所有方向的切平面。

真正需要的是可微性。对二元函数来说， $f$ 在 $(a,b)$ 可微，意思是存在一个线性主部

f_x(a,b)h+f_y(a,b)k

使得

f(a+h,b+k)-f(a,b)-f_x(a,b)h-f_y(a,b)k

比 $\sqrt{h^2+k^2}$ 更快趋近于 $0$ 。

双栏教学图，对比光滑曲面在点 P 有唯一切平面与尖点曲面在点 P 附近没有统一局部平面，说明偏导数存在也可能不可微。

一个常用判别条件

如果 $f_x$ 和 $f_y$ 不仅存在，而且在 $(a,b)$ 附近存在并在 $(a,b)$ 连续，那么 $f$ 在 $(a,b)$ 可微。

偏导存在但不可微的例子

定义

f(x,y)= \begin{cases} \dfrac{xy}{\sqrt{x^2+y^2}}, & (x,y)\neq(0,0),\\ 0, & (x,y)=(0,0). \end{cases}

在原点，沿 $x$ 轴和 $y$ 轴都有 $f=0$ ，所以

f_x(0,0)=0,\qquad f_y(0,0)=0.

如果它在原点可微，线性主部就应为 $0$ 。但沿路径 $(t,t)$ ，

f(t,t)=\frac{t^2}{\sqrt{2t^2}}=\frac{|t|}{\sqrt2}.

输入距离是

\sqrt{t^2+t^2}=\sqrt2|t|.

于是

\frac{|f(t,t)-0|}{\sqrt{t^2+t^2}}=\frac{1}{2},

它没有趋向 $0$ 。所以这个函数在原点偏导数存在，但不可微，也就不能用一个切平面统一描述所有方向上的局部变化。

常见错误是看到 $f_x(a,b)$ 、 $f_y(a,b)$ 存在，就立刻写切平面。切平面代表的是所有足够小方向上的统一线性近似，不只是两个坐标方向上的切线。

练习

练习 1 求

f(x,y)=\ln(x+2y)

在 $(1,1)$ 处的切平面方程。

先算 $f(1,1)=\ln3$ 。偏导数为

f_x(x,y)=\frac{1}{x+2y},\qquad f_y(x,y)=\frac{2}{x+2y}.

所以

f_x(1,1)=\frac13,\qquad f_y(1,1)=\frac23.

切平面方程是

z=\ln3+\frac13(x-1)+\frac23(y-1).

练习 2 用线性化近似

\sqrt{x+2y}

在 $(6.1,4.95)$ 处的值。建议选基准点 $(6,5)$ 。

令 $f(x,y)=\sqrt{x+2y}$ 。在 $(6,5)$ 处，

f(6,5)=4.

偏导数为

f_x=\frac{1}{2\sqrt{x+2y}},\qquad f_y=\frac{1}{\sqrt{x+2y}}.

因此

f_x(6,5)=\frac18,\qquad f_y(6,5)=\frac14.

输入变化为 $\Delta x=0.1$ 、 $\Delta y=-0.05$ ，所以

f(6.1,4.95)\approx 4+\frac18(0.1)+\frac14(-0.05)=4.

这个近似结果刚好等于 $4$ ，因为一阶变化相互抵消。

练习 3 长方形面积 $A=xy$ 。测得 $x=30$ 、 $y=20$ ，并且 $|dx|\leq0.1$ 、 $|dy|\leq0.08$ 。估计面积误差的上界。

面积的全微分是

dA=y\,dx+x\,dy.

做最大误差估计：

|dA|\leq |y||dx|+|x||dy|.

代入数据：

|dA|\leq 20(0.1)+30(0.08)=4.4.

所以面积误差约不超过 $4.4$ 个面积单位。

练习 4 判断函数

f(x,y)=x^2y+e^{xy}

在 $(0,0)$ 是否可微，并写出切平面。

这个函数由多项式和指数函数复合而成，偏导数在整个平面连续，所以它在 $(0,0)$ 可微。

先算

f(0,0)=1.

偏导数为

f_x=2xy+ye^{xy},\qquad f_y=x^2+xe^{xy}.

在 $(0,0)$ 处，

f_x(0,0)=0,\qquad f_y(0,0)=0.

切平面方程为

z=1.

练习 5 判断下面说法是否正确：只要 $f_x(a,b)$ 和 $f_y(a,b)$ 都存在，曲面 $z=f(x,y)$ 在对应点就一定有切平面。