多变量链式法则与隐函数求导

上一章用切平面和全微分描述了函数在一点附近怎样变化。本章处理更常见的一种情况：变量不是独立站在原地，而是互相牵连。时间一变，位置变；位置一变，温度、高度、成本或约束量也跟着变。多变量链式法则回答的就是这个问题：变化沿着依赖关系传到最后，应该怎样相加。

这里有两条主线。第一条是显式复合，例如 $z=f(x(t),y(t))$ 或 $z=f(x(u,v),y(u,v))$ 。第二条是隐式关系，例如 $F(x,y)=0$ 或 $F(x,y,z)=0$ ，其中某个变量并没有被直接写成函数，但它仍然被方程约束着变化。

时间参数 t 的变化分别传递到 x(t) 和 y(t)，再汇入曲面 z=f(x,y) 上的运动点，旁边标出多变量链式法则公式。

参数变化沿路径传递，并通过偏导数组合成 $z$ 对 $t$ 的变化率。

本章的核心习惯是先画清变量依赖，再写导数公式。公式里的每一项都对应一条从起点变量走到目标变量的路径；如果图上有两条路径，结果通常就有两项，不能凭感觉省略。

一条路径上的复合函数

先看最容易抓住的一种复合关系：

z=f(x,y), \quad x=x(t), \quad y=y(t)

这时 $t$ 不是直接进入 $f$ ，而是先改变 $x$ 和 $y$ ，再通过 $f$ 改变 $z$ 。如果 $t$ 增加一点点， $x$ 的小变化约为 $dx=x'(t)dt$ ， $y$ 的小变化约为 $dy=y'(t)dt$ 。上一章的全微分告诉我们：

dz \approx f_x(x,y)\,dx+f_y(x,y)\,dy

把 $dx$ 和 $dy$ 换成由 $t$ 引起的变化，就得到一条路径上的链式法则：

\frac{dz}{dt} = \frac{\partial f}{\partial x}\frac{dx}{dt} + \frac{\partial f}{\partial y}\frac{dy}{dt}

右边的两个部分含义不同。 $f_x$ 和 $f_y$ 描述外层函数对坐标变化的敏感程度； $dx/dt$ 和 $dy/dt$ 描述路径本身怎样移动。链式法则把“外层敏感程度”和“内层移动速度”配对相乘，再把不同通道的贡献相加。

例题：沿圆形路径测高度变化

设

z=f(x,y)=x^2+3xy-y^2

而

x(t)=\cos t, \quad y(t)=\sin t

求 $t=\pi/3$ 时 $dz/dt$ 。

先计算外层偏导数。因为 $f(x,y)=x^2+3xy-y^2$ ，所以 $f_x=2x+3y$ ， $f_y=3x-2y$ 。

再计算内层导数。由 $x(t)=\cos t$ 得 $dx/dt=-\sin t$ ，由 $y(t)=\sin t$ 得 $dy/dt=\cos t$ 。

在 $t=\pi/3$ 处， $x=1/2$ ， $y=\sqrt{3}/2$ ，所以 $f_x=1+3\sqrt{3}/2$ ， $f_y=3/2-\sqrt{3}$ 。

代入链式法则：

\frac{dz}{dt} = \left(1+\frac{3\sqrt{3}}{2}\right)\left(-\frac{\sqrt{3}}{2}\right) + \left(\frac{3}{2}-\sqrt{3}\right)\left(\frac{1}{2}\right) = -\frac{3}{2}-\sqrt{3}

这就是沿这条路径经过该点时，高度对时间的瞬时变化率。

这里求的是 $dz/dt$ ，不是 $f_x$ 或 $f_y$ 。偏导数把另一个坐标暂时固定；沿路径运动时， $x$ 和 $y$ 通常同时变，所以必须把两个通道都算进去。

用依赖图写出所有路径

当变量依赖关系变多时，最容易犯的错不是算错偏导，而是漏掉路径。依赖图能把链式法则变成一件机械但可靠的事。

多变量链式法则依赖图，展示 u 到 z 的两条路径贡献相加得到偏导公式。

依赖图就是链式法则的路线图：沿所有从 $u$ 到 $z$ 的路径贡献相加。

如果

z=f(x,y), \quad x=x(u,v), \quad y=y(u,v)

那么 $u$ 可以通过两条路线影响 $z$ ：

u \to x \to z, \quad u \to y \to z

所以

\frac{\partial z}{\partial u} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial u} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial u}

同理， $v$ 对 $z$ 的影响也沿两条路线相加：

\frac{\partial z}{\partial v} = \frac{\partial z}{\partial x}\frac{\partial x}{\partial v} + \frac{\partial z}{\partial y}\frac{\partial y}{\partial v}

路径法的写法

写复杂链式法则时，可以按下面的顺序做：

把目标变量放在图的上方，把最底层自变量放在图的下方，中间变量放在中间。

只要一个变量直接依赖另一个变量，就画一条箭头。例如 $x=x(u,v)$ 意味着从 $u$ 到 $x$ 、从 $v$ 到 $x$ 各有一条箭头。

要求某个底层变量对目标变量的导数时，列出从这个底层变量到目标变量的所有路径。

每条路径上把箭头对应的导数相乘，不同路径之间相加。

路径法的好处是它不依赖记忆。你可以先不急着写公式，只沿图走路：一条路给一项，路上的箭头相乘，几条路相加。

例题：两个底层变量同时进入

设

z=x^2y+\sin y, \quad x=u^2+v, \quad y=e^u-v^2

求 $\partial z/\partial u$ 。

先写出依赖关系。 $u$ 影响 $x$ ，也影响 $y$ ； $x$ 和 $y$ 又一起影响 $z$ 。所以 $\partial z/\partial u$ 有两条路径。

计算外层偏导：

z_x=2xy, \quad z_y=x^2+\cos y

计算内层偏导：

x_u=2u, \quad y_u=e^u

按路径相加：

\frac{\partial z}{\partial u} = z_xx_u+z_yy_u = 2xy(2u)+(x^2+\cos y)e^u

最后如有需要，再把 $x=u^2+v$ 、 $y=e^u-v^2$ 代回去。

矩阵形式：Jacobian 的乘法顺序

依赖图适合看清路径。变量很多时，Jacobian 矩阵更紧凑。设

g(s,t)=(x(s,t),y(s,t),z(s,t))

又设

F(x,y,z)=(p(x,y,z),q(x,y,z))

复合函数是 $F(g(s,t))$ 。它的导数矩阵满足：

D(F\circ g)(s,t)=DF(g(s,t))\,Dg(s,t)

注意顺序：外层函数的导数矩阵在左，内层函数的导数矩阵在右。维度也会提醒我们这一点：

\begin{bmatrix} p_s & p_t \\ q_s & q_t \end{bmatrix} = \begin{bmatrix} p_x & p_y & p_z \\ q_x & q_y & q_z \end{bmatrix} \begin{bmatrix} x_s & x_t \\ y_s & y_t \\ z_s & z_t \end{bmatrix}

雅可比矩阵形式的多变量链式法则示意图，展示从输入向量到复合输出以及外层、内层导数矩阵的相乘顺序。

维度对齐决定雅可比矩阵的相乘顺序：外层导数矩阵乘以内层导数矩阵，顺序不能反。

矩阵乘法中的每个元素，其实仍然是“路径贡献相加”。例如第一行第一列是

p_s=p_xx_s+p_yy_s+p_zz_s

这和依赖图里从 $s$ 到 $p$ 的所有路径完全一致。

Jacobian 形式不是新的法则，而是把许多链式法则同时写在一个矩阵里。检查它时先看维度：如果矩阵尺寸无法相乘，变量顺序或外内层顺序一定有问题。

隐函数求导：方程保持不变

有些关系不是 $y=f(x)$ ，而是写成一个方程：

F(x,y)=0

如果在某个区域内可以把 $y$ 看成 $x$ 的函数，也就是 $y=y(x)$ ，那么方程沿曲线恒成立：

F(x,y(x))=0

两边对 $x$ 求导，右边仍是 $0$ 。左边用链式法则：

F_x+F_y\frac{dy}{dx}=0

当 $F_y\ne 0$ 时，

\frac{dy}{dx} = - \frac{F_x}{F_y}

二维隐函数等值线 F(x,y)=0 在点 P 附近的切线、曲线斜率 dy/dx 与垂直于等值线的梯度 ∇F 示意图。

隐函数曲线 $F(x,y)=0$ 上，梯度 $\nabla F$ 与等值线垂直，由 $F_x+F_y y'=0$ 得到局部斜率关系。

这个公式可以用等值线理解。 $F(x,y)=0$ 是一条等值线，梯度 $\nabla F=(F_x,F_y)$ 垂直于等值线。曲线切向量可以写成 $(1,y')$ ，它必须和梯度垂直，所以

F_x+F_y y'=0

这正是上面的隐函数求导公式。

例题：由圆锥曲线求斜率

设曲线由

F(x,y)=x^2+xy+y^2-3=0

确定。求点 $(1,1)$ 处的 $dy/dx$ 。

先确认点在曲线上： $1^2+1\cdot 1+1^2-3=0$ ，所以可以在该点讨论曲线斜率。

计算偏导数：

F_x=2x+y, \quad F_y=x+2y

在 $(1,1)$ 处， $F_x=3$ ， $F_y=3$ 。由于 $F_y\ne 0$ ，可以把附近曲线看成 $y$ 关于 $x$ 的函数。

代入隐函数求导公式：

\frac{dy}{dx} = - \frac{F_x}{F_y} = -1

因此曲线在 $(1,1)$ 处的切线斜率是 $-1$ 。

公式 $dy/dx=-F_x/F_y$ 有条件。若 $F_y=0$ ，不能直接把 $y$ 看成 $x$ 的普通函数；此时可能要改求 $dx/dy$ ，或者单独分析局部形状。

三维约束中的偏导数

隐函数求导在三维中同样常见。设

F(x,y,z)=0

如果在某点附近可以把 $z$ 看成 $x,y$ 的函数，即 $z=z(x,y)$ ，那么

F(x,y,z(x,y))=0

对 $x$ 求偏导时， $y$ 固定， $z$ 会随 $x$ 变：

F_x+F_z z_x=0

所以

z_x=-\frac{F_x}{F_z}

同理，对 $y$ 求偏导时， $x$ 固定：

z_y=-\frac{F_y}{F_z}

三维约束曲面 F(x,y,z)=0 上点 P 处沿 x、y 方向移动时 z 的变化，标出 z_x=-F_x/F_z 与 z_y=-F_y/F_z。

由隐式约束 $F(x,y,z)=0$ 推导 $z=z(x,y)$ 的偏导数示意图。

例题：由约束曲面求偏导

设

F(x,y,z)=x^2+y^2+z^2+xyz-8=0

在点 $(1,2,1)$ 附近把 $z$ 看成 $x,y$ 的函数，求 $z_x$ 和 $z_y$ 。

先检查点是否在曲面上： $1^2+2^2+1^2+1\cdot2\cdot1-8=0$ ，所以这个点确实在约束曲面上。

计算三个偏导数：

F_x=2x+yz,\quad F_y=2y+xz,\quad F_z=2z+xy

在 $(1,2,1)$ 处， $F_x=4$ ， $F_y=5$ ， $F_z=4$ 。由于 $F_z\ne 0$ ，可以在该点附近把 $z$ 看成 $x,y$ 的函数。

代入三维隐函数求导公式：

z_x=-\frac{4}{4}=-1,\quad z_y=-\frac{5}{4}

这个例题先检查了点是否在约束上。隐函数题最容易把“给了一个点”直接当成“点在曲面上”，但导数是在曲面或曲线上讨论的；点若不满足约束，后面的切线、切平面和偏导数都没有落脚处。

在 $F(x,y,z)=0$ 中求 $z_x$ 时，不能只写 $-F_x$ 。因为 $z$ 对 $x$ 的变化还要乘上 $F_z$ ，正确公式是 $z_x=-F_x/F_z$ ，并且需要 $F_z\ne 0$ 。

参数曲面和约束曲线中的导数

链式法则也常出现在参数化对象中。假设空间曲线由

\mathbf r(t)=(x(t),y(t),z(t))

给出，而温度场是

T=T(x,y,z)

沿曲线运动时，温度变化率为

\frac{dT}{dt} = T_x\frac{dx}{dt} + T_y\frac{dy}{dt} + T_z\frac{dz}{dt}

这可以看成三维版本的一条路径链式法则。以后学习方向导数和梯度时，会把它写得更紧凑：

\frac{dT}{dt} = \nabla T\cdot \mathbf r'(t)

本章先保留展开形式，因为展开形式更容易看出每个坐标通道的贡献。

如果曲线同时受约束，例如 $F(x,y,z)=0$ ，那么 $\mathbf r(t)$ 沿曲面运动时还满足

F(x(t),y(t),z(t))=0

对 $t$ 求导得到

F_xx'(t)+F_yy'(t)+F_zz'(t)=0

这说明曲线的速度向量 $(x'(t),y'(t),z'(t))$ 与梯度 $(F_x,F_y,F_z)$ 垂直。也就是说，梯度是约束曲面的法向量，沿曲面运动的速度必须落在切平面里。

常见误区和检查方法

三栏教学警示图，总结多变量链式法则与隐函数求导中漏掉路径、偏导和全导混用、隐函数求导少除以 F_z 的常见错误。

常见误区：漏掉依赖路径、混用偏导与全导，以及隐函数求导时忘记除以 $F_z$ 。

误区一：只看见一条路径

在 $z=f(x(u,v),y(u,v))$ 中， $u$ 同时影响 $x$ 和 $y$ 。如果只写 $z_xx_u$ ，就默认 $u$ 不影响 $y$ ；这通常和题意矛盾。

误区二：把偏导和全导混在一起

$\partial z/\partial x$ 的意思是只让 $x$ 变、暂时固定其他独立变量。 $dz/dt$ 的意思是沿着一条路径，让所有依赖于 $t$ 的量一起变。符号不同，问题也不同。

误区三：隐函数求导前不检查条件

用 $dy/dx=-F_x/F_y$ 前，需要曲线点满足 $F(x,y)=0$ ，还需要 $F_y\ne 0$ 。用 $z_x=-F_x/F_z$ 前，需要点满足 $F(x,y,z)=0$ ，还需要 $F_z\ne 0$ 。

做题时可以用三问自检：目标变量是谁？起点变量是谁？从起点到目标一共有几条路径？这三问回答清楚，链式法则通常已经写出大半。

练习

练习一

设 $z=x^2+y^2$ ， $x=t^2$ ， $y=\sin t$ 。求 $dz/dt$ 。

由链式法则，

\frac{dz}{dt}=2x\frac{dx}{dt}+2y\frac{dy}{dt}

其中 $dx/dt=2t$ ， $dy/dt=\cos t$ ，所以

\frac{dz}{dt}=2(t^2)(2t)+2\sin t\cos t=4t^3+2\sin t\cos t

练习二

设 $w=e^{xy}$ ， $x=u+v$ ， $y=u-v$ 。求 $\partial w/\partial u$ 。

$w_x=ye^{xy}$ ， $w_y=xe^{xy}$ ，且 $x_u=1$ ， $y_u=1$ 。因此

\frac{\partial w}{\partial u} = w_xx_u+w_yy_u = (x+y)e^{xy}

代回 $x=u+v$ 、 $y=u-v$ ，得到

\frac{\partial w}{\partial u} = 2u\,e^{u^2-v^2}

练习三

设 $z=f(x,y)$ ， $x=r\cos\theta$ ， $y=r\sin\theta$ 。写出 $\partial z/\partial r$ 和 $\partial z/\partial \theta$ 。

按两条路径相加：

\frac{\partial z}{\partial r} = f_x\cos\theta+f_y\sin\theta

并且

\frac{\partial z}{\partial \theta} = f_x(-r\sin\theta)+f_y(r\cos\theta)

这里的 $f_x$ 、 $f_y$ 要在 $(x,y)=(r\cos\theta,r\sin\theta)$ 处取值。

练习四

曲线由 $F(x,y)=x^3+y^3-6xy=0$ 给出。求 $dy/dx$ 的一般表达式。

先求偏导：

F_x=3x^2-6y,\quad F_y=3y^2-6x

若 $F_y\ne 0$ ，则

\frac{dy}{dx} = - \frac{F_x}{F_y} = - \frac{3x^2-6y}{3y^2-6x} = \frac{2y-x^2}{y^2-2x}

练习五

设 $F(x,y,z)=x^2+y^2+z^2-3xyz=0$ 。在满足 $F_z\ne 0$ 的点附近，把 $z$ 看成 $x,y$ 的函数。写出 $z_x$ 和 $z_y$ 。

有

F_x=2x-3yz,\quad F_y=2y-3xz,\quad F_z=2z-3xy

所以

z_x=-\frac{2x-3yz}{2z-3xy},\quad z_y=-\frac{2y-3xz}{2z-3xy}

这些表达式只在 $F_z\ne 0$ 且点在约束曲面上时可用。

练习六

设 $q=f(a,b,c)$ ，其中 $a=a(s,t)$ ， $b=b(t)$ ， $c=c(s)$ 。写出 $\partial q/\partial s$ 和 $\partial q/\partial t$ 。

$s$ 通过 $a$ 和 $c$ 影响 $q$ ，不通过 $b$ 影响 $q$ ，所以

\frac{\partial q}{\partial s} = f_a a_s+f_c c_s

$t$ 通过 $a$ 和 $b$ 影响 $q$ ，不通过 $c$ 影响 $q$ ，所以

\frac{\partial q}{\partial t} = f_a a_t+f_b b_t

练习七

设 $T(x,y,z)=x^2+y z$ ，曲线 $\mathbf r(t)=(t,\cos t,\sin t)$ 。求沿曲线的 $dT/dt$ 。

$T_x=2x$ ， $T_y=z$ ， $T_z=y$ 。又 $x'=1$ ， $y'=-\sin t$ ， $z'=\cos t$ 。因此

\frac{dT}{dt} = 2x\cdot1+z(-\sin t)+y(\cos t)

代入 $x=t$ ， $y=\cos t$ ， $z=\sin t$ ：

\frac{dT}{dt} = 2t-\sin^2 t+\cos^2 t = 2t+\cos(2t)

练习八

有人在 $F(x,y,z)=0$ 中求 $z_x$ ，写出 $z_x=-F_x$ 。请指出少了什么，并写出正确条件和公式。

少了 $F_z$ 这一项。因为对 $x$ 求偏导时 $z=z(x,y)$ 也随 $x$ 变，所以

F_x+F_z z_x=0

若点满足 $F(x,y,z)=0$ 且 $F_z\ne 0$ ，则

z_x=-\frac{F_x}{F_z}