课程进度
1 / 12
下一节向量与线性组合
自在学
分类课程智能体订阅
分类课程AI导师价格
数学线性代数 I:向量、矩阵与线性变换线性代数研究什么:方程、向量与变换

线性代数研究什么:方程、向量与变换

线性代数研究的不是一堆孤立的矩阵规则,而是多变量问题里最基本的一类结构:几个量怎样同时满足条件,几个方向怎样合成目标,一个规则怎样把所有向量一起移动。

这一章先不追求计算技巧的数量。我们只抓住一件事:同一个线性问题可以有三种看法。它可以是方程组,可以是向量组合,也可以是矩阵给出的线性变换。后面整门课会反复在这三种看法之间切换。

线性代数三种视角汇合到同一个线性问题的课程全景地图

方程组、向量组合与矩阵变换从解、方向、规则三条主线汇合到同一个线性问题。


先认识“线性”

一个表达式是线性的,意思是未知数只以一次的形式出现,并且未知数之间不相乘、不开方、不放进三角函数或指数函数。

下面是线性表达式:

2x+3y−z2x + 3y - z2x+3y−z

下面不是线性表达式:

x2+y,xy+1,sin⁡x+yx^2 + y,\quad xy + 1,\quad \sin x + yx2+y,xy+1,sinx+y

在线性方程中,我们把线性表达式等于一个常数。例如:

2x+y=52x + y = 52x+y=5

如果有几个线性方程要同时满足,就得到线性方程组:

{2x+y=5x−y=1\begin{cases} 2x + y = 5 \\ x - y = 1 \end{cases}{2x+y=5x−y=1​

线性代数中的“线性”先从形状上看:未知数只出现一次,系数乘未知数,再相加。它的深层含义会在矩阵变换里出现:直线仍然变成直线,原点仍然留在原点,组合关系被保留下来。

表达式、方程和系统

这三个词常被混在一起,但它们说的是不同层次。

线性表达式是一个算式,例如 2x+y2x+y2x+y。线性方程是在表达式之间加上等号,例如 2x+y=52x+y=52x+y=5。线性系统是多个线性方程放在一起,要求同一组未知数同时满足它们。

用一句话说:表达式给出一个量,方程给出一个条件,系统给出一组条件。

不要把“线性”理解成“图像一定是一条二维直线”。二元一次方程在平面中是一条直线;三元一次方程在三维空间中是一个平面;更多未知数时,我们仍然用同一套代数语言描述它,只是图像不再容易直接画出来。


从两个未知数开始

考虑这个方程组:

{2x+y=5x−y=1\begin{cases} 2x + y = 5 \\ x - y = 1 \end{cases}{2x+y=5x−y=1​

它的答案是 x=2, y=1x=2,\ y=1x=2, y=1。这件事可以有三种解释。

行图像:两条直线的交点

第一个方程 2x+y=52x+y=52x+y=5 在坐标平面中是一条直线。第二个方程 x−y=1x-y=1x−y=1 也是一条直线。一个解必须同时在两条直线上,所以解就是两条直线的交点。

坐标平面上两条直线 2x + y = 5 与 x - y = 1 相交于点 (2,1),表示二元线性方程组的解。

二元线性方程组的行图像:两条直线的交点就是共同满足两个方程的解。

列图像:用列向量拼出右端

把同一个方程组按未知数分组:

x[21]+y[1−1]=[51]x \begin{bmatrix} 2 \\ 1 \end{bmatrix} + y \begin{bmatrix} 1 \\ -1 \end{bmatrix} = \begin{bmatrix} 5 \\ 1 \end{bmatrix}x[21​]+y[1−1​]=[51​]

这句话的意思是:取第一列向量 [21]\begin{bmatrix}2\\1\end{bmatrix}[21​] 的 xxx 倍,再加上第二列向量 [1−1]\begin{bmatrix}1\\-1\end{bmatrix}[1−1​] 的 yyy 倍,能不能得到右端向量 [51]\begin{bmatrix}5\\1\end{bmatrix}[51​]。

当 x=2, y=1x=2,\ y=1x=2, y=1 时:

2[21]+1[1−1]=[51]2 \begin{bmatrix} 2 \\ 1 \end{bmatrix} + 1 \begin{bmatrix} 1 \\ -1 \end{bmatrix} = \begin{bmatrix} 5 \\ 1 \end{bmatrix}2[21​]+1[1−1​]=[51​]

两根列向量经过缩放后相加,拼出右端目标向量 b 的示意图

列向量组合:x·第一列 + y·第二列 = 目标向量。

矩阵方程:把系统压缩成一行

把系数排成矩阵,把未知数排成向量,把右端常数也排成向量:

A=[211−1],x=[xy],b=[51]A = \begin{bmatrix} 2 & 1 \\ 1 & -1 \end{bmatrix}, \quad \mathbf{x} = \begin{bmatrix} x \\ y \end{bmatrix}, \quad \mathbf{b} = \begin{bmatrix} 5 \\ 1 \end{bmatrix}A=[21​1−1​],x=[xy​],b=[51​]

原来的方程组就写成:

Ax=bA\mathbf{x}=\mathbf{b}Ax=b

这一行不是把细节藏起来,而是把结构显出来:矩阵 AAA 记录所有系数,未知向量 x\mathbf{x}x 记录要找的数,右端向量 b\mathbf{b}b 记录目标。

例题:把同一个系统翻译三遍

题目:对方程组

{2x+y=5x−y=1\begin{cases} 2x + y = 5 \\ x - y = 1 \end{cases}{2x+y=5x−y=1​

分别写出它的解、列向量组合形式和矩阵方程形式。

先从第二个方程得到 y=x−1y=x-1y=x−1,再代入第一个方程,得到 2x+x−1=52x+x-1=52x+x−1=5,所以 3x=63x=63x=6,从而 x=2x=2x=2。

把 x=2x=2x=2 代回 y=x−1y=x-1y=x−1,得到 y=1y=1y=1。所以方程组的解是 (2,1)(2,1)(2,1)。

按未知数分组,得到列向量组合:

x[21]+y[1−1]=[51]x \begin{bmatrix} 2 \\ 1 \end{bmatrix} + y \begin{bmatrix} 1 \\ -1 \end{bmatrix} = \begin{bmatrix} 5 \\ 1 \end{bmatrix}x[21​]+y[1−1​]=[51​]

把系数放入矩阵,得到矩阵方程:

[211−1][xy]=[51]\begin{bmatrix} 2 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 5 \\ 1 \end{bmatrix}[21​1−1​][xy​]=[51​]

这三个写法描述的是同一个问题。


三个未知数时发生了什么

二元方程组能画成两条直线。三元方程组的每个方程通常对应三维空间中的一个平面。

看这个系统:

{x+y+z=6x+2y+z=82x+y+3z=13\begin{cases} x + y + z = 6 \\ x + 2y + z = 8 \\ 2x + y + 3z = 13 \end{cases}⎩⎨⎧​x+y+z=6x+2y+z=82x+y+3z=13​

它的共同解是:

(x,y,z)=(1,2,3)(x,y,z)=(1,2,3)(x,y,z)=(1,2,3)

几何上,这表示三个平面在同一个点相交。代数上,这表示同一组三个数同时满足三个条件。列向量上,这表示三个列向量按 1,2,31,2,31,2,3 的比例组合后,正好得到右端向量。

三个半透明平面在三维坐标中交于共同解 (1,2,3)

三元线性方程组的三个平面交于一点,表示三个条件同时满足。

例题:用消去看共同解

题目:求解方程组

{x+y+z=6x+2y+z=82x+y+3z=13\begin{cases} x + y + z = 6 \\ x + 2y + z = 8 \\ 2x + y + 3z = 13 \end{cases}⎩⎨⎧​x+y+z=6x+2y+z=82x+y+3z=13​

用第二个方程减去第一个方程,得到 y=2y=2y=2。这一步把两个条件的差别单独拿出来看。

把 y=2y=2y=2 代入第一个方程,得到 x+z=4x+z=4x+z=4。这说明 xxx 和 zzz 还要一起满足一个条件。

把 y=2y=2y=2 代入第三个方程,得到 2x+3z=112x+3z=112x+3z=11。

由 x+z=4x+z=4x+z=4 得到 x=4−zx=4-zx=4−z,代入 2x+3z=112x+3z=112x+3z=11,得到 2(4−z)+3z=112(4-z)+3z=112(4−z)+3z=11,所以 z=3z=3z=3,再得到 x=1x=1x=1。

因此共同解是 (1,2,3)(1,2,3)(1,2,3)。它不是只满足其中一个平面,而是同时落在三个平面上。

方程组的解可以理解为“所有条件的共同位置”。二元时常见的是直线交点,三元时常见的是平面交点;更高维时仍然是共同位置,只是我们更多依靠代数和矩阵语言来处理。


矩阵、向量与线性变换

矩阵不只是系数表。它还可以看成一个规则:输入一个向量,输出另一个向量。

例如:

A=[211−1]A = \begin{bmatrix} 2 & 1 \\ 1 & -1 \end{bmatrix}A=[21​1−1​]

给定输入向量 v=[xy]\mathbf{v}=\begin{bmatrix}x\\y\end{bmatrix}v=[xy​],矩阵会输出:

Av=[211−1][xy]=[2x+yx−y]A\mathbf{v} = \begin{bmatrix} 2 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 2x+y \\ x-y \end{bmatrix}Av=[21​1−1​][xy​]=[2x+yx−y​]

这正好就是前面方程组左边的两个表达式。于是 Ax=bA\mathbf{x}=\mathbf{b}Ax=b 可以读成:有没有一个输入向量 x\mathbf{x}x,经过矩阵 AAA 的规则后,变成目标向量 b\mathbf{b}b?

线性代数教学图:输入向量经过写有“矩阵”的转换框后,方格纸被拉伸旋转成输出向量,直线和原点保持不变。

矩阵可以看作一台线性变换机器,把输入向量映射为输出向量,并保持直线与原点。

基向量的去向决定矩阵

二维空间里有两根最基本的方向:

e1=[10],e2=[01]\mathbf{e}_1 = \begin{bmatrix} 1 \\ 0 \end{bmatrix}, \quad \mathbf{e}_2 = \begin{bmatrix} 0 \\ 1 \end{bmatrix}e1​=[10​],e2​=[01​]

矩阵 AAA 会把它们送到:

Ae1=[21],Ae2=[1−1]A\mathbf{e}_1 = \begin{bmatrix} 2 \\ 1 \end{bmatrix}, \quad A\mathbf{e}_2 = \begin{bmatrix} 1 \\ -1 \end{bmatrix}Ae1​=[21​],Ae2​=[1−1​]

这两个输出正是矩阵的两列。知道两根基向量被送到哪里,就知道所有向量会被送到哪里,因为任意输入向量都可以写成:

v=xe1+ye2\mathbf{v}=x\mathbf{e}_1+y\mathbf{e}_2v=xe1​+ye2​

线性变换会保留这种组合:

Av=A(xe1+ye2)=xAe1+yAe2A\mathbf{v} = A(x\mathbf{e}_1+y\mathbf{e}_2) = xA\mathbf{e}_1+yA\mathbf{e}_2Av=A(xe1​+ye2​)=xAe1​+yAe2​

线性与非线性的边界

线性变换有两个基本特征:

T(u+v)=T(u)+T(v)T(\mathbf{u}+\mathbf{v})=T(\mathbf{u})+T(\mathbf{v})T(u+v)=T(u)+T(v) T(cv)=cT(v)T(c\mathbf{v})=cT(\mathbf{v})T(cv)=cT(v)

第一条说“先相加再变换”和“先变换再相加”结果相同。第二条说“先缩放再变换”和“先变换再缩放”结果相同。它们合起来说明:线性变换尊重向量组合。

线性与非线性变换对比示意图

线性变换保持直线为直线,非线性变换使网格被弯曲。

并不是所有“看起来有规则”的变换都是线性的。平移会把原点移走,所以不是线性变换;平方会弯曲网格,也不是线性变换。线性代数先研究这类保留组合关系的规则,再用它们近似或分解更复杂的问题。


三种视角怎样互相翻译

现在把前面的内容放在一张语言对照表里。你不需要立刻熟练使用所有词,只要知道它们是在说同一件事。

视角关心的问题常见写法图像直觉
方程组哪些未知数同时满足条件Ax=bA\mathbf{x}=\mathbf{b}Ax=b直线、平面或更高维条件的共同位置
向量组合右端向量能否由列向量拼出x1a1+⋯+xnan=bx_1\mathbf{a}_1+\cdots+x_n\mathbf{a}_n=\mathbf{b}x1​a1​+⋯+xn​an​=b用几个方向合成目标
线性变换输入向量经过矩阵后到哪里x↦Ax\mathbf{x}\mapsto A\mathbf{x}x↦Ax整个空间按同一规则移动

一个系统的三种读法

还是这个矩阵方程:

[211−1][xy]=[51]\begin{bmatrix} 2 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 5 \\ 1 \end{bmatrix}[21​1−1​][xy​]=[51​]

按方程组读,它是在问两条直线在哪里相交。按向量组合读,它是在问用两根列向量能不能拼出右端向量。按线性变换读,它是在问哪个输入向量会被矩阵送到目标位置。

这三个问题的答案是同一个:

[xy]=[21]\begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 2 \\ 1 \end{bmatrix}[xy​]=[21​]

线性代数为什么有用

许多真实问题不是一开始就长得像矩阵。它们往往先表现为一组关系:某路口车流守恒,某张图像可以分成像素块,某组数据要拟合一条趋势,某个产业部门的产出依赖其他部门的投入。

当这些关系可以近似写成“系数乘变量再相加”时,线性代数就可以进入问题。

线性模型连接交通流、图像压缩、数据拟合、经济投入产出四个应用面板

真实应用拼图展示线性模型在交通流、图像压缩、数据拟合和经济投入产出中的作用。

几个典型入口

交通流问题常把每条路的车流量看成未知数,路口的“流入等于流出”给出线性方程。图像处理把像素排成向量或矩阵,压缩和降噪常用矩阵分解。数据拟合把误差最小的问题变成投影问题。经济投入产出模型用矩阵描述行业之间的依赖关系。

这些例子不会在本章展开计算。现在要记住的是:线性代数提供的是一种翻译方式。它把多个变量之间的关系翻译成向量、矩阵和变换,然后用统一的方法研究解、方向和结构。

本课程后面会不断回到这一章的三句话:方程组关注“满足哪些条件”,向量组合关注“能拼出哪些目标”,线性变换关注“规则怎样移动空间”。只要这三句话在脑中连着,许多矩阵公式就不会显得孤立。


练习

练习一:判断是否线性

判断下面哪些是线性表达式。

3x−2y+7z,x2+y,4x−y,xy+z3x-2y+7z,\quad x^2+y,\quad 4x-y,\quad xy+z3x−2y+7z,x2+y,4x−y,xy+z

线性表达式是 3x−2y+7z3x-2y+7z3x−2y+7z 和 4x−y4x-y4x−y。x2+yx^2+yx2+y 中有平方项,xy+zxy+zxy+z 中有未知数相乘,所以它们不是线性的。

练习二:从方程组到矩阵方程

把下面的方程组写成 Ax=bA\mathbf{x}=\mathbf{b}Ax=b。

{x+3y=72x−y=0\begin{cases} x + 3y = 7 \\ 2x - y = 0 \end{cases}{x+3y=72x−y=0​

系数矩阵、未知向量和右端向量分别是:

A=[132−1],x=[xy],b=[70]A= \begin{bmatrix} 1 & 3 \\ 2 & -1 \end{bmatrix}, \quad \mathbf{x}= \begin{bmatrix} x \\ y \end{bmatrix}, \quad \mathbf{b}= \begin{bmatrix} 7 \\ 0 \end{bmatrix}A=[12​3−1​],x=[xy​],b=[70​]

所以矩阵方程是:

[132−1][xy]=[70]\begin{bmatrix} 1 & 3 \\ 2 & -1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 7 \\ 0 \end{bmatrix}[12​3−1​][xy​]=[70​]

练习三:解释列向量组合

解释下面等式的含义,并找出它对应的方程组。

x[12]+y[3−1]=[70]x \begin{bmatrix} 1 \\ 2 \end{bmatrix} + y \begin{bmatrix} 3 \\ -1 \end{bmatrix} = \begin{bmatrix} 7 \\ 0 \end{bmatrix}x[12​]+y[3−1​]=[70​]

这个等式表示:用第一列向量的 xxx 倍加上第二列向量的 yyy 倍,得到右端向量。按分量展开,得到方程组:

{x+3y=72x−y=0\begin{cases} x + 3y = 7 \\ 2x - y = 0 \end{cases}{x+3y=72x−y=0​

练习四:读出基向量的去向

设

A=[0213]A= \begin{bmatrix} 0 & 2 \\ 1 & 3 \end{bmatrix}A=[01​23​]

求 Ae1A\mathbf{e}_1Ae1​ 和 Ae2A\mathbf{e}_2Ae2​,并说明它们和矩阵的列有什么关系。

因为 e1=[10]\mathbf{e}_1=\begin{bmatrix}1\\0\end{bmatrix}e1​=[10​],所以 Ae1A\mathbf{e}_1Ae1​ 取出矩阵第一列:

Ae1=[01]A\mathbf{e}_1= \begin{bmatrix} 0 \\ 1 \end{bmatrix}Ae1​=[01​]

因为 e2=[01]\mathbf{e}_2=\begin{bmatrix}0\\1\end{bmatrix}e2​=[01​],所以 Ae2A\mathbf{e}_2Ae2​ 取出矩阵第二列:

Ae2=[23]A\mathbf{e}_2= \begin{bmatrix} 2 \\ 3 \end{bmatrix}Ae2​=[23​]

矩阵的每一列就是对应基向量经过这个矩阵后的新位置。

练习五:三种视角说同一句话

对矩阵方程

[1002][xy]=[34]\begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 3 \\ 4 \end{bmatrix}[10​02​][xy​]=[34​]

分别用方程组、向量组合和线性变换三种语言解释它。

方程组语言:它表示 x=3x=3x=3 和 2y=42y=42y=4 要同时成立,所以解是 x=3, y=2x=3,\ y=2x=3, y=2。

向量组合语言:它表示用 xxx 个 [10]\begin{bmatrix}1\\0\end{bmatrix}[10​] 和 yyy 个 [02]\begin{bmatrix}0\\2\end{bmatrix}[02​] 拼出 [34]\begin{bmatrix}3\\4\end{bmatrix}[34​]。

线性变换语言:矩阵保持第一坐标不变,把第二坐标放大为原来的 2 倍;我们要找哪个输入向量会被送到 [34]\begin{bmatrix}3\\4\end{bmatrix}[34​],答案是 [32]\begin{bmatrix}3\\2\end{bmatrix}[32​]。


小结

本章只建立一张地图。线性方程组给出条件,向量组合给出拼法,矩阵变换给出规则。三者不是三套互不相关的知识,而是同一件事的三种读法。

下一章会从向量开始,把“加法、数乘、线性组合、张成”讲清楚。那时你会更具体地看到:列向量到底能拼出哪些目标,不能拼出哪些目标。

  • 先认识“线性”
    • 表达式、方程和系统
  • 从两个未知数开始
    • 行图像:两条直线的交点
    • 列图像:用列向量拼出右端
    • 矩阵方程:把系统压缩成一行
    • 例题:把同一个系统翻译三遍
  • 三个未知数时发生了什么
    • 例题:用消去看共同解
  • 矩阵、向量与线性变换
    • 基向量的去向决定矩阵
    • 线性与非线性的边界
  • 三种视角怎样互相翻译
    • 一个系统的三种读法
  • 线性代数为什么有用
    • 几个典型入口
  • 练习
    • 练习一:判断是否线性
    • 练习二:从方程组到矩阵方程
    • 练习三:解释列向量组合
    • 练习四:读出基向量的去向
    • 练习五:三种视角说同一句话
  • 小结

目录

  • 先认识“线性”
    • 表达式、方程和系统
  • 从两个未知数开始
    • 行图像:两条直线的交点
    • 列图像:用列向量拼出右端
    • 矩阵方程:把系统压缩成一行
    • 例题:把同一个系统翻译三遍
  • 三个未知数时发生了什么
    • 例题:用消去看共同解
  • 矩阵、向量与线性变换
    • 基向量的去向决定矩阵
    • 线性与非线性的边界
  • 三种视角怎样互相翻译
    • 一个系统的三种读法
  • 线性代数为什么有用
    • 几个典型入口
  • 练习
    • 练习一:判断是否线性
    • 练习二:从方程组到矩阵方程
    • 练习三:解释列向量组合
    • 练习四:读出基向量的去向
    • 练习五:三种视角说同一句话
  • 小结
自在学

© 2025 - 2026 自在学,保留所有权利。

公网安备湘公网安备43020302000292号 | 湘ICP备2025148919号-1

关于我们隐私政策使用条款

© 2025 自在学,保留所有权利。

公网安备湘公网安备43020302000292号湘ICP备2025148919号-1