深度学习篇---矩阵的魔法

张开发
2026/4/19 4:46:55 15 分钟阅读

分享文章

深度学习篇---矩阵的魔法
我们可以把乘以特殊矩阵想象成对一张图片或一个图形施加“魔法指令”——这些指令藏在矩阵里乘上坐标向量后图形就会按我们想要的方式变形。下面我会从二维平面2D开始介绍最后提一下三维3D。为了直观我们用列向量表示一个点变换后的新点为。1. 恒等矩阵什么都不做就像乘以1一样原封不动。占个位置后面有用。2. 缩放Scale——拉长或压扁sx2,sy1水平拉长一倍垂直不变。sx0.5,sy0.5整体缩小到一半。若 sxsy是均匀缩放像放大镜若不等叫非均匀缩放像把正方形变成长方形。3. 旋转Rotation——绕原点转动绕原点逆时针转 θ 角度例子θ90°cos⁡0,sin⁡1点 (1,0)→ (0,1)确实逆时针转90度。注意这是绕原点旋转。如果想绕任意点旋转需要先平移、再旋转、再平移回去见齐次坐标部分。4. 对称Reflection——镜像翻转对称可看作特殊缩放负系数。关于x轴对称上下翻转(x,y)→(x,−y)关于y轴对称左右翻转(x,y)→(−x,y)关于直线 yx 对称交换坐标(x,y)→(y,x)关于原点对称中心对称相当于旋转180°。5. 剪切Shear——让图形“倾斜”像把一副扑克牌推歪面积不变但形状变平行四边形。水平剪切y不变x随y线性增加x′xky,y′y垂直剪切x不变y随x线性增加x′x,y′kxy例子单位正方形 (0,0),(1,0),(1,1),(0,1)经水平剪切 k1k1 后变为 (0,0),(1,0),(2,1),(1,1)变成一个斜的四边形。6. 投影Projection——压扁到一条线或一个点投影到x轴y变为0投影到y轴投影到直线 yx会丢失垂直方向的信息7. 错切与拉伸的组合——仿射变换上面所有操作旋转、缩放、对称、剪切都是线性变换可以用2×2矩阵表示它们共同特点是保持原点不动、直线映射为直线。但现实中我们还需要平移移动位置。平移不是线性变换因为 0⃗ 必须映射到 0⃗于是引入齐次坐标把二维点 (x,y) 写为 (x,y,1)用3×3矩阵左上2×2做线性变换右边两列做平移。这样就能组合出任意仿射变换旋转平移 绕任意点旋转缩放平移 关于任意点缩放。8. 三维中的类似操作概念完全一样只是矩阵变成3×3线性或4×4仿射透视。缩放对角矩阵 diag(sx,sy,sz)旋转绕x、y、z轴各有旋转矩阵例如绕z轴旋转类似二维但z不变对称关于xy平面等z取负剪切例如 x′xky其他不变投影从3D投影到2D用于相机成像一个直观总结重要性质行列式行列式绝对值 面积2D或体积3D缩放倍数行列式为1 → 保面积旋转、剪切行列式为0 → 压扁到更低维投影正交矩阵如旋转、反射保持长度和角度不变逆矩阵 转置可逆性只要行列式不为0变换可逆可恢复原图实际应用小例子计算机图形学一个3D模型乘上模型矩阵缩放→旋转→平移放到世界再乘视图矩阵相机位置再乘投影矩阵透视变成屏幕2D。图像处理旋转照片、水平翻转自拍对称。机器人运动学每个关节的变换就是一个个矩阵相乘。数据增强机器学习随机对图片做剪切、旋转、缩放来增加训练样本。

更多文章