以数为骨,绘光成影:从数学理论的不断融入看计算机图形学的发展史 计算机图形学Computer Graphics的本质是人类试图在虚拟的数字空间中重建甚至超越真实世界的视觉体验。如果说显示器上的像素是这幅画卷的颜料那么计算机硬件就是画笔而数学则是支撑这一切的骨架与法则。回顾计算机图形学的发展史就是一部数学分支不断被引入、消化并转化为视觉奇观的历史。从最基础的代数与几何到复杂的积分方程、概率论再到如今的微分几何与拓扑学数学的深度直接决定了图形学的边界。一、拓荒时代的基石线性代数与解析几何的视觉化20世纪60—70年代早期的计算机图形学面临的首要问题是如何在二维的屏幕上表示和操作二维或三维的物体这个时期的核心数学工具是解析几何与线性代数。1963年Ivan Sutherland 提出了著名的 Sketchpad 系统标志着交互式计算机图形学的诞生。在这个阶段点、线、多边形被抽象为坐标系中的向量。为了让物体能够平移、旋转和缩放数学家和工程师们引入了齐次坐标Homogeneous Coordinates。通过将三维向量v(x,y,z)v (x, y, z)v(x,y,z)扩展为四维向量(x,y,z,1)(x, y, z, 1)(x,y,z,1)所有的基本几何变换都可以统一为矩阵乘法v′M⋅vv M \cdot vv′M⋅v这里的关键在于齐次坐标的引入使得表达能力从仿射变换Affine Transformation——包括平移、旋转和缩放——扩展到了射影变换Projective Transformation从而将透视投影也纳入了同一个矩阵运算的框架。仿射变换保持平行线的平行性而透视投影则不保持——远处的铁轨在视觉上终将交于一点。正是齐次坐标和射影几何的引入让这两类性质截然不同的变换得以用统一的4×44 \times 44×4矩阵来表达成为了现代图形学管线Graphics Pipeline的绝对基石。线性代数让计算机懂得了如何放置和观察物体。二、勾勒曲面的优雅逼近论与参数化几何的登场20世纪60—80年代当图形学试图从简单的多边形网格跨越到平滑的工业产品如汽车、飞机外壳时由平面多边形拼接的粗糙表面显得捉襟见肘。数学界关于插值与逼近论的研究被迅速引入。早在1959年雪铁龙公司的数学家Paul de Casteljau就独立发展了用多项式曲线逼近自由曲面的方法并给出了著名的 de Casteljau 递推算法。然而由于商业保密他的工作长期未能公开发表。几乎同期法国雷诺汽车公司的工程师Pierre Bézier独立地引入了伯恩斯坦多项式于1960年代初提出了后来以他命名的贝塞尔曲线Bézier Curve并率先公开发表。通过几个控制点就能生成完美的平滑曲线其数学表达式将离散的点转化为了连续的参数方程B(t)∑i0n(ni)(1−t)n−i,ti,Pi,0≤t≤1B(t) \sum_{i0}^{n} \binom{n}{i} (1-t)^{n-i} , t^{i} , P_i, \quad 0 \le t \le 1B(t)i0∑n​(in​)(1−t)n−i,ti,Pi​,0≤t≤1随后为了解决高阶贝塞尔曲线控制困难的问题**B样条B-Spline**在70年代得到系统发展其后 **非均匀有理B样条NURBS**进一步统一了自由曲线/曲面与圆锥曲线的表示。逼近论和参数化几何的融入让计算机第一次真正拥有了描绘极致平滑与精确曲率的能力。这不仅催生了早期的3D建模与CAD软件更彻底改变了现代工业设计的面貌。三、追寻光影的极致积分方程与概率论的交响20世纪80—90年代有了形状接下来就是光。如何模拟光线在物体表面的反射、折射和漫反射早期的局部光照模型如 Phong 模型只是简单的经验公式。直到1986年James Kajiya 将辐射传输理论Radiative Transfer Theory中的**辐射度量学Radiometry**概念系统性地引入图形学提出了图形学历史上最著名的公式——渲染方程The Rendering EquationLo(x,ωo)Le(x,ωo)∫Ωfr(x,ωi,ωo),Li(x,ωi),(ωi⋅n),dωiL_o(x, \omega_o) L_e(x, \omega_o) \int_{\Omega} f_r(x, \omega_i, \omega_o) , L_i(x, \omega_i) , (\omega_i \cdot n) , d\omega_iLo​(x,ωo​)Le​(x,ωo​)∫Ω​fr​(x,ωi​,ωo​),Li​(x,ωi​),(ωi​⋅n),dωi​这个方程完美地描述了全局光照Global Illumination的物理本质某一点沿某一方向的出射辐射亮度等于该点自身的发射项加上来自半球所有方向的入射光经 BRDF 加权积分的结果。由于场景中每一个点的入射辐射LiL_iLi​又依赖其他表面点的出射辐射LoL_oLo​该方程具有递归结构可以改写为第二类 Fredholm 积分方程的形式解析解几乎不存在。为了数值求解这个高维积分图形学界开始大量借用概率论与统计学中的蒙特卡洛积分Monte Carlo Integration。其核心思想是通过随机采样来估算积分值∫f(x),dx≈1N∑i1Nf(Xi)p(Xi)\int f(x) , dx \approx \frac{1}{N} \sum_{i1}^{N} \frac{f(X_i)}{p(X_i)}∫f(x),dx≈N1​i1∑N​p(Xi​)f(Xi​)​**路径追踪Path Tracing**由此诞生。方差分析、重要性采样Importance Sampling、低偏差序列Low-Discrepancy Sequence等统计学工具成为了渲染工程师的日常武器。数学的引入不仅让画面达到了照片级真实Photorealism更让图形学具备了物理上的严谨性。四、让万物灵动微分方程与数值分析的狂欢20世纪90年代至今静态的画面已经足够真实但世界是运动的。水流的飞溅、布料的飘动、头发的动态模拟这些物理仿真的背后是常微分方程ODE和偏微分方程PDE。为了模拟流体图形学引入了流体力学中的Navier-Stokes 方程∂u∂t(u⋅∇)u−1ρ∇pν∇2uf\frac{\partial \mathbf{u}}{\partial t} (\mathbf{u} \cdot \nabla)\mathbf{u} -\frac{1}{\rho}\nabla p \nu \nabla^2 \mathbf{u} \mathbf{f}∂t∂u​(u⋅∇)u−ρ1​∇pν∇2uf为了让计算机能在有限的时间内解出流体、弹性体的运动数值分析成为了核心工具。欧拉方法、龙格-库塔法Runge-Kutta、有限元方法FEM、共轭梯度法Conjugate Gradient等数学方法被广泛应用。值得一提的是物质点法Material Point Method, MPM。该方法最初由 Sulsky、Chen 和 Schreyer 于1994年在计算力学领域提出是一种混合拉格朗日-欧拉视角的离散化方法。2013年迪士尼研究院的 Stomakhin 等人将 MPM引入计算机图形学成功模拟了雪的复杂力学行为直接服务于电影《冰雪奇缘》中那令人惊叹的雪景特效。此后MPM 在图形学社区中被不断改进和拓展成为模拟各种复杂材料泥浆、沙子、熔岩等的利器。而在流体模拟领域Weta Digital 等工业视效公司也发展了基于 FLIP/APIC 等方法的大规模水体模拟技术在《阿凡达水之道》等影片中呈现了磅礴的水体效果。五、当代的前沿调和分析、离散微分几何与数据驱动的融合21世纪10年代至今进入现代图形学对数学的利用愈发高深同时也与数据驱动方法深度交融。信号处理与调和分析。为了实时渲染复杂的光照环境球谐函数Spherical Harmonics,Ylm(θ,ϕ)Y_l^m(\theta, \phi)Ylm​(θ,ϕ)和傅里叶分析被引入图形学。其核心思想是将定义在球面上的光照信号展开为一组正交基函数的线性组合从而将高维的光照积分转化为频域中少量系数的点积运算极大地降低了实时全局光照的计算代价。预计算辐射传输Precomputed Radiance Transfer, PRT正是这一思路的经典应用。离散微分几何Discrete Differential Geometry, DDG。传统微分几何研究光滑曲面上的曲率、测地线、极小曲面等概念而图形学中的几何体通常以离散的三角形网格存在。DDG 将连续的微分几何概念——如高斯曲率、平均曲率、拉普拉斯-贝尔特拉米算子——严谨地推广到离散网格上为曲面参数化、网格简化、曲面光顺、测地距离计算等问题提供了坚实的理论基础。部分工作甚至涉及代数拓扑中的同调论和霍奇分解Hodge Decomposition将拓扑不变量用于网格分析和向量场设计。可微渲染与神经场景表示。近年来**神经辐射场Neural Radiance Fields, NeRF**的出现引发了三维视觉表示的革命。NeRF 将三维场景表示为一个由多层感知机MLP拟合的高维连续函数FΘ:(x,d)→(c,σ)F_\Theta : (\mathbf{x}, \mathbf{d}) \to (\mathbf{c}, \sigma)FΘ​:(x,d)→(c,σ)其中x\mathbf{x}x为空间位置d\mathbf{d}d为观察方向c\mathbf{c}c为颜色σ\sigmaσ为体密度。场景的重建被转化为一个关于网络参数Θ\ThetaΘ的高维非凸优化问题核心工具包括随机梯度下降SGD、自动微分Automatic Differentiation以及位置编码Positional Encoding中的傅里叶特征映射。在 NeRF 之后**3D 高斯泼溅3D Gaussian Splatting, 3DGS**于2023年提出了另一条路线用大量各向异性三维高斯函数显式地表示场景并通过可微光栅化Differentiable Rasterization进行端到端优化在保持高质量渲染的同时实现了实时帧率。**可微渲染Differentiable Rendering**作为连接几何、光学与优化的桥梁正在成为图形学与机器学习交叉领域最活跃的方向之一。六、站在巨人的肩膀下当代学习者的使命与路径一个自然的问题浮现在每一位当代学习者面前面对这座由几代人的智慧垒成的巍峨高山我们该如何起步答案或许并不复杂却需要极大的诚实与耐心——从零学起逐层消化不留空洞。没有捷径的地基:图形学的知识结构是一座严格的金字塔。任何试图跳过底层数学、直接调用上层API或框架的学习路径都将不可避免地在某个时间某个深度遭遇不可逾越的瓶颈。工具的便捷从来不能替代理解的深度。每一个伟大的数学工具都有它被提出时的历史语境和局限性。只有当你真正消化了它的推导过程和适用边界你才有能力判断在当下这个新的问题面前它是否仍然是最好的选择还是需要被修正、推广乃至被全新的数学工具所替代。消化的终点不是复述而是-----创造。结语纵观计算机图形学的发展我们可以清晰地看到一条主线视觉表达的每一次飞跃都伴随着一门或多门数学分支的深度融入。最初图形学借用线性代数和射影几何来进行空间表示与变换接着逼近论和参数化几何赋予了计算机描绘平滑曲面的能力再后来积分方程和蒙特卡洛方法让光影达到了物理级别的真实随后微分方程和数值分析让虚拟世界动了起来而今调和分析、离散微分几何与高维优化正在与数据驱动方法深度融合去探索那些人类肉眼甚至无法直观想象的高维空间与隐式表达。图形学的历史就是一部将抽象数学符号转化为具象视觉盛宴的浪漫史。在代码与像素的背后永远闪烁着数学理性的光辉。