符号回归在超快磁动力学研究中的应用:从数据中挖掘物理规律 1. 项目概述当机器学习遇见超快磁动力学在自旋电子学这个前沿领域我们一直在与时间赛跑。从纳秒级的磁畴翻转到飞秒级的超快退磁理解磁性材料在不同时间尺度下的行为是设计下一代高速、高密度存储器和逻辑器件的物理基石。然而当过程快到以飞秒10^-15秒计时时传统的基于第一性原理或宏观唯象方程的物理建模方法常常会陷入困境。方程变得极其复杂涉及的微观参数多如牛毛而实验数据却往往稀少且昂贵。这就像试图用一张模糊的、只有几个像素点的照片去还原一个高速运动的复杂机械的内部齿轮是如何咬合的。近年来我和团队将目光投向了机器学习。这并非要取代物理而是希望借助其强大的模式识别和函数拟合能力在物理学家“知其然”有实验数据但“难知其所以然”难以建立简洁普适的解析模型的领域充当一个“超级辅助”。我们选择了一个经典的难题镍Ni及其经典合金镍铁Ni80Fe20又称坡莫合金的超快退磁过程。核心目标是利用机器学习特别是符号回归这种能输出“人类可读”数学公式的方法从有限的实验数据中挖掘出描述超快退磁时间τ_M与一个更易测量的宏观参数——吉尔伯特阻尼因子α——之间的内在联系。α描述的是磁化矢量在 GHz 频率下进动衰减的快慢属于“快”动力学范畴而τ_M描述的是飞秒激光激发后磁化强度暴跌的过程属于“超快”动力学范畴。建立这两者的关联就等于在“快”与“超快”两个世界之间架起了一座桥梁能直接指向背后的微观物理机制究竟是自旋翻转散射主导还是自旋输运效应更关键2. 核心思路与物理背景拆解2.1 问题本质连接两个时间尺度的钥匙要理解我们工作的价值得先明白τ_M和α为何如此重要以及连接它们为何困难。吉尔伯特阻尼因子α它来自描述磁化矢量M运动的朗道-利夫希茨-吉尔伯特LLG方程。你可以把它想象成描述一个陀螺在空气中旋转时受到的空气阻力系数。α越大陀螺停下来得越快。在磁性材料中这个“阻力”来源于各种耗散过程如磁振子散射、电子-声子耦合等。α可以通过铁磁共振等相对常规的实验手段测得它表征的是纳秒到皮秒尺度的“快”磁弛豫。超快退磁时间τ_M当一束飞秒激光脉冲轰击磁性薄膜其能量在极短时间内几十到几百飞秒沉积到电子系统导致磁化强度发生猝灭式的下降这个过程就是超快退磁。τ_M就是这个下降过程的时间常数。测量它需要超快泵浦-探测技术如时间分辨的磁光克尔效应实验门槛高数据点自然就少。物理上的直觉是无论是α代表的“慢”耗散还是τ_M代表的“快”猝灭最终都需要角动量从自旋系统转移到晶格。因此它们很可能共享某些相同的微观散射通道。如果找到了τ_M与α之间的数学关系我们就能推断是哪种微观机制在超快过程中唱主角。2.2 传统物理模型的困境与启示在我们动手之前已有不少理论工作试图推导τ_M(α)的关系这为我们提供了宝贵的“物理描述符”候选集。回顾这些模型也是理解我们机器学习输入特征的过程Koopmans 模型 (2005)基于 Elliot-Yafet 自旋翻转机制将τ_M与α通过居里温度T_C联系起来τ_M ∝ 1/(T_C * α)。这个模型暗示了τ_M与α成反比支持自旋输运为主导机制的观点。Koopmans 的电子模型从单电子在交换场中的运动出发得到τ_M ∝ 1/(H_ex * α)其中H_ex是交换场。这同样是一个反比关系。Fähnle 模型 (2010)提出了更复杂的“呼吸费米面”模型考虑了电子态对自旋轨道耦合变化的敏感性F_el和自旋混合度p_b^2得到τ_M ∝ M / (F_el * p_b^2 * α)。这个模型指出τ_M与α成正比指向自旋翻转散射的主导地位。可以看到不同的物理图像和近似导出了截然不同的数学形式正比 vs 反比并且引入了T_C, H_ex, M, F_el, p_b^2等一系列材料参数。这正反映了超快退磁问题的复杂性多参数耦合微观机制竞争。这也正是机器学习可以大显身手的地方——我们不预设具体的函数形式而是让算法从数据中自行发现最稳健的关联模式。注意这里的关键在于我们并非将机器学习当作一个“黑箱”预测工具。相反我们是将这些物理模型提供的参数T_C, H_ex, M, γ, g, μ_B等作为机器学习的“输入特征”让算法去评估哪些特征真正重要以及它们之间以何种数学形式组合最能预测τ_M。这是一种“物理信息嵌入”的机器学习思路。3. 方法论监督学习与符号回归的双重奏我们的技术路线分为并行的两步第一步是用常规的监督学习算法做“性能基准测试”看看传统机器学习方法预测τ_M的能力如何第二步也是更关键的一步是使用符号回归来“解读物理”。3.1 数据准备与特征工程数据是机器学习的燃料。我们从已发表的文献中精心收集了镍Ni和坡莫合金Ni80Fe20的τ_M和α的实验数据其中Ni有27个数据点坡莫合金有22个数据点。这个数据量在凝聚态物理实验中已属难得但对于很多数据饥渴的机器学习模型来说仍然是个小样本。输入特征描述符我们构建了一个包含11个物理量的特征池它们全部来源于前述的物理模型核心参数吉尔伯特阻尼因子 α这是我们探索关联的核心。材料基本常数居里温度 T_C饱和磁化强度 M交换场 H_ex朗德因子 g玻尔磁子 μ_B旋磁比 γ。微观理论参数F_el电子态对自旋轨道耦合的敏感度p_b^2自旋混合度。基本物理常数约化普朗克常数 ħ玻尔兹曼常数 k_B。关键考量α本身是一个与实验条件如激光通量、薄膜厚度相关的量。因此将α作为主要输入特征某种意义上已经隐含了对这些复杂实验条件的考虑。我们的目标是找到超越这些具体实验条件、反映材料本征物理的τ_M-α关系。3.2 监督学习建立预测基准我们首先采用了80/20的比例随机划分训练集和测试集在Ni和坡莫合金的混合数据上测试了四种经典的监督学习回归算法多项式回归尝试了1到10阶寻找最佳拟合复杂度。K近邻基于特征空间中的最近邻样本进行预测。决策树基于特征阈值构建树状结构进行决策。支持向量机寻找在高维特征空间中最大化间隔的超平面。评估指标我们使用均方根误差RMSE、平均绝对误差MAE和决定系数R²来全面衡量模型性能。结果速览如表1所示二阶多项式回归和KNN算法表现最佳其R²值高达0.9996和0.9894预测误差最小。这说明在给定的特征空间内τ_M与这些参数之间存在着可以被很好捕捉的可能是非线性的关系。决策树和SVM表现稍逊可能由于数据量较小容易过拟合或难以找到最优核函数。表1不同监督学习算法的误差指标对比算法RMSEMAER²多项式回归 (2阶)1.06030.84530.9996K近邻5.52924.17990.9894决策树9.01116.60000.9718支持向量机19.280013.2200.8710实操心得在小样本物理数据上简单模型如低阶多项式往往比复杂模型如深度神经网络表现更稳健。复杂模型参数多容易记住数据中的噪声而非普适规律导致在未知数据上泛化能力差。从多项式回归的优秀表现来看τ_M与特征之间的关系很可能是一个光滑、连续的函数。然而监督学习模型有一个致命缺点它们是“黑箱”。即使多项式回归给出了一个拟合公式其系数的物理意义也是模糊的。我们无法从中直接解读出“τ_M和α到底是正比还是反比”这一核心物理问题。这就需要符号回归登场。3.3 符号回归从数据中挖掘物理公式符号回归的目标不是找一个高精度的预测函数而是找一个简洁、可解释、且物理单位正确的数学表达式。我们采用了VS-SISSO这一先进算法。SISSO全称“确定独立筛选与稀疏算子”。它的工作流程很巧妙特征构造从初始的11个基本物理量初级描述符出发通过允许的数学运算符我们这里只用了乘法和除法进行组合生成一个极其庞大的“候选描述符”空间。例如会生成像 α, T_C, α/T_C, T_C^2/α, M*α 等成千上万个组合。确定独立筛选快速地从海量候选描述符中筛选出与目标量τ_M相关性最强的一小部分。稀疏算子优化在筛选出的描述符子集中通过压缩感知等稀疏优化技术找到那个能用最少项、最准确地拟合数据的描述符或描述符组合。VS即“变量选择”是SISSO的一个迭代增强版本。它在每一轮筛选后会重新评估和选择变量避免陷入局部最优从而更稳定地找到全局最优的简洁表达式。我们的设置我们将最大描述符复杂度设为7即公式中最多包含7次运算符操作描述符维度设为1即最终模型只包含一个表达式项没有相加的多项式截距设为0我们希望公式具有明确的物理比例关系。算法目标是从那11个物理量及其乘除组合中自动找出一个形如τ_M f(物理量)的最优公式。4. 核心发现符号回归揭示的物理图景4.1 分材料训练指向统一的简单关系我们首先分别对镍和坡莫合金的数据进行VS-SISSO训练。结果令人惊讶地一致且简洁对于镍 (Ni)算法找到的最优公式是τ_M c1 * α对于坡莫合金 (Ni80Fe20)算法找到的最优公式同样是τ_M c2 * α其中c1和c2是两个不同的常数。这意味着在各自材料的数据集内超快退磁时间τ_M与吉尔伯特阻尼因子α呈直接的正比例关系。算法自动“忽略”了特征池中其他所有常数或变量只挑选了α。这强烈暗示对于同一种材料在α变化的实验条件下如不同厚度、不同激光通量τ_M的变化主要由α决定且两者线性相关。物理意义τ_M ∝ α 这一关系与前述的Fähnle“呼吸费米面”模型定性一致。它支持自旋翻转散射是超快退磁过程中的主导微观机制。在这种图像下激光激发产生的热电子通过自旋翻转散射损失其自旋角动量这个散射速率同时影响了快尺度α和超快尺度τ_M的弛豫使它们成正比。4.2 跨材料统一模型引入材料本征参数分材料模型很美但它无法解释为什么镍和坡莫合金的τ_M不同即常数c1和c2为何不同。为了得到一个能适用于不同材料的普适模型我们将镍和坡莫合金的所有数据合并重新交给VS-SISSO。算法给出了一个更复杂的表达式τ_M c1 * (T_C^6 * g^3) / (γ * M) * α这个公式的物理量纲是正确的最终单位是时间。但它包含了一个高次项T_C^6这可能会放大居里温度的测量或计算误差导致预测不稳定。为了获得一个更稳健且物理上更直观的模型我们进行了一次“单位校正”的启发式操作注意到T_C^6 / g^3 的量纲与温度的六次方相同我们尝试引入另一个特征温度——德拜温度T_D来平衡。德拜温度与晶格振动特性相关在许多磁性理论中与T_C一同出现。经过调整我们得到了最终的统一预测模型τ_M c * (T_C^6 * g^3) / (T_D^6 * γ * M) * α其中c是一个普适常数。这个模型虽然RMSE17.36 fs略高于前一个复杂模型12.68 fs但其预测趋势与实验符合得相当好见图3b并且具有清晰的物理意义超快退磁时间正比于阻尼因子α同时反比于饱和磁化强度M和旋磁比γ并强烈依赖于材料的居里温度与德拜温度之比的六次方。4.3 模型验证与物理讨论一个模型的好坏不仅要看对训练数据的拟合更要看其预测能力和物理一致性。预测验证我们使用未参与训练的独立实验数据对模型进行了测试。对于α ≈ 0.012的坡莫合金实验测得τ_M ≈ 225 fs我们的模型预测为265 fs。对于α ≈ 0.00901的坡莫合金实验τ_M ≈ 200 fs模型预测为198.8 fs。对于α ≈ 0.038的镍实验τ_M ≈ 150 fs模型预测为213 fs。考虑到超快磁光学测量本身的误差范围通常在10%-20%这些预测结果可以说是相当令人鼓舞的证明了模型的泛化能力。物理一致性检验模型成功复现了一个重要的实验观察趋势坡莫合金的τ_M通常比镍的更长。我们的模型将其归因于(T_C^6)/(T_D^6 * M)这一项。坡莫合金的T_C远高于镍且其T_D与镍相差不大而M值相近。因此T_C^6的巨大差异使得该项在坡莫合金中更大从而导致其τ_M更长这与实验定性相符。核心结论机器学习特别是符号回归不仅给出了一个预测公式更重要的是它从数据中“投票”选择出了τ_M ∝ α这一核心关系。这为“自旋翻转散射是镍及坡莫合金中超快退磁的主导机制”这一物理图像提供了强有力的数据驱动证据。它弥合了不同时间尺度磁动力学之间的鸿沟表明吉尔伯特阻尼这个“慢”过程的参数竟然蕴含着理解飞秒尺度“超快”过程的关键信息。5. 经验总结与未来展望回顾整个项目从物理问题定义到机器学习实现有几个关键点值得与大家分享1. 物理直觉引导特征工程我们并没有盲目地将所有能想到的参数扔给机器。我们的特征池完全由已有的物理理论模型所定义。这确保了算法探索的数学空间在物理上是“合理”的最终发现的公式也更容易被物理社区理解和接受。这是将机器学习应用于科学发现区别于纯工程预测的核心。2. 小样本下的算法选择在实验物理领域高质量数据通常很少。我们的工作表明对于小样本问题符号回归如SISSO和简单的线性/多项式模型往往比复杂的深度学习模型更有效、更可解释。复杂模型容易过拟合而符号回归直接搜索解析式其复杂度通过运算符数量限制天然具有正则化效果。3. 符号回归的“调参”哲学VS-SISSO中的“最大复杂度”、“允许运算符”等设置本质上是一种基于物理知识的“先验约束”。我们只允许乘除运算是因为我们预期τ_M与这些参数是幂律关系如同许多物理公式一样。如果我们允许加减运算可能会得到完全不同的、物理意义不明的表达式。这要求研究者对问题有深刻理解。4. 模型的可解释性与验证缺一不可我们得到了一个简洁的公式这很棒。但更重要的是我们用独立的外部实验数据验证了它并检查了其预测的物理趋势如不同材料间τ_M的大小关系是否合理。只有当模型同时通过“数值预测”和“物理直觉”这两道关卡时我们才能更有信心地接受其揭示的规律。未来可以深入的方向拓展材料体系将这种方法应用到更广泛的磁性材料中如钴、铁、赫斯勒合金、甚至反铁磁材料检验τ_M ∝ α 这一关系是否普适或者会发现新的标度律。融入更多维度数据除了静态材料参数是否可以引入动态的实验条件参数如激光波长、脉冲宽度作为特征建立更全面的预测模型与微观计算结合将符号回归发现的公式与第一性原理计算得到的微观参数如费米面处的自旋翻转几率联系起来实现从电子结构层次对公式进行“第一性原理验证”。指导实验设计这个模型可以反过来用于指导实验。例如为了获得特定的超快退磁速率τ_M我们可以通过理论计算或初步实验寻找具有合适α、T_C、M组合的材料体系从而加速新型超快自旋电子器件的材料研发。这项工作对我个人的启发是在凝聚态物理这类传统基础学科中机器学习并非颠覆者而是一把强大的新“镊子”和“显微镜”。它帮助我们从复杂、嘈杂、有限的数据中夹取出那些最本质的关联放大那些曾被复杂方程掩盖的简单规律。当符号回归算法从一堆参数中坚定地只选出α并画出一条通过原点的直线时那种数据自身“开口说话”、揭示物理本质的感觉正是计算驱动科学发现中最令人兴奋的时刻。