1. 项目概述与核心挑战在资产管理行业无论是养老基金、财富顾问还是对冲基金核心任务都是预测资产未来回报并据此构建最优投资组合。近年来机器学习模型特别是神经网络凭借其捕捉金融数据中复杂非线性关系的能力在这一领域取得了显著成功。它们被广泛用于预测资产回报、估计协方差矩阵并最终服务于经典的均值-方差投资组合优化框架。然而当前业界和学术界普遍存在一个被忽视的“盲点”我们通常将机器学习模型的预测结果当作一个确定的“点估计”来使用仿佛这个预测值就是未来回报的真实期望完全忽略了预测本身所固有的不确定性。这其实是一个相当危险的简化。想象一下你是一位基金经理模型告诉你某只股票下个月的预期超额回报是5%。但如果这个预测的95%置信区间是[-10% 20%]那么“5%”这个点估计所蕴含的信息就完全不同了。忽略这种不确定性就好比在迷雾中高速驾驶却只相信导航给出的一个精确坐标而不考虑定位误差的范围。在投资组合理论中参数不确定性尤其是期望收益的不确定性对最终配置权重有着巨大影响。经典的文献早已指出考虑这种不确定性会导致与标准均值-方差模型截然不同的经济洞见例如资产权重可能对预期收益的估计误差非常敏感。因此本项目的核心目标就是为机器学习特别是神经网络的资产回报预测构建一个可靠的“预测置信区间”并将这种不确定性量化地融入到投资组合构建的决策过程中。这不是一个纯理论的计量经济学练习而是一个具有直接实操价值的风险管理工具。它旨在回答两个关键问题第一我们的预测到底有多准第二在知道预测不准的可能性后我们应该如何更稳健地配置资产2. 机器学习预测不确定性的量化原理要构建预测置信区间首先必须理解机器学习预测误差的来源与结构。我们不能简单地套用传统计量经济学中为线性回归模型推导标准误的方法因为机器学习模型尤其是神经网络的估计过程没有解析解且金融数据具有独特的复杂性。2.1 理解预测误差的根源因子模型视角我们从一个更基础的资产定价模型出发来理解问题。假设资产i在t时刻的超额回报 y_{i,t} 可以由一个条件因子模型描述y_{i,t} α_{i,t-1} β_{i,t-1} f_t u_{i,t}其中α 代表资产的特异性收益Alphaβ 代表资产对一系列风险因子 f_t 的暴露Betau 是特质性误差。关键假设在于资产在 t-1 时刻的可观测特征 x_{i,t-1}如动量、市值、波动率等能够预测其未来的 Alpha 和 Beta即存在函数 g_α 和 g_β使得 α_{i,t-1} g_α(x_{i,t-1}) β_{i,t-1} g_β(x_{i,t-1})。在这个设定下如果我们进一步假设风险因子的价格 λ_f E[f_t] 是常数那么资产的预期超额回报可以写为E[y_{i,t} | x_{i,t-1}] g_α(x_{i,t-1}) g_β(x_{i,t-1}) λ_f我们将其定义为函数 g(x_{i,t-1})。这正是机器学习模型试图从数据中学习的函数。模型设定为y_{i,t} g(x_{i,t-1}) e_{i,t}这里的误差项 e_{i,t} 不再是独立同分布的。根据因子模型它可以分解为e_{i,t} g_β(x_{i,t-1}) (f_t - E[f_t]) u_{i,t}第一部分是资产对因子意外变动的暴露第二部分是特质性冲击。核心洞见这个分解揭示了金融数据误差项的核心特征——强烈的横截面依赖性。任意两个资产 i 和 j 的误差项协方差为Cov(e_{i,t}, e_{j,t}) E[ g_β(x_{i,t-1}) Cov(f_t) g_β(x_{j,t-1}) ]由于它们都暴露于共同的系统性风险因子 f_t这个协方差通常不为零。这意味着数据点之间不是独立的。如果错误地假设误差项独立将会严重低估预测的不确定性风险。2.2 预测误差的渐进分布一个关键定理我们的第一个核心理论发现是无论使用多么复杂的机器学习模型如深度神经网络还是相对简单的闭式模型如傅里叶级数回归来生成点预测 bz_{T1|T}其预测误差的渐进分布是相同的。具体来说在一定的技术条件下主要涉及数据平稳性、模型复杂度可控等详见附录存在一个函数 ζ*(·)使得bz_{T1|T} - z_{T1|T} (1/T) Σ_{t1}^{T} B_{t-1} (f_t - E[f_t]) o_p(T^{-1/2})其中B_{t-1} (1/N) Σ_{i1}^{N} ζ*(x_{i,t-1}) β_{i,t-1}。这个定理有两大实践指导意义误差来源预测误差的主要驱动项是因子冲击 (f_t - E[f_t]) 的时间序列波动其收敛速度为 O_p(1/√T)。这比面板数据模型中常见的 O_p(1/√NT) 要慢。这符合资产定价的直觉风险溢价λ_f只能通过长时间序列数据来学习无法仅通过横截面的大量资产来快速精确估计。因此不确定性的主要来源是时间而非横截面。方法通用性既然复杂模型神经网络和简单模型傅里叶级数的预测误差具有相同的渐进分布那么我们就可以用简单模型易于计算方差的标准误来近似复杂模型预测的标准误。这为第一种置信区间构建方法奠定了理论基础。3. 两种置信区间构建方法的实操解析基于上述理论我们开发了两种构建预测置信区间的方法它们在计算复杂度和假设强弱上各有侧重实践中可以相互验证。3.1 方法一闭式机器学习近似法这种方法直接利用了“渐进分布相同”的结论。其操作步骤如下用复杂模型做预测使用你青睐的深度神经网络DNN在全体数据上训练得到预测函数 bg_DNN(·)并计算投资组合的点预测 bz_{T1|T} Σ_i w_i bg_DNN(x_{i,T})。这一步是为了获得最佳的预测精度。用简单模型估方差选择一个具有闭式解的机器学习模型这里我们推荐使用傅里叶级数回归。具体操作是使用相同的特征数据 x_{i,t-1} 和回报数据 y_{i,t}拟合一个线性模型bg_B(x) Φ(x) θ。其中 Φ(x) 是傅里叶基函数向量θ 是通过最小二乘法OLS直接计算得到的参数向量θ (ΨΨ)^{-1} (Σ_{i,t} Φ(x_{i,t-1}) y_{i,t})Ψ 是所有 Φ(x_{i,t-1}) 堆叠而成的设计矩阵。计算标准误根据推导该闭式模型预测的标准误估计量为SE_hat(bz_{T1|T}) sqrt( Σ_{t1}^{T} H Φ_{t-1} b_e_t b_e_t Φ_{t-1} H )其中H W Φ_T (ΨΨ)^{-1}W是组合权重向量Φ_{t-1} 是t-1期所有资产特征对应的基函数矩阵b_e_t 是闭式模型在t期的残差向量。构建置信区间对于显著性水平 α预测 z_{T1|T} 的 (1-α)% 置信区间为[ bz_{T1|T} - z_{1-α/2} * SE_hat, bz_{T1|T} z_{1-α/2} * SE_hat ]其中 z_{1-α/2} 是标准正态分布的分位数。实操心得为什么用复杂的DNN预测却用简单的傅里叶级数算误差因为DNN在逼近复杂函数 g(·) 时“偏差”更小预测更准而计算方差时我们只关心“方差”部分。定理2保证了即使傅里叶级数的近似偏差比DNN大但只要偏差以足够快的速度趋于零它估计出的方差依然是DNN预测方差的一致估计。这好比用高精度激光测距仪DNN测距离但用一把虽然绝对精度稍差但刻度非常均匀的尺子傅里叶级数来评估这次测距的波动范围。3.2 方法二k步自举法自举法是一种通过重复抽样来模拟统计量抽样分布的经验方法。但直接将自助法用于神经网络面临巨大的计算挑战如果有B个自助样本就需要从头训练B个神经网络成本极高。我们提出了k步自举法来大幅降低计算负担。核心思想不再为每个自助样本从头训练网络而是以全样本训练好的网络参数为起点在每个自助样本上只进行k个epoch的微调。因为初始点已经接近最优少量迭代就足以使网络适应自助样本的扰动从而高效地模拟预测值的分布。算法步骤训练基础模型在原始数据集{ (x_{i,t-1}, y_{i,t}) }上完整训练神经网络得到函数估计 bg(·)。生成自助样本对于第 b 个自助样本 (b1,...,B) a. 生成一列独立同分布的标准正态随机数 {η*_t}, t1,...,T。 b. 构造自助残差e*_{i,t} (y_{i,t} - bg(x_{i,t-1})) * η*_t。 c. 构造自助回报数据y*_{i,t} bg(x_{i,t-1}) e*_{i,t}。关键注意 η*_t 仅随时间变化对所有资产 i 在时刻 t 是相同的。这精准地捕捉了误差项的横截面相关性源于共同因子冲击。k步训练以 bg(·) 的网络权重为初始化参数在自助数据集{ (x_{i,t-1}, y*_{i,t}) }上运行k个epoch的梯度下降得到更新后的函数 bg*^b(·)。k通常取一个较小的值如10或20。计算自助预测值用 bg*^b(·) 计算自助样本上的组合预测bz*^{b}_{T1|T} Σ_i w_i bg*^b(x_{i,T})。构建置信区间重复步骤2-4共B次如B1000。计算预测误差的绝对值|bz*^{b}_{T1|T} - bz_{T1|T}|在所有B次自助中的 (1-α) 分位数 q*_α。则预测的 (1-α)% 置信区间为[ bz_{T1|T} - q*_α, bz_{T1|T} q*_α ]注意事项自助样本的生成方式是成败关键。如果错误地生成独立于资产和时间的残差如e*_{i,t} (y_{i,t} - bg(x_{i,t-1})) * η*_{i,t}其中 η*_{i,t} 独立同分布将无法复制横截面相关性导致计算出的置信区间严重过窄低估风险。我们的模拟实验证实了这种错误做法会完全失效。4. 不确定性量化在投资组合选择中的应用得到预测置信区间后如何将其用于改进投资决策我们探讨两种经典场景。4.1 应用一考虑不确定性的均值-方差优化UA-投资组合标准均值-方差优化问题为max_w { w μ - (γ/2) w Σ w }其中μ是预期收益向量Σ是协方差矩阵γ是风险厌恶系数。问题在于我们用的μ是估计值 bμ存在误差。一个厌恶不确定性的投资者会认为真实的μ位于一个置信区间内例如μ ∈ [ bμ - κ * se, bμ κ * se ]其中se是标准误向量κ反映了对不确定性的厌恶程度。该投资者会采取最坏情况下的优化策略即max_w { min_{μ ∈ CI} [ w μ - (γ/2) w Σ w ] }这个问题有解析解。对于单个资产i或在对角协方差矩阵假设下其最优权重 w_i 具有一个鲜明的特征存在一个“不参与区域”。具体来说当预测收益的绝对值|bμ_i|大于某个阈值该阈值与标准误 se_i 和不确定性厌恶系数 κ 成正比时最优权重 w_i 与标准均值-方差解类似但会向零收缩。当|bμ_i|小于该阈值时最优权重为零。这意味着如果对某资产预期收益的估计非常不确定se_i很大即使点估计 bμ_i 看起来不错厌恶不确定性的投资者也会选择完全不持有该资产。实操意义这为实践中广泛使用的收缩估计Shrinkage或稀疏投资组合提供了严谨的理论解释。我们的方法通过机器学习预测的标准误 se_i定量地给出了何时以及收缩多少的准则。在实践中我们可以使用前述方法为每个资产的预测 bμ_i 计算标准误 se_i。设定一个不确定性厌恶参数 κ例如对应95%置信区间κ≈1.96更保守的投资者可用更大的κ。求解上述鲁棒优化问题。这可以转化为一个带L1惩罚的回归问题可用标准凸优化包如CVXPY高效求解。4.2 应用二控制错误发现率的纯多头组合构建许多机构投资者如共同基金受限于只能做多。他们的一个自然策略是选择那些预期收益显著为正的资产然后等权或市值加权持有。这引出了多重检验问题如果我们用t统计量bμ_i / se_i来筛选资产可能会选中大量其实真实收益为零甚至为负的资产假发现。我们的预测置信区间为控制错误发现率提供了工具。具体步骤如下计算t统计量对于每个资产i计算其机器学习预测的t值t_i bμ_i / se_i其中se_i来自方法一或方法二。应用多重检验校正采用如Benjamini-Hochberg (BH) 等程序来控制错误发现率。将 |t_i| 从大到小排序找到最大的 k使得|t_(k)| Φ^{-1}(1 - (k * q) / (2 * N))其中q是期望控制的FDR水平如0.1N是资产总数Φ是标准正态CDF。构建组合将所有满足|t_i| |t_(k)|且bμ_i 0的资产纳入投资组合按选定规则如等权分配权重。回测优势相比简单地选择点估计 bμ_i 最高的前N个资产这种基于置信区间并控制FDR的方法能够更有效地剔除“假信号”从而构建出样本外夏普比率更高、Alpha更显著的纯多头组合。它本质上是在“信号强度”t值和“信号数量”之间做了一个最优权衡。5. 实证实施要点与常见问题排查5.1 实施流程与参数选择一个完整的实施流程通常包括以下步骤数据准备整理资产收益率面板数据y_{i,t}和特征数据x_{i,t-1}。确保特征已进行标准化等预处理。模型训练与预测划分训练集和测试集按时间划分。在训练集上训练深度神经网络DNN。网络结构需要根据问题调整一个典型的起点是2-3个隐藏层每层神经元数量在特征数量的1-2倍之间使用ReLU激活函数配合Dropout和早停法防止过拟合。用训练好的DNN对测试集每个时间点进行样本外预测得到点预测序列{bμ_{i,t}}。不确定性量化每个测试时点t方法一使用截至t时刻的数据训练一个傅里叶级数模型。建议基函数个数J随样本量缓慢增加例如J floor(T^{1/5})。用该模型计算每个资产预测的标准误{se_{i,t}}。方法二基于截至t时刻数据训练的DNN进行k步自助法如B500 k15。计算每个资产预测值的自助标准误或直接的分位数区间。组合构建根据应用场景UA-组合或FDR控制的多头组合利用点预测{bμ_{i,t}}和标准误{se_{i,t}}在每个测试时点t构建投资组合。绩效评估计算组合在测试集上的样本外收益率序列分析其夏普比率、最大回撤、Alpha等指标。5.2 常见问题与解决方案下表总结了实施过程中可能遇到的典型问题及其排查思路问题现象可能原因排查与解决方案置信区间覆盖概率过低实际值落在区间内的频率远低于理论置信水平1. 横截面依赖性未被正确捕捉。2. 模型过拟合预测方差被低估。3. 自助法生成样本方式错误如用了独立自助。1.检查方法确保在方法二中使用了η*_t随时间变化而非η*_{i,t}。在方法一中确认标准误公式使用了考虑横截面相关的残差外积b_e_t b_e_t。2.检查方法加强DNN的正则化增大Dropout率、权重衰减或使用更简单的网络。检查傅里叶级数是否用了过多的基函数导致过拟合。3.进行模拟在已知数据生成过程如一个简单的因子模型的模拟数据上测试你的代码验证置信区间的覆盖概率是否接近名义水平。置信区间过宽失去实用价值1. 预测模型本身不准残差过大。2. 样本时间序列长度T过短导致因子风险溢价估计不准误差项B_{t-1}(f_t-Ef_t)的方差大。1.优化模型尝试不同的特征工程、网络结构或机器学习算法提升点预测的R²。2.接受现实对于短期数据预测不确定性本就很大。此时应降低对策略收益的预期或转向更保守的UA-组合增大κ避免激进配置。UA-投资组合权重过于稀疏大量资产权重为零不确定性厌恶系数κ设置过大或预测标准误se_i普遍较大。1.校准κκ可以看作一个策略参数。可以通过历史回测在样本外寻找使夏普比率或Calmar比率最大化的κ值。2.分析来源检查是哪些资产的标准误特别大。可能是这些资产的特征数据质量差、波动性极高或模型对其拟合不佳。考虑是否将这些资产从可投资范围中暂时剔除。计算速度过慢1. 方法二中B或k设置过大。2. DNN模型本身过于复杂。3. 资产数量N或特征维度d过大。1.参数调优B200~500通常已足够稳定。k10~20在多数情况下能很好平衡精度与速度。可先用小B测试。2.模型简化用更浅/更窄的网络或考虑使用随机森林、梯度提升树等同样有效但训练更快的模型作为DNN的替代进行预测但方差估计可能仍需傅里叶近似。3.降维与抽样对特征使用PCA降维。对于方法一中的傅里叶基矩阵求逆如果J很大考虑使用随机傅里叶特征进行近似。两种方法给出的标准误差异巨大1. 基础假设可能被违反如模型过参数化。2. 傅里叶级数方法一的基函数数量选择不当导致对g(·)的近似偏差过大影响了方差估计的一致性。3. 自助法方法二的k值太小未能充分收敛。1.稳健性检查这是论文推荐的稳健性检查环节。如果差异大应谨慎对待结果。检查DNN是否严重过拟合训练误差远低于验证误差。2.调整方法一尝试减少或增加傅里叶基函数的数量J观察标准误是否稳定。可以尝试B样条等其他闭式基函数。3.调整方法二逐步增加k值如从10增加到50观察自助标准误是否收敛。采用更保守的策略在两种标准误中取较大的那个用于构建置信区间。5.3 关于过参数化模型的特别说明我们的理论框架要求机器学习模型不能是“过参数化”的即参数数量远大于样本量。这与近期一些关于过参数化模型在资产定价中具有优势的研究如Kelly et al., 2021看似矛盾。需要澄清的是我们的焦点我们关注的是预测不确定性方差的统计推断。在过参数化区制下模型会精确插值训练数据其预测行为如偏差-方差权衡和渐进分布性质与传统区制有本质不同建立有效的置信区间是理论计量学的前沿难题。实践建议如果你的目标是追求极致的样本外预测精度且数据量足够大可以探索过参数化的神经网络。但此时本文提供的置信区间方法可能不再严格适用。一个务实的做法是在适度正则化的模型即非过参数化区制下应用本文方法进行不确定性量化与组合构建。这可能在精度上略有妥协但能提供可靠的统计保障和风险控制。将过参数化模型下的推断作为未来研究的方向。将机器学习预测的不确定性纳入投资决策框架是从“黑箱”预测走向“可解释、可信任”的量化投资的关键一步。它迫使我们在追求阿尔法的同时时刻铭记奈特不确定性Knightian Uncertainty的存在。本文提供的两种方法闭式近似法计算高效k步自助法则假设更弱、更灵活它们为从业者提供了实用的工具箱。最终在波动与噪声充斥的市场中承认我们认知的边界并在此基础上做出稳健的决策或许是长期生存更重要的法则。
量化投资新视角:机器学习预测不确定性如何重塑资产配置
发布时间:2026/5/25 7:31:24
1. 项目概述与核心挑战在资产管理行业无论是养老基金、财富顾问还是对冲基金核心任务都是预测资产未来回报并据此构建最优投资组合。近年来机器学习模型特别是神经网络凭借其捕捉金融数据中复杂非线性关系的能力在这一领域取得了显著成功。它们被广泛用于预测资产回报、估计协方差矩阵并最终服务于经典的均值-方差投资组合优化框架。然而当前业界和学术界普遍存在一个被忽视的“盲点”我们通常将机器学习模型的预测结果当作一个确定的“点估计”来使用仿佛这个预测值就是未来回报的真实期望完全忽略了预测本身所固有的不确定性。这其实是一个相当危险的简化。想象一下你是一位基金经理模型告诉你某只股票下个月的预期超额回报是5%。但如果这个预测的95%置信区间是[-10% 20%]那么“5%”这个点估计所蕴含的信息就完全不同了。忽略这种不确定性就好比在迷雾中高速驾驶却只相信导航给出的一个精确坐标而不考虑定位误差的范围。在投资组合理论中参数不确定性尤其是期望收益的不确定性对最终配置权重有着巨大影响。经典的文献早已指出考虑这种不确定性会导致与标准均值-方差模型截然不同的经济洞见例如资产权重可能对预期收益的估计误差非常敏感。因此本项目的核心目标就是为机器学习特别是神经网络的资产回报预测构建一个可靠的“预测置信区间”并将这种不确定性量化地融入到投资组合构建的决策过程中。这不是一个纯理论的计量经济学练习而是一个具有直接实操价值的风险管理工具。它旨在回答两个关键问题第一我们的预测到底有多准第二在知道预测不准的可能性后我们应该如何更稳健地配置资产2. 机器学习预测不确定性的量化原理要构建预测置信区间首先必须理解机器学习预测误差的来源与结构。我们不能简单地套用传统计量经济学中为线性回归模型推导标准误的方法因为机器学习模型尤其是神经网络的估计过程没有解析解且金融数据具有独特的复杂性。2.1 理解预测误差的根源因子模型视角我们从一个更基础的资产定价模型出发来理解问题。假设资产i在t时刻的超额回报 y_{i,t} 可以由一个条件因子模型描述y_{i,t} α_{i,t-1} β_{i,t-1} f_t u_{i,t}其中α 代表资产的特异性收益Alphaβ 代表资产对一系列风险因子 f_t 的暴露Betau 是特质性误差。关键假设在于资产在 t-1 时刻的可观测特征 x_{i,t-1}如动量、市值、波动率等能够预测其未来的 Alpha 和 Beta即存在函数 g_α 和 g_β使得 α_{i,t-1} g_α(x_{i,t-1}) β_{i,t-1} g_β(x_{i,t-1})。在这个设定下如果我们进一步假设风险因子的价格 λ_f E[f_t] 是常数那么资产的预期超额回报可以写为E[y_{i,t} | x_{i,t-1}] g_α(x_{i,t-1}) g_β(x_{i,t-1}) λ_f我们将其定义为函数 g(x_{i,t-1})。这正是机器学习模型试图从数据中学习的函数。模型设定为y_{i,t} g(x_{i,t-1}) e_{i,t}这里的误差项 e_{i,t} 不再是独立同分布的。根据因子模型它可以分解为e_{i,t} g_β(x_{i,t-1}) (f_t - E[f_t]) u_{i,t}第一部分是资产对因子意外变动的暴露第二部分是特质性冲击。核心洞见这个分解揭示了金融数据误差项的核心特征——强烈的横截面依赖性。任意两个资产 i 和 j 的误差项协方差为Cov(e_{i,t}, e_{j,t}) E[ g_β(x_{i,t-1}) Cov(f_t) g_β(x_{j,t-1}) ]由于它们都暴露于共同的系统性风险因子 f_t这个协方差通常不为零。这意味着数据点之间不是独立的。如果错误地假设误差项独立将会严重低估预测的不确定性风险。2.2 预测误差的渐进分布一个关键定理我们的第一个核心理论发现是无论使用多么复杂的机器学习模型如深度神经网络还是相对简单的闭式模型如傅里叶级数回归来生成点预测 bz_{T1|T}其预测误差的渐进分布是相同的。具体来说在一定的技术条件下主要涉及数据平稳性、模型复杂度可控等详见附录存在一个函数 ζ*(·)使得bz_{T1|T} - z_{T1|T} (1/T) Σ_{t1}^{T} B_{t-1} (f_t - E[f_t]) o_p(T^{-1/2})其中B_{t-1} (1/N) Σ_{i1}^{N} ζ*(x_{i,t-1}) β_{i,t-1}。这个定理有两大实践指导意义误差来源预测误差的主要驱动项是因子冲击 (f_t - E[f_t]) 的时间序列波动其收敛速度为 O_p(1/√T)。这比面板数据模型中常见的 O_p(1/√NT) 要慢。这符合资产定价的直觉风险溢价λ_f只能通过长时间序列数据来学习无法仅通过横截面的大量资产来快速精确估计。因此不确定性的主要来源是时间而非横截面。方法通用性既然复杂模型神经网络和简单模型傅里叶级数的预测误差具有相同的渐进分布那么我们就可以用简单模型易于计算方差的标准误来近似复杂模型预测的标准误。这为第一种置信区间构建方法奠定了理论基础。3. 两种置信区间构建方法的实操解析基于上述理论我们开发了两种构建预测置信区间的方法它们在计算复杂度和假设强弱上各有侧重实践中可以相互验证。3.1 方法一闭式机器学习近似法这种方法直接利用了“渐进分布相同”的结论。其操作步骤如下用复杂模型做预测使用你青睐的深度神经网络DNN在全体数据上训练得到预测函数 bg_DNN(·)并计算投资组合的点预测 bz_{T1|T} Σ_i w_i bg_DNN(x_{i,T})。这一步是为了获得最佳的预测精度。用简单模型估方差选择一个具有闭式解的机器学习模型这里我们推荐使用傅里叶级数回归。具体操作是使用相同的特征数据 x_{i,t-1} 和回报数据 y_{i,t}拟合一个线性模型bg_B(x) Φ(x) θ。其中 Φ(x) 是傅里叶基函数向量θ 是通过最小二乘法OLS直接计算得到的参数向量θ (ΨΨ)^{-1} (Σ_{i,t} Φ(x_{i,t-1}) y_{i,t})Ψ 是所有 Φ(x_{i,t-1}) 堆叠而成的设计矩阵。计算标准误根据推导该闭式模型预测的标准误估计量为SE_hat(bz_{T1|T}) sqrt( Σ_{t1}^{T} H Φ_{t-1} b_e_t b_e_t Φ_{t-1} H )其中H W Φ_T (ΨΨ)^{-1}W是组合权重向量Φ_{t-1} 是t-1期所有资产特征对应的基函数矩阵b_e_t 是闭式模型在t期的残差向量。构建置信区间对于显著性水平 α预测 z_{T1|T} 的 (1-α)% 置信区间为[ bz_{T1|T} - z_{1-α/2} * SE_hat, bz_{T1|T} z_{1-α/2} * SE_hat ]其中 z_{1-α/2} 是标准正态分布的分位数。实操心得为什么用复杂的DNN预测却用简单的傅里叶级数算误差因为DNN在逼近复杂函数 g(·) 时“偏差”更小预测更准而计算方差时我们只关心“方差”部分。定理2保证了即使傅里叶级数的近似偏差比DNN大但只要偏差以足够快的速度趋于零它估计出的方差依然是DNN预测方差的一致估计。这好比用高精度激光测距仪DNN测距离但用一把虽然绝对精度稍差但刻度非常均匀的尺子傅里叶级数来评估这次测距的波动范围。3.2 方法二k步自举法自举法是一种通过重复抽样来模拟统计量抽样分布的经验方法。但直接将自助法用于神经网络面临巨大的计算挑战如果有B个自助样本就需要从头训练B个神经网络成本极高。我们提出了k步自举法来大幅降低计算负担。核心思想不再为每个自助样本从头训练网络而是以全样本训练好的网络参数为起点在每个自助样本上只进行k个epoch的微调。因为初始点已经接近最优少量迭代就足以使网络适应自助样本的扰动从而高效地模拟预测值的分布。算法步骤训练基础模型在原始数据集{ (x_{i,t-1}, y_{i,t}) }上完整训练神经网络得到函数估计 bg(·)。生成自助样本对于第 b 个自助样本 (b1,...,B) a. 生成一列独立同分布的标准正态随机数 {η*_t}, t1,...,T。 b. 构造自助残差e*_{i,t} (y_{i,t} - bg(x_{i,t-1})) * η*_t。 c. 构造自助回报数据y*_{i,t} bg(x_{i,t-1}) e*_{i,t}。关键注意 η*_t 仅随时间变化对所有资产 i 在时刻 t 是相同的。这精准地捕捉了误差项的横截面相关性源于共同因子冲击。k步训练以 bg(·) 的网络权重为初始化参数在自助数据集{ (x_{i,t-1}, y*_{i,t}) }上运行k个epoch的梯度下降得到更新后的函数 bg*^b(·)。k通常取一个较小的值如10或20。计算自助预测值用 bg*^b(·) 计算自助样本上的组合预测bz*^{b}_{T1|T} Σ_i w_i bg*^b(x_{i,T})。构建置信区间重复步骤2-4共B次如B1000。计算预测误差的绝对值|bz*^{b}_{T1|T} - bz_{T1|T}|在所有B次自助中的 (1-α) 分位数 q*_α。则预测的 (1-α)% 置信区间为[ bz_{T1|T} - q*_α, bz_{T1|T} q*_α ]注意事项自助样本的生成方式是成败关键。如果错误地生成独立于资产和时间的残差如e*_{i,t} (y_{i,t} - bg(x_{i,t-1})) * η*_{i,t}其中 η*_{i,t} 独立同分布将无法复制横截面相关性导致计算出的置信区间严重过窄低估风险。我们的模拟实验证实了这种错误做法会完全失效。4. 不确定性量化在投资组合选择中的应用得到预测置信区间后如何将其用于改进投资决策我们探讨两种经典场景。4.1 应用一考虑不确定性的均值-方差优化UA-投资组合标准均值-方差优化问题为max_w { w μ - (γ/2) w Σ w }其中μ是预期收益向量Σ是协方差矩阵γ是风险厌恶系数。问题在于我们用的μ是估计值 bμ存在误差。一个厌恶不确定性的投资者会认为真实的μ位于一个置信区间内例如μ ∈ [ bμ - κ * se, bμ κ * se ]其中se是标准误向量κ反映了对不确定性的厌恶程度。该投资者会采取最坏情况下的优化策略即max_w { min_{μ ∈ CI} [ w μ - (γ/2) w Σ w ] }这个问题有解析解。对于单个资产i或在对角协方差矩阵假设下其最优权重 w_i 具有一个鲜明的特征存在一个“不参与区域”。具体来说当预测收益的绝对值|bμ_i|大于某个阈值该阈值与标准误 se_i 和不确定性厌恶系数 κ 成正比时最优权重 w_i 与标准均值-方差解类似但会向零收缩。当|bμ_i|小于该阈值时最优权重为零。这意味着如果对某资产预期收益的估计非常不确定se_i很大即使点估计 bμ_i 看起来不错厌恶不确定性的投资者也会选择完全不持有该资产。实操意义这为实践中广泛使用的收缩估计Shrinkage或稀疏投资组合提供了严谨的理论解释。我们的方法通过机器学习预测的标准误 se_i定量地给出了何时以及收缩多少的准则。在实践中我们可以使用前述方法为每个资产的预测 bμ_i 计算标准误 se_i。设定一个不确定性厌恶参数 κ例如对应95%置信区间κ≈1.96更保守的投资者可用更大的κ。求解上述鲁棒优化问题。这可以转化为一个带L1惩罚的回归问题可用标准凸优化包如CVXPY高效求解。4.2 应用二控制错误发现率的纯多头组合构建许多机构投资者如共同基金受限于只能做多。他们的一个自然策略是选择那些预期收益显著为正的资产然后等权或市值加权持有。这引出了多重检验问题如果我们用t统计量bμ_i / se_i来筛选资产可能会选中大量其实真实收益为零甚至为负的资产假发现。我们的预测置信区间为控制错误发现率提供了工具。具体步骤如下计算t统计量对于每个资产i计算其机器学习预测的t值t_i bμ_i / se_i其中se_i来自方法一或方法二。应用多重检验校正采用如Benjamini-Hochberg (BH) 等程序来控制错误发现率。将 |t_i| 从大到小排序找到最大的 k使得|t_(k)| Φ^{-1}(1 - (k * q) / (2 * N))其中q是期望控制的FDR水平如0.1N是资产总数Φ是标准正态CDF。构建组合将所有满足|t_i| |t_(k)|且bμ_i 0的资产纳入投资组合按选定规则如等权分配权重。回测优势相比简单地选择点估计 bμ_i 最高的前N个资产这种基于置信区间并控制FDR的方法能够更有效地剔除“假信号”从而构建出样本外夏普比率更高、Alpha更显著的纯多头组合。它本质上是在“信号强度”t值和“信号数量”之间做了一个最优权衡。5. 实证实施要点与常见问题排查5.1 实施流程与参数选择一个完整的实施流程通常包括以下步骤数据准备整理资产收益率面板数据y_{i,t}和特征数据x_{i,t-1}。确保特征已进行标准化等预处理。模型训练与预测划分训练集和测试集按时间划分。在训练集上训练深度神经网络DNN。网络结构需要根据问题调整一个典型的起点是2-3个隐藏层每层神经元数量在特征数量的1-2倍之间使用ReLU激活函数配合Dropout和早停法防止过拟合。用训练好的DNN对测试集每个时间点进行样本外预测得到点预测序列{bμ_{i,t}}。不确定性量化每个测试时点t方法一使用截至t时刻的数据训练一个傅里叶级数模型。建议基函数个数J随样本量缓慢增加例如J floor(T^{1/5})。用该模型计算每个资产预测的标准误{se_{i,t}}。方法二基于截至t时刻数据训练的DNN进行k步自助法如B500 k15。计算每个资产预测值的自助标准误或直接的分位数区间。组合构建根据应用场景UA-组合或FDR控制的多头组合利用点预测{bμ_{i,t}}和标准误{se_{i,t}}在每个测试时点t构建投资组合。绩效评估计算组合在测试集上的样本外收益率序列分析其夏普比率、最大回撤、Alpha等指标。5.2 常见问题与解决方案下表总结了实施过程中可能遇到的典型问题及其排查思路问题现象可能原因排查与解决方案置信区间覆盖概率过低实际值落在区间内的频率远低于理论置信水平1. 横截面依赖性未被正确捕捉。2. 模型过拟合预测方差被低估。3. 自助法生成样本方式错误如用了独立自助。1.检查方法确保在方法二中使用了η*_t随时间变化而非η*_{i,t}。在方法一中确认标准误公式使用了考虑横截面相关的残差外积b_e_t b_e_t。2.检查方法加强DNN的正则化增大Dropout率、权重衰减或使用更简单的网络。检查傅里叶级数是否用了过多的基函数导致过拟合。3.进行模拟在已知数据生成过程如一个简单的因子模型的模拟数据上测试你的代码验证置信区间的覆盖概率是否接近名义水平。置信区间过宽失去实用价值1. 预测模型本身不准残差过大。2. 样本时间序列长度T过短导致因子风险溢价估计不准误差项B_{t-1}(f_t-Ef_t)的方差大。1.优化模型尝试不同的特征工程、网络结构或机器学习算法提升点预测的R²。2.接受现实对于短期数据预测不确定性本就很大。此时应降低对策略收益的预期或转向更保守的UA-组合增大κ避免激进配置。UA-投资组合权重过于稀疏大量资产权重为零不确定性厌恶系数κ设置过大或预测标准误se_i普遍较大。1.校准κκ可以看作一个策略参数。可以通过历史回测在样本外寻找使夏普比率或Calmar比率最大化的κ值。2.分析来源检查是哪些资产的标准误特别大。可能是这些资产的特征数据质量差、波动性极高或模型对其拟合不佳。考虑是否将这些资产从可投资范围中暂时剔除。计算速度过慢1. 方法二中B或k设置过大。2. DNN模型本身过于复杂。3. 资产数量N或特征维度d过大。1.参数调优B200~500通常已足够稳定。k10~20在多数情况下能很好平衡精度与速度。可先用小B测试。2.模型简化用更浅/更窄的网络或考虑使用随机森林、梯度提升树等同样有效但训练更快的模型作为DNN的替代进行预测但方差估计可能仍需傅里叶近似。3.降维与抽样对特征使用PCA降维。对于方法一中的傅里叶基矩阵求逆如果J很大考虑使用随机傅里叶特征进行近似。两种方法给出的标准误差异巨大1. 基础假设可能被违反如模型过参数化。2. 傅里叶级数方法一的基函数数量选择不当导致对g(·)的近似偏差过大影响了方差估计的一致性。3. 自助法方法二的k值太小未能充分收敛。1.稳健性检查这是论文推荐的稳健性检查环节。如果差异大应谨慎对待结果。检查DNN是否严重过拟合训练误差远低于验证误差。2.调整方法一尝试减少或增加傅里叶基函数的数量J观察标准误是否稳定。可以尝试B样条等其他闭式基函数。3.调整方法二逐步增加k值如从10增加到50观察自助标准误是否收敛。采用更保守的策略在两种标准误中取较大的那个用于构建置信区间。5.3 关于过参数化模型的特别说明我们的理论框架要求机器学习模型不能是“过参数化”的即参数数量远大于样本量。这与近期一些关于过参数化模型在资产定价中具有优势的研究如Kelly et al., 2021看似矛盾。需要澄清的是我们的焦点我们关注的是预测不确定性方差的统计推断。在过参数化区制下模型会精确插值训练数据其预测行为如偏差-方差权衡和渐进分布性质与传统区制有本质不同建立有效的置信区间是理论计量学的前沿难题。实践建议如果你的目标是追求极致的样本外预测精度且数据量足够大可以探索过参数化的神经网络。但此时本文提供的置信区间方法可能不再严格适用。一个务实的做法是在适度正则化的模型即非过参数化区制下应用本文方法进行不确定性量化与组合构建。这可能在精度上略有妥协但能提供可靠的统计保障和风险控制。将过参数化模型下的推断作为未来研究的方向。将机器学习预测的不确定性纳入投资决策框架是从“黑箱”预测走向“可解释、可信任”的量化投资的关键一步。它迫使我们在追求阿尔法的同时时刻铭记奈特不确定性Knightian Uncertainty的存在。本文提供的两种方法闭式近似法计算高效k步自助法则假设更弱、更灵活它们为从业者提供了实用的工具箱。最终在波动与噪声充斥的市场中承认我们认知的边界并在此基础上做出稳健的决策或许是长期生存更重要的法则。