1. 项目概述当量子计算遇上城市交通作为一名长期关注前沿技术落地的从业者我最近一直在思考一个问题那些听起来“高大上”的量子计算究竟什么时候才能走出实验室解决我们身边实实在在的工程问题智能交通系统ITS就是一个绝佳的试验场。每天城市路网产生海量的时间序列数据——车速、流量、占有率——这些数据背后隐藏着复杂的动态模式用于预测和分类交通状态。经典深度学习方法比如LSTM已经做得不错了但它们处理高维、非线性关系时总会遇到计算效率和模型表达能力的瓶颈。这时量子机器学习QML进入了视野。它利用量子比特的叠加和纠缠特性理论上能在特定问题上提供指数级的计算加速或更强大的模型表达能力。但现实是骨感的当前的量子硬件还处于“嘈杂中型量子”NISQ时代比特数有限、噪声大、相干时间短。直接扔一个复杂的交通数据进去量子电路很可能“消化不良”训练不稳定效果甚至不如简单的经典模型。于是一种务实的思路出现了混合量子-经典架构。这不就是“让专业的设备做专业的事”吗让成熟的经典神经网络比如多层感知机MLP先去处理原始数据提取出最精华、最结构化的特征再把这些精炼后的、维度适中的特征喂给量子电路比如变分量子分类器VQC去做最后的“高维魔法”分类。这种分工协作既能规避当前量子硬件的短板又能探索量子计算在特定环节的潜力。本文要拆解的正是韩国科学技术信息研究院KISTI在IEEE Access上发表的一项工作多层感知机-变分量子分类器MVQC混合框架及其在城市交通状态分类任务上的性能分析。他们用韩国大田市的真实车辆检测系统VDS数据构建了一个远超常规QML基准规模的数据集并系统性地对比了纯经典MLP、纯量子VQC以及混合MVQC的表现。结果很有意思混合模型MVQC虽然没能超越顶级配置的经典MLP98.6%准确率但以91.4%的测试准确率显著碾压了纯量子VQC61.8%并且展现出了更好的数据规模扩展性。这不仅仅是一个实验报告更像是一份给工程界的“可行性研究”告诉我们如何一步步地、脚踏实地地把量子机器学习用起来。2. 核心思路拆解为什么是“经典特征提取 量子分类”在深入代码和实验细节之前我们必须先理解这个混合架构的设计哲学。这决定了为什么是MLPVQC而不是其他组合。2.1 问题根源量子模型处理高维原始数据的“先天不足”变分量子分类器VQC的核心是将经典数据编码Encode到量子态中然后通过一个参数化的量子电路Ansatz进行变换最后测量得到分类结果。这里第一个拦路虎就是数据编码。对于时间序列交通数据即便经过窗口聚合比如2小时窗口每个样本仍有多个特征速度、流量、占有率等。直接使用常见的角度编码如RY旋转每个特征值映射为一个量子比特的旋转角度。如果特征维度是4我们至少需要4个量子比特。这听起来没问题但关键在于原始特征通常存在量纲不统一、噪声大、特征间关系复杂等问题。将这样的数据直接映射到量子态相当于把一堆未经处理的原材料直接塞进精密仪器量子电路需要耗费大量参数和电路深度去学习这些噪声和冗余甚至可能因为糟糕的初始化而陷入局部最优导致训练失败。这就是为什么纯VQC模型在实验中表现不佳仅61.8%准确率且不稳定的核心原因之一。2.2 经典MLP的“预处理”价值降维、去噪与结构化多层感知机MLP作为最基础也最强大的经典神经网络之一在特征提取方面有着公认的优势。它通过多层非线性变换能够自动学习数据的高阶抽象表示。在MVQC框架中MLP扮演了一个“智能数据压缩与净化器”的角色降维与信息浓缩虽然输入输出维度在此例中都是4为了匹配后续量子比特数但MLP的隐藏层可以对原始4维特征进行非线性组合提炼出对分类任务更有效的4维“潜特征”。这4个新特征不再是原始的物理量而是承载了“拥堵模式”抽象信息的表示。规范化与去噪MLP的激活函数如ReLU和训练过程本身对输入噪声有一定的鲁棒性。其输出的潜特征分布通常比原始数据更平滑、更规整为后续量子编码提供了更“友好”的输入。提供结构化引导MLP是通过端到端梯度下降训练出来的其提取的特征天然地朝着最小化分类损失的方向优化。这意味着它提供给VQC的已经是经过“预分类”引导的结构化信息。VQC不需要再从零开始理解交通流而是专注于在这个更好的特征空间里划出更精确的决策边界。注意这里MLP的输出维度需要与量子比特数对齐这是一个关键的设计权衡。维度太高会增加量子电路的负担和噪声敏感度维度太低可能导致信息丢失。文中选择4维是一个与当前NISQ设备能力4-5个可用量子比特和问题复杂度相匹配的实用选择。2.3 混合架构的协同效应112因此MVQC的混合思路可以概括为让经典模型做它擅长的事特征学习与压缩让量子模型做它可能擅长的事在高维希尔伯特空间中进行高效分类。这种分工带来了几个好处训练稳定性提升MLP提供的良好初始化特征使得VQC的优化起点更佳避免了在糟糕的初始量子态中迷失方向。实验中也观察到混合模型MVQC的训练收敛比纯VQC更稳定。资源利用更高效相比直接用更深的量子电路处理原始数据使用浅层的MLP计算成本极低进行预处理可以让量子电路更“专注”可能用更浅的深度更少的reps达到更好的效果这非常契合当前量子硬件深度受限的特点。可扩展性暗示当数据规模增大从小规模数据集到中等规模数据集纯VQC的性能几乎停滞不前而MVQC则显示出明显的性能提升从平均75.5%到80.5%峰值达到91.4%。这表明经典特征提取模块帮助量子部分更好地利用了增加的数据信息缓解了量子模型因表达能力或优化困难导致的“饱和”问题。3. 实操全流程从数据到模型部署的每一步纸上得来终觉浅绝知此事要躬行。我们抛开论文中严谨的学术描述从一个实践者的角度复盘一下如何从头构建并运行一个MVQC模型。这个过程大致分为四个阶段数据工程、经典模块构建、量子模块设计、混合训练与评估。3.1 数据准备与特征工程为模型制造“燃料”任何机器学习项目成功的一半取决于数据。对于交通状态分类我们需要将连续的、嘈杂的传感器读数转化为模型能理解的、带标签的样本。第一步原始数据理解与聚合原始数据来自大田市107个主要路段的车辆检测传感器包含每5分钟间隔的平均速度、占有率、总交通量以及按车型分类的流量。为了降低高频波动噪声并捕捉短期模式论文采用了固定非重叠的2小时窗口进行聚合。这意味着每24个连续的5分钟样本2小时被合为一个数据点。对于每个窗口我们计算四个关键特征窗口内平均速度的均值窗口内总交通量的总和窗口内占有率的均值时间窗口索引例如将一天划分为12个窗口用0-11表示用于捕捉日常周期性模式。实操心得为什么舍弃车型细分数据论文提到初步实验表明其影响不大。在实际操作中这是一个重要的特征筛选步骤。过多的无关特征不仅增加计算量还可能引入噪声对量子编码尤其不友好。建议始终进行简单的特征重要性分析或消融实验。第二步标签生成——定义“畅通”、“缓行”、“拥堵”分类任务需要明确的标签。论文没有采用固定的阈值如速度低于20km/h算拥堵而是采用了基于分位数的分割方法这更适应数据本身的分布。首先定义一个交通流指数TFITFI 总交通量 * 平均速度。这个指标综合了流量和速度能较好地表征交通强度流量大且速度快TFI高流量大但速度慢TFI可能中等或低。计算整个数据集中所有样本的TFI值并将其归一化到[0, 1]区间。使用三分位数即33%和67%分位点作为阈值。将TFI值划分为三等份畅通Free-flow: TFI 0.33缓行Moderate: 0.33 ≤ TFI 0.67拥堵Congested: TFI ≥ 0.67 论文中图示的阈值0.29和0.47是基于其特定数据分布计算出的实际分位数原理相同。关键点TFI仅用于生成标签不作为模型输入特征。这是为了防止数据泄露Data Leakage因为TFI是由输入特征速度、流量计算得出的如果同时作为特征和标签依据模型会通过“作弊”获得虚假的高性能。第三步数据集划分与平衡处理后的数据被构造为(样本数, 4)的特征矩阵和对应的标签向量。为了可靠评估论文构建了分层抽样的小规模3000样本和中等规模4500样本数据集确保每个类别的样本在训练、验证、测试集中比例一致。这是处理类别不平衡问题的基本操作。3.2 经典特征提取器MLP的实现这个部分使用经典的深度学习框架如PyTorch或TensorFlow即可轻松实现。import torch import torch.nn as nn class FeatureExtractorMLP(nn.Module): def __init__(self, input_dim4, latent_dim4, hidden_dim64): super(FeatureExtractorMLP, self).__init__() self.network nn.Sequential( nn.Linear(input_dim, hidden_dim), nn.ReLU(), nn.Linear(hidden_dim, hidden_dim), nn.ReLU(), nn.Linear(hidden_dim, latent_dim) # 输出潜特征维度与量子比特数对齐 ) def forward(self, x): # x: [batch_size, input_dim] latent_features self.network(x) # [batch_size, latent_dim] return latent_features训练要点损失函数由于是分类任务的前置特征提取MLP需要与后续分类器联合训练端到端或者先使用一个简单的分类头如接一个Softmax层进行预训练。论文采用的是端到端训练即MLP和VQC的参数一起更新。输出规范化MLP输出的潜特征需要被缩放至[0, π]区间以适应量子旋转门的角度输入。这通常在数据传入量子电路前通过一个简单的线性缩放层完成。3.3 量子分类器VQC的核心编码与变分电路这是整个项目的量子核心我们使用Qiskit作为量子编程框架。VQC主要由三部分组成特征编码Feature Map、变分电路Ansatz和测量Measurement。第一步特征编码ZZFeatureMap将经典的4维潜特征向量θ [θ1, θ2, θ3, θ4]编码到4个量子比特的态上。论文选用的是ZZFeatureMap。from qiskit.circuit.library import ZZFeatureMap num_qubits 4 feature_map ZZFeatureMap(feature_dimensionnum_qubits, reps2, entanglementfull) # reps2 表示编码层重复两次增加非线性表达能力。ZZFeatureMap的工作方式可以简单理解为首先对每个量子比特i施加一个RZ(θ_i)旋转然后让每对量子比特(i, j)之间通过ZZ门发生相互作用。这种相互作用引入了特征之间的纠缠相当于在量子态中创建了特征的非线性组合这是量子优势的可能来源之一。第二步变分电路Ansatz选择与构建Ansatz是带有可训练参数φ的量子电路其作用是“搅拌”编码后的量子态将其变换到有利于分类测量的状态。论文对比了两种标准结构RealAmplitudes由交替的RY旋转层和线性纠缠层CNOT门构成。结构相对简单参数较少训练速度快但表达能力可能有限。EfficientSU2由更通用的旋转层包含RX, RY, RZ和纠缠层构成。参数更多结构更复杂理论上具有更强的表达能力和拟合复杂函数的能力。from qiskit.circuit.library import RealAmplitudes, EfficientSU2 # 选择一种Ansatz并确定重复次数(reps) ansatz_reps 4 # 论文中在中等规模数据集上最佳配置 ansatz EfficientSU2(num_qubitsnum_qubits, repsansatz_reps, entanglementlinear) # entanglementlinear 表示最近邻纠缠如 qubit0-qubit1-qubit2-qubit3这降低了电路深度适合NISQ设备。第三步测量与经典后处理最后我们需要测量量子态以获得经典信息。对于三分类任务论文采用了一种巧妙的方法在4个量子比特上测量计算基态Z方向测量会得到一个4位的比特串如‘0101’将其转换为十进制整数z然后通过y z mod 3映射到0, 1, 2三个类别标签上。另一种更常见的做法是为每个类别设置一个观测量例如对某个特定的量子比特子集进行Z测量但取模法在比特数不多时是一种简洁的实现。完整量子电路构建from qiskit import QuantumCircuit # 创建参数 feature_params feature_map.parameters ansatz_params ansatz.parameters # 构建完整电路 qc QuantumCircuit(num_qubits) qc.append(feature_map, range(num_qubits)) # 编码层 qc.append(ansatz, range(num_qubits)) # 变分层 qc.measure_all() # 测量所有量子比特3.4 混合训练流程与参数优化将MLP和VQC连接起来形成一个可端到端训练的混合模型。这里的关键是梯度计算。前向传播输入经典数据x经过 MLP得到潜特征z。z被缩放到[0, π]作为角度参数传入feature_map。量子电路执行进行多次“射击”shots模拟得到测量结果的计数分布。根据分布计算每个类别的期望值例如通过上述取模法统计各类别出现的频率再通过Softmax函数得到预测概率y_pred。损失计算与反向传播使用交叉熵损失函数比较y_pred和真实标签y_true。经典部分MLP参数梯度可以通过标准的自动微分Autograd计算。量子部分Ansatz参数梯度无法直接通过常规反向传播计算。要使用参数移位规则Parameter-shift Rule。这是一种用于含参数量子电路求导的精确方法其思想类似于数值微分但对量子电路是精确且高效的。幸运的是Qiskit等框架已经内置了这些梯度计算例程。优化器论文使用了COBYLA约束优化线性近似优化器。这是一个无梯度优化器它不显式使用梯度信息而是通过迭代采样来寻找最优解。这在量子机器学习早期研究中很常见因为对于某些复杂的量子电路或噪声环境梯度估计可能不稳定。COBYLA相对稳健但可能收敛较慢。在实践中也可以使用基于参数移位规则计算的梯度配合Adam等自适应优化器这可能收敛更快。# 伪代码示意混合训练循环 for epoch in range(num_epochs): for x_batch, y_batch in dataloader: # 1. 前向传播 latent mlp(x_batch) # MLP提取特征 scaled_latent scale_to_pi(latent) # 缩放 # 将 scaled_latent 作为参数绑定到feature_map与ansatz参数一起传入量子电路执行 expectation_values quantum_circuit_executor(scaled_latent, ansatz_params) probs softmax(expectation_values) loss cross_entropy(probs, y_batch) # 2. 反向传播与优化 optimizer.zero_grad() # 混合梯度计算MLP部分用autogradVQC部分用参数移位规则 loss.backward() # 这里需要框架支持混合梯度计算 optimizer.step()4. 实验结果深度分析与工程启示论文提供了详实的实验数据我们不仅要看“结果是什么”更要理解“结果为什么是这样”以及它能给我们未来的工程实践带来哪些启示。4.1 性能对比经典、量子与混合的“三国演义”让我们用一张表来清晰对比三个模型在两个数据集上的表现模型小规模数据集 (3000样本)中等规模数据集 (4500样本)核心特点与问题经典MLP98.0% ± 0.8%98.6% ± 0.4%性能天花板。表现极其稳定且准确率高方差极小。证明了对于此类规模和数据经典方法已近乎完美。纯量子VQC61.8% ± 2.5%61.9% ± 1.5%性能地板。准确率低但方差也小。这说明性能差不是偶然波动而是模型结构或优化存在根本性局限如“贫瘠高原”问题。混合MVQC75.5% ± 11.2%80.5% ± 11.0% (峰值91.4%)潜力股。性能显著优于纯量子但逊于经典。关键观察是方差极大且峰值性能(91.4%)非常接近经典模型。核心洞察混合架构的有效性MVQC相比VQC的平均提升接近20个百分点这强力证明了经典特征提取对量子模型的“引导”和“稳定”作用。MLP像一个经验丰富的向导把VQC带到了一个更易学习的起跑线上。方差的秘密MVQC巨大的性能方差±11%是一把双刃剑。坏处是模型不稳定难以部署。好处是它揭示了混合模型拥有达到更高性能的潜力峰值91.4%只是目前的训练方法如优化器、参数初始化无法稳定地找到那个最优解。这指明了未来的改进方向改进量子部分的训练策略。“贫瘠高原”问题纯VQC的低性能且低方差是量子机器学习中著名的“贫瘠高原”现象的典型表现。随着电路参数增多损失函数的梯度在绝大多数区域变得指数级接近于零导致优化算法陷入停滞。MLP的预处理可能通过提供结构化的输入部分缓解了这个问题使优化景观变得稍微“友好”一些。4.2 Ansatz选择RealAmplitudes vs. EfficientSU2论文中另一个重要对比是两种变分电路结构的表现。Ansatz类型训练特点小规模数据集最佳测试精度稳定性RealAmplitudes收敛快但容易陷入局部最优67.5%差方差大EfficientSU2收敛慢但能找到更优解83.5% (reps2)相对更好工程选择建议追求快速原型验证可以先用RealAmplitudes因为它参数少训练快能快速验证流程是否跑通。追求最佳性能应选择EfficientSU2。它更复杂的旋转门集合提供了更强的表达能力能刻画更复杂的决策边界。虽然训练慢但结果往往更好。关于reps重复次数这不是越多越好。增加reps会增加电路深度和参数可能提升表达能力但也可能加剧噪声在真实硬件上和优化难度。论文中在中等规模数据集上EfficientSU2在reps4时取得最佳效果这是一个需要根据具体任务进行超参数调优的点。4.3 从仿真到现实无法回避的NISQ挑战论文所有实验均在无噪声的态矢量模拟器上完成。这相当于在理想真空环境中测试发动机性能。一旦放到真实量子硬件上挑战接踵而至噪声量子门操作不完美、测量有误差、量子比特会退相干。这些噪声会迅速湮灭计算中脆弱的量子相干性导致结果不可信。有限的比特与连通性当前云量子计算机可能只提供几个可用的、质量尚可的量子比特且它们之间的连接方式拓扑结构受限。论文中使用的线性最近邻纠缠就是为了适配这种硬件约束。电路深度限制由于退相干时间能可靠执行的量子门数量有限。复杂的EfficientSU2ansatz 在真实设备上可能无法运行。面向真实硬件的工程化思考误差缓解采用零噪声外推、测量误差校准等技术在硬件层面尽量补偿噪声。编译优化将逻辑电路编译到特定硬件的原生门集和拓扑结构上并优化门序列以减少深度和错误率。噪声感知训练在训练过程中就模拟或引入硬件噪声模型让模型学会在噪声中保持鲁棒性。算法-硬件协同设计未来可能需要为特定问题如交通分类设计专用的、更浅更抗噪的量子电路结构Ansatz而不是使用通用模板。5. 常见问题、避坑指南与未来展望基于这项研究和自身经验我总结了一些在实践混合量子-经典模型时必然会遇到的坑以及如何绕开它们。5.1 实操中可能遇到的问题与排查训练不收敛或震荡剧烈可能原因量子电路参数初始化不佳优化器选择不当如学习率过大经典特征提取器输出范围不合适导致编码角度超出合理范围。排查步骤检查数据流确保MLP输出特征经过缩放后确实在[0, π]内。可视化其分布。简化问题先用一个极小的、人造的、线性可分的数据集测试整个流程确保代码逻辑正确。调整优化器尝试使用更稳健的优化器如COBYLA虽然慢或者使用较小的学习率并配合梯度裁剪。尝试不同的Ansatz和初始化换用RealAmplitudes或更简单的电路使用不同的参数初始化策略。量子模拟速度极慢可能原因使用基于射影的模拟器qasm_simulator且射击次数shots设置过高电路深度reps太大批处理batch数据时未做优化。优化策略开发阶段使用态矢量模拟器statevector_simulator可以精确计算期望值无需采样速度快适合调试和初步训练。合理设置shots对于训练评估期望值不需要极高的shots如1024或2048次通常足够。仅在最终验证时增加shots以提高精度。利用批处理与并行Qiskit Runtime等服务支持将多个电路任务批量提交到云端执行能大幅提升数据吞吐量。混合模型性能始终不如纯经典模型理性看待这在当前NISQ时代是完正常的甚至是预期的。论文中MLP达到98.6%MVQC峰值91.4%这7个百分点的差距就是当前量子硬件和算法不成熟需要付出的“代价”。混合模型的价值不在于立即超越经典SOTA而在于探索可能性验证量子组件在流程中是否发挥了积极作用MVQC vs VQC。为未来铺路建立混合编程范式一旦量子硬件取得突破整个流程可以无缝衔接。寻找优势场景可能在数据维度极高、结构极其复杂如图数据、量子化学且经典模型遇到瓶颈的问题上混合模型能更早显现优势。5.2 未来研究方向与个人思考这项研究为我们打开了几扇门也留下了许多有待探索的房间更智能的特征交互当前MLP是通用的。是否可以设计一个专门针对时空交通数据的经典特征提取器例如先用图神经网络GNN处理路网拓扑关系提取空间特征再输入给量子分类器。这将是向真正的“时空量子混合模型”迈进的一大步。训练策略的革新MVQC巨大的性能方差指向了训练过程的脆弱性。需要研究更适合混合模型的优化算法、初始化方法、学习率调度策略甚至元学习方法来寻找更稳定的训练路径。轻量化与部署如何将训练好的混合模型部署到真实的、资源受限的边缘计算设备如交通信号机需要考虑模型蒸馏、量子电路编译优化、以及经典部分的轻量化如使用小型CNN或Transformer替代MLP。超越分类回归与预测本文聚焦分类。交通领域更核心的需求是流量预测回归问题。如何将混合架构应用于时间序列预测可能需要结合量子LSTM或量子注意力机制这将是更具挑战性也更有价值的方向。我个人最深的体会是量子机器学习的工程化正处在一个从“为什么”到“怎么做”的关键过渡期。像MVQC这样的工作其最大贡献不在于提供了一个现成的、超越经典的解决方案而在于提供了一套完整的、可复现的方法论框架如何为量子模型准备数据、如何设计混合接口、如何设置评估基准。它告诉我们通往实用化的道路不是一蹴而就的魔法而是需要这样一次次的、扎实的、有正有负的实验迭代。作为从业者我们不必纠结于今天是否超越了ResNet而应专注于理解这些工具搭建这些管道并在自己熟悉的领域如交通、金融、材料寻找那些可能从量子特性中获益的、特定的子问题。当量子硬件准备好的那一天这些积累下的工程经验将是最宝贵的财富。
混合量子-经典架构在交通状态分类中的工程实践与性能分析
发布时间:2026/5/28 7:05:43
1. 项目概述当量子计算遇上城市交通作为一名长期关注前沿技术落地的从业者我最近一直在思考一个问题那些听起来“高大上”的量子计算究竟什么时候才能走出实验室解决我们身边实实在在的工程问题智能交通系统ITS就是一个绝佳的试验场。每天城市路网产生海量的时间序列数据——车速、流量、占有率——这些数据背后隐藏着复杂的动态模式用于预测和分类交通状态。经典深度学习方法比如LSTM已经做得不错了但它们处理高维、非线性关系时总会遇到计算效率和模型表达能力的瓶颈。这时量子机器学习QML进入了视野。它利用量子比特的叠加和纠缠特性理论上能在特定问题上提供指数级的计算加速或更强大的模型表达能力。但现实是骨感的当前的量子硬件还处于“嘈杂中型量子”NISQ时代比特数有限、噪声大、相干时间短。直接扔一个复杂的交通数据进去量子电路很可能“消化不良”训练不稳定效果甚至不如简单的经典模型。于是一种务实的思路出现了混合量子-经典架构。这不就是“让专业的设备做专业的事”吗让成熟的经典神经网络比如多层感知机MLP先去处理原始数据提取出最精华、最结构化的特征再把这些精炼后的、维度适中的特征喂给量子电路比如变分量子分类器VQC去做最后的“高维魔法”分类。这种分工协作既能规避当前量子硬件的短板又能探索量子计算在特定环节的潜力。本文要拆解的正是韩国科学技术信息研究院KISTI在IEEE Access上发表的一项工作多层感知机-变分量子分类器MVQC混合框架及其在城市交通状态分类任务上的性能分析。他们用韩国大田市的真实车辆检测系统VDS数据构建了一个远超常规QML基准规模的数据集并系统性地对比了纯经典MLP、纯量子VQC以及混合MVQC的表现。结果很有意思混合模型MVQC虽然没能超越顶级配置的经典MLP98.6%准确率但以91.4%的测试准确率显著碾压了纯量子VQC61.8%并且展现出了更好的数据规模扩展性。这不仅仅是一个实验报告更像是一份给工程界的“可行性研究”告诉我们如何一步步地、脚踏实地地把量子机器学习用起来。2. 核心思路拆解为什么是“经典特征提取 量子分类”在深入代码和实验细节之前我们必须先理解这个混合架构的设计哲学。这决定了为什么是MLPVQC而不是其他组合。2.1 问题根源量子模型处理高维原始数据的“先天不足”变分量子分类器VQC的核心是将经典数据编码Encode到量子态中然后通过一个参数化的量子电路Ansatz进行变换最后测量得到分类结果。这里第一个拦路虎就是数据编码。对于时间序列交通数据即便经过窗口聚合比如2小时窗口每个样本仍有多个特征速度、流量、占有率等。直接使用常见的角度编码如RY旋转每个特征值映射为一个量子比特的旋转角度。如果特征维度是4我们至少需要4个量子比特。这听起来没问题但关键在于原始特征通常存在量纲不统一、噪声大、特征间关系复杂等问题。将这样的数据直接映射到量子态相当于把一堆未经处理的原材料直接塞进精密仪器量子电路需要耗费大量参数和电路深度去学习这些噪声和冗余甚至可能因为糟糕的初始化而陷入局部最优导致训练失败。这就是为什么纯VQC模型在实验中表现不佳仅61.8%准确率且不稳定的核心原因之一。2.2 经典MLP的“预处理”价值降维、去噪与结构化多层感知机MLP作为最基础也最强大的经典神经网络之一在特征提取方面有着公认的优势。它通过多层非线性变换能够自动学习数据的高阶抽象表示。在MVQC框架中MLP扮演了一个“智能数据压缩与净化器”的角色降维与信息浓缩虽然输入输出维度在此例中都是4为了匹配后续量子比特数但MLP的隐藏层可以对原始4维特征进行非线性组合提炼出对分类任务更有效的4维“潜特征”。这4个新特征不再是原始的物理量而是承载了“拥堵模式”抽象信息的表示。规范化与去噪MLP的激活函数如ReLU和训练过程本身对输入噪声有一定的鲁棒性。其输出的潜特征分布通常比原始数据更平滑、更规整为后续量子编码提供了更“友好”的输入。提供结构化引导MLP是通过端到端梯度下降训练出来的其提取的特征天然地朝着最小化分类损失的方向优化。这意味着它提供给VQC的已经是经过“预分类”引导的结构化信息。VQC不需要再从零开始理解交通流而是专注于在这个更好的特征空间里划出更精确的决策边界。注意这里MLP的输出维度需要与量子比特数对齐这是一个关键的设计权衡。维度太高会增加量子电路的负担和噪声敏感度维度太低可能导致信息丢失。文中选择4维是一个与当前NISQ设备能力4-5个可用量子比特和问题复杂度相匹配的实用选择。2.3 混合架构的协同效应112因此MVQC的混合思路可以概括为让经典模型做它擅长的事特征学习与压缩让量子模型做它可能擅长的事在高维希尔伯特空间中进行高效分类。这种分工带来了几个好处训练稳定性提升MLP提供的良好初始化特征使得VQC的优化起点更佳避免了在糟糕的初始量子态中迷失方向。实验中也观察到混合模型MVQC的训练收敛比纯VQC更稳定。资源利用更高效相比直接用更深的量子电路处理原始数据使用浅层的MLP计算成本极低进行预处理可以让量子电路更“专注”可能用更浅的深度更少的reps达到更好的效果这非常契合当前量子硬件深度受限的特点。可扩展性暗示当数据规模增大从小规模数据集到中等规模数据集纯VQC的性能几乎停滞不前而MVQC则显示出明显的性能提升从平均75.5%到80.5%峰值达到91.4%。这表明经典特征提取模块帮助量子部分更好地利用了增加的数据信息缓解了量子模型因表达能力或优化困难导致的“饱和”问题。3. 实操全流程从数据到模型部署的每一步纸上得来终觉浅绝知此事要躬行。我们抛开论文中严谨的学术描述从一个实践者的角度复盘一下如何从头构建并运行一个MVQC模型。这个过程大致分为四个阶段数据工程、经典模块构建、量子模块设计、混合训练与评估。3.1 数据准备与特征工程为模型制造“燃料”任何机器学习项目成功的一半取决于数据。对于交通状态分类我们需要将连续的、嘈杂的传感器读数转化为模型能理解的、带标签的样本。第一步原始数据理解与聚合原始数据来自大田市107个主要路段的车辆检测传感器包含每5分钟间隔的平均速度、占有率、总交通量以及按车型分类的流量。为了降低高频波动噪声并捕捉短期模式论文采用了固定非重叠的2小时窗口进行聚合。这意味着每24个连续的5分钟样本2小时被合为一个数据点。对于每个窗口我们计算四个关键特征窗口内平均速度的均值窗口内总交通量的总和窗口内占有率的均值时间窗口索引例如将一天划分为12个窗口用0-11表示用于捕捉日常周期性模式。实操心得为什么舍弃车型细分数据论文提到初步实验表明其影响不大。在实际操作中这是一个重要的特征筛选步骤。过多的无关特征不仅增加计算量还可能引入噪声对量子编码尤其不友好。建议始终进行简单的特征重要性分析或消融实验。第二步标签生成——定义“畅通”、“缓行”、“拥堵”分类任务需要明确的标签。论文没有采用固定的阈值如速度低于20km/h算拥堵而是采用了基于分位数的分割方法这更适应数据本身的分布。首先定义一个交通流指数TFITFI 总交通量 * 平均速度。这个指标综合了流量和速度能较好地表征交通强度流量大且速度快TFI高流量大但速度慢TFI可能中等或低。计算整个数据集中所有样本的TFI值并将其归一化到[0, 1]区间。使用三分位数即33%和67%分位点作为阈值。将TFI值划分为三等份畅通Free-flow: TFI 0.33缓行Moderate: 0.33 ≤ TFI 0.67拥堵Congested: TFI ≥ 0.67 论文中图示的阈值0.29和0.47是基于其特定数据分布计算出的实际分位数原理相同。关键点TFI仅用于生成标签不作为模型输入特征。这是为了防止数据泄露Data Leakage因为TFI是由输入特征速度、流量计算得出的如果同时作为特征和标签依据模型会通过“作弊”获得虚假的高性能。第三步数据集划分与平衡处理后的数据被构造为(样本数, 4)的特征矩阵和对应的标签向量。为了可靠评估论文构建了分层抽样的小规模3000样本和中等规模4500样本数据集确保每个类别的样本在训练、验证、测试集中比例一致。这是处理类别不平衡问题的基本操作。3.2 经典特征提取器MLP的实现这个部分使用经典的深度学习框架如PyTorch或TensorFlow即可轻松实现。import torch import torch.nn as nn class FeatureExtractorMLP(nn.Module): def __init__(self, input_dim4, latent_dim4, hidden_dim64): super(FeatureExtractorMLP, self).__init__() self.network nn.Sequential( nn.Linear(input_dim, hidden_dim), nn.ReLU(), nn.Linear(hidden_dim, hidden_dim), nn.ReLU(), nn.Linear(hidden_dim, latent_dim) # 输出潜特征维度与量子比特数对齐 ) def forward(self, x): # x: [batch_size, input_dim] latent_features self.network(x) # [batch_size, latent_dim] return latent_features训练要点损失函数由于是分类任务的前置特征提取MLP需要与后续分类器联合训练端到端或者先使用一个简单的分类头如接一个Softmax层进行预训练。论文采用的是端到端训练即MLP和VQC的参数一起更新。输出规范化MLP输出的潜特征需要被缩放至[0, π]区间以适应量子旋转门的角度输入。这通常在数据传入量子电路前通过一个简单的线性缩放层完成。3.3 量子分类器VQC的核心编码与变分电路这是整个项目的量子核心我们使用Qiskit作为量子编程框架。VQC主要由三部分组成特征编码Feature Map、变分电路Ansatz和测量Measurement。第一步特征编码ZZFeatureMap将经典的4维潜特征向量θ [θ1, θ2, θ3, θ4]编码到4个量子比特的态上。论文选用的是ZZFeatureMap。from qiskit.circuit.library import ZZFeatureMap num_qubits 4 feature_map ZZFeatureMap(feature_dimensionnum_qubits, reps2, entanglementfull) # reps2 表示编码层重复两次增加非线性表达能力。ZZFeatureMap的工作方式可以简单理解为首先对每个量子比特i施加一个RZ(θ_i)旋转然后让每对量子比特(i, j)之间通过ZZ门发生相互作用。这种相互作用引入了特征之间的纠缠相当于在量子态中创建了特征的非线性组合这是量子优势的可能来源之一。第二步变分电路Ansatz选择与构建Ansatz是带有可训练参数φ的量子电路其作用是“搅拌”编码后的量子态将其变换到有利于分类测量的状态。论文对比了两种标准结构RealAmplitudes由交替的RY旋转层和线性纠缠层CNOT门构成。结构相对简单参数较少训练速度快但表达能力可能有限。EfficientSU2由更通用的旋转层包含RX, RY, RZ和纠缠层构成。参数更多结构更复杂理论上具有更强的表达能力和拟合复杂函数的能力。from qiskit.circuit.library import RealAmplitudes, EfficientSU2 # 选择一种Ansatz并确定重复次数(reps) ansatz_reps 4 # 论文中在中等规模数据集上最佳配置 ansatz EfficientSU2(num_qubitsnum_qubits, repsansatz_reps, entanglementlinear) # entanglementlinear 表示最近邻纠缠如 qubit0-qubit1-qubit2-qubit3这降低了电路深度适合NISQ设备。第三步测量与经典后处理最后我们需要测量量子态以获得经典信息。对于三分类任务论文采用了一种巧妙的方法在4个量子比特上测量计算基态Z方向测量会得到一个4位的比特串如‘0101’将其转换为十进制整数z然后通过y z mod 3映射到0, 1, 2三个类别标签上。另一种更常见的做法是为每个类别设置一个观测量例如对某个特定的量子比特子集进行Z测量但取模法在比特数不多时是一种简洁的实现。完整量子电路构建from qiskit import QuantumCircuit # 创建参数 feature_params feature_map.parameters ansatz_params ansatz.parameters # 构建完整电路 qc QuantumCircuit(num_qubits) qc.append(feature_map, range(num_qubits)) # 编码层 qc.append(ansatz, range(num_qubits)) # 变分层 qc.measure_all() # 测量所有量子比特3.4 混合训练流程与参数优化将MLP和VQC连接起来形成一个可端到端训练的混合模型。这里的关键是梯度计算。前向传播输入经典数据x经过 MLP得到潜特征z。z被缩放到[0, π]作为角度参数传入feature_map。量子电路执行进行多次“射击”shots模拟得到测量结果的计数分布。根据分布计算每个类别的期望值例如通过上述取模法统计各类别出现的频率再通过Softmax函数得到预测概率y_pred。损失计算与反向传播使用交叉熵损失函数比较y_pred和真实标签y_true。经典部分MLP参数梯度可以通过标准的自动微分Autograd计算。量子部分Ansatz参数梯度无法直接通过常规反向传播计算。要使用参数移位规则Parameter-shift Rule。这是一种用于含参数量子电路求导的精确方法其思想类似于数值微分但对量子电路是精确且高效的。幸运的是Qiskit等框架已经内置了这些梯度计算例程。优化器论文使用了COBYLA约束优化线性近似优化器。这是一个无梯度优化器它不显式使用梯度信息而是通过迭代采样来寻找最优解。这在量子机器学习早期研究中很常见因为对于某些复杂的量子电路或噪声环境梯度估计可能不稳定。COBYLA相对稳健但可能收敛较慢。在实践中也可以使用基于参数移位规则计算的梯度配合Adam等自适应优化器这可能收敛更快。# 伪代码示意混合训练循环 for epoch in range(num_epochs): for x_batch, y_batch in dataloader: # 1. 前向传播 latent mlp(x_batch) # MLP提取特征 scaled_latent scale_to_pi(latent) # 缩放 # 将 scaled_latent 作为参数绑定到feature_map与ansatz参数一起传入量子电路执行 expectation_values quantum_circuit_executor(scaled_latent, ansatz_params) probs softmax(expectation_values) loss cross_entropy(probs, y_batch) # 2. 反向传播与优化 optimizer.zero_grad() # 混合梯度计算MLP部分用autogradVQC部分用参数移位规则 loss.backward() # 这里需要框架支持混合梯度计算 optimizer.step()4. 实验结果深度分析与工程启示论文提供了详实的实验数据我们不仅要看“结果是什么”更要理解“结果为什么是这样”以及它能给我们未来的工程实践带来哪些启示。4.1 性能对比经典、量子与混合的“三国演义”让我们用一张表来清晰对比三个模型在两个数据集上的表现模型小规模数据集 (3000样本)中等规模数据集 (4500样本)核心特点与问题经典MLP98.0% ± 0.8%98.6% ± 0.4%性能天花板。表现极其稳定且准确率高方差极小。证明了对于此类规模和数据经典方法已近乎完美。纯量子VQC61.8% ± 2.5%61.9% ± 1.5%性能地板。准确率低但方差也小。这说明性能差不是偶然波动而是模型结构或优化存在根本性局限如“贫瘠高原”问题。混合MVQC75.5% ± 11.2%80.5% ± 11.0% (峰值91.4%)潜力股。性能显著优于纯量子但逊于经典。关键观察是方差极大且峰值性能(91.4%)非常接近经典模型。核心洞察混合架构的有效性MVQC相比VQC的平均提升接近20个百分点这强力证明了经典特征提取对量子模型的“引导”和“稳定”作用。MLP像一个经验丰富的向导把VQC带到了一个更易学习的起跑线上。方差的秘密MVQC巨大的性能方差±11%是一把双刃剑。坏处是模型不稳定难以部署。好处是它揭示了混合模型拥有达到更高性能的潜力峰值91.4%只是目前的训练方法如优化器、参数初始化无法稳定地找到那个最优解。这指明了未来的改进方向改进量子部分的训练策略。“贫瘠高原”问题纯VQC的低性能且低方差是量子机器学习中著名的“贫瘠高原”现象的典型表现。随着电路参数增多损失函数的梯度在绝大多数区域变得指数级接近于零导致优化算法陷入停滞。MLP的预处理可能通过提供结构化的输入部分缓解了这个问题使优化景观变得稍微“友好”一些。4.2 Ansatz选择RealAmplitudes vs. EfficientSU2论文中另一个重要对比是两种变分电路结构的表现。Ansatz类型训练特点小规模数据集最佳测试精度稳定性RealAmplitudes收敛快但容易陷入局部最优67.5%差方差大EfficientSU2收敛慢但能找到更优解83.5% (reps2)相对更好工程选择建议追求快速原型验证可以先用RealAmplitudes因为它参数少训练快能快速验证流程是否跑通。追求最佳性能应选择EfficientSU2。它更复杂的旋转门集合提供了更强的表达能力能刻画更复杂的决策边界。虽然训练慢但结果往往更好。关于reps重复次数这不是越多越好。增加reps会增加电路深度和参数可能提升表达能力但也可能加剧噪声在真实硬件上和优化难度。论文中在中等规模数据集上EfficientSU2在reps4时取得最佳效果这是一个需要根据具体任务进行超参数调优的点。4.3 从仿真到现实无法回避的NISQ挑战论文所有实验均在无噪声的态矢量模拟器上完成。这相当于在理想真空环境中测试发动机性能。一旦放到真实量子硬件上挑战接踵而至噪声量子门操作不完美、测量有误差、量子比特会退相干。这些噪声会迅速湮灭计算中脆弱的量子相干性导致结果不可信。有限的比特与连通性当前云量子计算机可能只提供几个可用的、质量尚可的量子比特且它们之间的连接方式拓扑结构受限。论文中使用的线性最近邻纠缠就是为了适配这种硬件约束。电路深度限制由于退相干时间能可靠执行的量子门数量有限。复杂的EfficientSU2ansatz 在真实设备上可能无法运行。面向真实硬件的工程化思考误差缓解采用零噪声外推、测量误差校准等技术在硬件层面尽量补偿噪声。编译优化将逻辑电路编译到特定硬件的原生门集和拓扑结构上并优化门序列以减少深度和错误率。噪声感知训练在训练过程中就模拟或引入硬件噪声模型让模型学会在噪声中保持鲁棒性。算法-硬件协同设计未来可能需要为特定问题如交通分类设计专用的、更浅更抗噪的量子电路结构Ansatz而不是使用通用模板。5. 常见问题、避坑指南与未来展望基于这项研究和自身经验我总结了一些在实践混合量子-经典模型时必然会遇到的坑以及如何绕开它们。5.1 实操中可能遇到的问题与排查训练不收敛或震荡剧烈可能原因量子电路参数初始化不佳优化器选择不当如学习率过大经典特征提取器输出范围不合适导致编码角度超出合理范围。排查步骤检查数据流确保MLP输出特征经过缩放后确实在[0, π]内。可视化其分布。简化问题先用一个极小的、人造的、线性可分的数据集测试整个流程确保代码逻辑正确。调整优化器尝试使用更稳健的优化器如COBYLA虽然慢或者使用较小的学习率并配合梯度裁剪。尝试不同的Ansatz和初始化换用RealAmplitudes或更简单的电路使用不同的参数初始化策略。量子模拟速度极慢可能原因使用基于射影的模拟器qasm_simulator且射击次数shots设置过高电路深度reps太大批处理batch数据时未做优化。优化策略开发阶段使用态矢量模拟器statevector_simulator可以精确计算期望值无需采样速度快适合调试和初步训练。合理设置shots对于训练评估期望值不需要极高的shots如1024或2048次通常足够。仅在最终验证时增加shots以提高精度。利用批处理与并行Qiskit Runtime等服务支持将多个电路任务批量提交到云端执行能大幅提升数据吞吐量。混合模型性能始终不如纯经典模型理性看待这在当前NISQ时代是完正常的甚至是预期的。论文中MLP达到98.6%MVQC峰值91.4%这7个百分点的差距就是当前量子硬件和算法不成熟需要付出的“代价”。混合模型的价值不在于立即超越经典SOTA而在于探索可能性验证量子组件在流程中是否发挥了积极作用MVQC vs VQC。为未来铺路建立混合编程范式一旦量子硬件取得突破整个流程可以无缝衔接。寻找优势场景可能在数据维度极高、结构极其复杂如图数据、量子化学且经典模型遇到瓶颈的问题上混合模型能更早显现优势。5.2 未来研究方向与个人思考这项研究为我们打开了几扇门也留下了许多有待探索的房间更智能的特征交互当前MLP是通用的。是否可以设计一个专门针对时空交通数据的经典特征提取器例如先用图神经网络GNN处理路网拓扑关系提取空间特征再输入给量子分类器。这将是向真正的“时空量子混合模型”迈进的一大步。训练策略的革新MVQC巨大的性能方差指向了训练过程的脆弱性。需要研究更适合混合模型的优化算法、初始化方法、学习率调度策略甚至元学习方法来寻找更稳定的训练路径。轻量化与部署如何将训练好的混合模型部署到真实的、资源受限的边缘计算设备如交通信号机需要考虑模型蒸馏、量子电路编译优化、以及经典部分的轻量化如使用小型CNN或Transformer替代MLP。超越分类回归与预测本文聚焦分类。交通领域更核心的需求是流量预测回归问题。如何将混合架构应用于时间序列预测可能需要结合量子LSTM或量子注意力机制这将是更具挑战性也更有价值的方向。我个人最深的体会是量子机器学习的工程化正处在一个从“为什么”到“怎么做”的关键过渡期。像MVQC这样的工作其最大贡献不在于提供了一个现成的、超越经典的解决方案而在于提供了一套完整的、可复现的方法论框架如何为量子模型准备数据、如何设计混合接口、如何设置评估基准。它告诉我们通往实用化的道路不是一蹴而就的魔法而是需要这样一次次的、扎实的、有正有负的实验迭代。作为从业者我们不必纠结于今天是否超越了ResNet而应专注于理解这些工具搭建这些管道并在自己熟悉的领域如交通、金融、材料寻找那些可能从量子特性中获益的、特定的子问题。当量子硬件准备好的那一天这些积累下的工程经验将是最宝贵的财富。