PTI-TSE:破解简化相干光通信中IQ偏斜估计难题的低复杂度算法 1. 项目概述为什么IQ偏斜成了简化相干系统的“阿喀琉斯之踵”在数据中心互联、5G前传这些短距高速光通信场景里我们这些搞系统设计的每天都在和成本、功耗、性能这三个“神仙”打架。传统相干光通信性能是好但那个复杂的双平衡探测接收机和后面跟着的一连串数字信号处理算法功耗和成本在短距离场景里显得有点“杀鸡用牛刀”。于是简化相干系统就成了这几年的香饽饽特别是结合了Alamouti空时编码和单平衡光电探测器接收的方案硬件成本能降到传统方案的1/4听起来就让人心动。但天下没有免费的午餐。这种简化架构引入了一个新的“命门”对发射机IQ偏斜IQ Skew的极端敏感。IQ偏斜是什么简单说就是I路和Q路信号在调制器或者驱动电路里由于路径长度、器件响应速度不同产生的那一点点时间差。在普通系统里这点偏斜可能只是让星座图稍微旋转一下用均衡算法还能救回来。但在我们用的数字子载波复用和Alamouti编码这套组合拳里这点偏斜就成了大麻烦。你想啊DSCM把高速信号拆成多个并行的低速子载波频谱效率是高了但IQ偏斜会直接导致对称子载波之间的频谱混叠信号自己跟自己打架。更棘手的是Alamouti编码它本质是一种空时编码核心就是靠信号在时间和偏振维度上的正交性来对抗信道损伤。IQ偏斜恰恰破坏了这种正交性就像木桶最短的那块板直接决定了系统性能的上限。而且在单偏振探测的简化接收机里X和Y偏振的信号是耦合在一起进来的它们各自的IQ偏斜还不一样这给精确估计和校准带来了巨大挑战。之前很多针对双偏振探测系统的估计方法在这里直接“哑火”。所以搞出一套能在这种简化、耦合、高敏感场景下精确估计双偏振IQ偏斜的方法就成了推动这项技术落地的关键一步。今天要聊的PTI-TSE方法就是我们团队针对这个痛点提出的一套解决方案。2. 核心思路拆解PTI-TSE如何“四两拨千斤”面对X和Y偏振IQ偏斜不同、信号在接收端耦合、还有子载波混叠这几个“拦路虎”常规思路可能是上更复杂的MIMO均衡或者迭代算法但那又违背了“简化”的初衷增加了DSP的复杂度和功耗。我们的目标很明确要用尽可能简单、确定性的计算实现高精度的估计。PTI-TSE偏振时间交织双子载波估计方法的精髓就藏在它的名字和训练序列的设计里。2.1 破局点一用共轭对称性“封印”频谱混叠IQ偏斜在频域的表现是会给信号引入一个与频率成正比的线性相位。对于一对对称的子载波比如频率为f和-f的子载波这个相位是相反的。如果我们在这两个子载波上发送的训练序列满足共轭或负共轭关系那么在接收端进行特定运算后由IQ偏斜引起的、来自对称子载波的干扰项就能被完美抵消。这就好比两个振幅相等、相位相反的波叠加在一起互相抵消了。这是我们方法能成立的理论基石它从根本上避免了子载波间混叠对估计精度的影响。2.2 破局点二用时间交织“剥离”偏振耦合在单偏振探测的简化接收机里我们收到的是X和Y偏振信号的混合体。要想分别估计出ΔτX和ΔτY必须先把它们分开。这里我们没有用复杂的偏振解复用算法因为IQ偏斜本身会破坏Alamouti解码的条件而是采用了更“物理”的方法——时间交织。我们在训练序列的结构上做文章让X偏振的信号和Y偏振的信号在不同的时间块上发送。具体来说在估计X偏振偏斜的时间段内Y偏振对应的信号块被置为零反之亦然。这样在特定的时间窗口内接收机收到的实质上就是单个偏振的信号巧妙地实现了偏振解耦。这种思路非常巧妙用序列设计的智慧替代了复杂的实时信号处理。2.3 破局点三用双子载波相位差“抵消”公共相位噪声激光器的相位噪声和残余频偏是相干光通信中永远的“背景音”。它们会给信号叠加一个时变的公共相位如果直接用来计算偏斜结果会飘得厉害。PTI-TSE的第三个巧思是引入了“双子载波”的概念。我们选择频谱同一侧、频率相邻的两个子载波例如f1和f2并在其上放置完全相同的训练序列。由于这两个子载波频率非常接近它们经历的激光器相位噪声和残余频偏几乎是完全相同的。当我们计算这两个子载波响应值的相位差时这些公共的相位扰动项就被减掉了剩下的相位差只与频率差f2-f1以及我们想要的IQ偏斜有关。这就好比用一把差分尺只测量我们关心的那个微小长度而忽略掉尺子本身的整体移动。把这三点结合起来PTI-TSE的流程就清晰了设计一种在对称子载波上共轭/负共轭、在偏振间时间交织、在双子载波上相同的特殊训练序列。接收后在特定时间窗提取单个偏振的信号在频域计算双子载波的相位差最后从这个相位差中解算出IQ偏斜值。整个计算过程主要是几次小规模的FFT和一些复数除法是确定性的、非迭代的复杂度极低。3. 训练序列设计与核心算法推导光有思路不够还得能落地。PTI-TSE的核心是一套精心设计的训练序列和与之配套的估计算法。这里我把设计中的关键细节和背后的考量掰开揉碎了讲。3.1 训练序列的“交响乐”总谱我们的训练序列是针对一个四子载波的DSCM系统设计的。假设四个子载波频率为f1, f2, f3, f4其中f1和f4关于零频对称f2和f3关于零频对称。序列在时域上分成多个块Block。序列结构规则如下对称子载波关系对于像f1和f4这样的对称子载波对它们承载的训练序列在奇数块满足共轭关系在偶数块满足负共轭关系。即S4(odd) conj(S1(odd)),S4(even) -conj(S1(even))。对于f2和f3也是同样规则。偏振时间交织整个训练序列周期内并非所有块都同时包含X和Y偏振的数据。我们将其划分成不同的时间段。例如前N个符号块可能只包含X偏振的数据Y偏振部分置零用于估计X偏振的IQ偏斜随后的N个符号块则只包含Y偏振的数据用于估计Y偏振的偏斜。这就实现了在时间上对偏振的分离。双子载波一致性为了消除公共相位噪声我们规定f1和f2位于频谱同一侧这两个“双子载波”上承载的训练序列完全相同即S2 S1。f3和f4的关系亦然。序列内容选择每个块内的符号我们选择使用CAZAC序列。这种序列具有恒包络、零自相关旁瓣的特性对频偏和相位噪声不敏感在接收端做同步、信道估计时有天然优势能提升后续处理的鲁棒性。注意这里有一个非常重要的实践细节。在发送用于偏斜估计的训练序列时需要暂时关闭Alamouti编码。因为Alamouti编码依赖于两个偏振通道在特定时间窗口内满足正交关系而我们现在人为地让其中一个偏振在某个时间段为零这破坏了编码的前提。因此在实际系统帧结构中训练序列和承载数据的Alamouti编码载荷序列是分开发送的。先发训练序列完成偏斜估计和预补偿再发经过补偿后的数据载荷。3.2 从接收信号到偏斜值的数学“解码”假设我们现在处于估计X偏振偏斜的时间窗口Y偏振信号为零。经过单偏振外差接收、下变频、匹配滤波后对于子载波1f1我们得到I路和Q路的接收信号。经过前面所述的对称子载波共轭设计来自对称子载波f4的混叠干扰被抵消。信号可以简化为只包含X偏振在f1上的分量并且分别携带了I路延时τ_XI和Q路延时τ_XQ。关键的一步是转到频域。对I路和Q路的接收信号分别做FFT得到频域响应RX1_I(w)和RX1_Q(w)。由于激光器相位噪声的影响它们会与相位噪声的频谱Λ(w)卷积。但别急我们的“双子载波”设计要发挥作用了。对于子载波2f2因为其序列与子载波1相同且经历相同的信道和损伤其频域响应RX2_I(w)和RX2_Q(w)与子载波1的响应具有相似的形式并且包含了相同的相位噪声项和残余频偏项。现在进行核心计算我们分别计算Q路和I路上子载波1与子载波2的频域响应之比。H_Q(w) RX1_Q(w) / RX2_Q(w)H_I(w) RX1_I(w) / RX2_I(w)在做这个除法时由于两个子载波经历了几乎完全相同的相位噪声Λ(w)和残余频偏Δf这些公共项在比值中被约掉了这是整个算法鲁棒性的关键。剩下的比值主要包含了由频率差f2 - f1和IQ偏斜差τ_XQ - τ_XI决定的相位项。最终X偏振的IQ偏斜可以通过以下公式提取τ_X [ arg(H_Q(w)) - arg(H_I(w)) ] / [ 2π * (f2 - f1) ]其中arg(·)表示取复数的相位角。这个公式直观地理解就是Q路和I路的相位差除以子载波间的角频率差得到的就是时间差也就是IQ偏斜。Y偏振的偏斜估计完全同理只需切换到Y偏振信号不为零的时间窗口重复上述过程即可。3.3 复杂度分析为什么说它是“轻量级”的我们常说的算法复杂度在硬件实现如ASIC或FPGA中最关心的是乘法器资源消耗因为乘法运算比加法耗电、占面积得多。PTI-TSE的复杂度主要来自几部分FFT运算对于单个偏振需要对4个数据块例如X偏振的I路和Q路在子载波1和2上的数据做FFT。假设每个块做N点FFT使用基2-FFT算法复杂度约为4 * (N/2 * log2(N))次复数乘法对应4 * 4 * (N/2 * log2(N)) 8N log2(N)次实数乘法一次复数乘法相当于4次实数乘法。频域比值计算计算两个复数比值并求相位这需要复数除法。对于I路和Q路共需计算2个比值。每个复数除法可通过若干次实数乘法和加法实现其开销与N成正比约为4 * 2 * N 8N次实数乘法此处为简化估计实际除法可通过乘法实现。最终偏斜计算根据公式计算相位差并除以常数只需几次实数乘法和加减法可忽略不计。因此总复杂度大约为8N log2(N) 8N次实数乘法针对单偏振。对于典型的N128这个值大约是8*128*7 8*128 7168 1024 8192次。估计双偏振也只需约1.6万次实数乘法。这与那些需要大规模矩阵求逆或迭代更新的自适应MIMO均衡算法复杂度常在O(N^2)或更高相比低了不止一个数量级。这种低复杂度使得PTI-TSE非常适合在资源受限的短距光模块DSP芯片中实时实现。4. 仿真验证在虚拟世界中“拷问”算法鲁棒性理论很美但实际系统充满不完美。我们在投入真金白银做实验之前先用仿真对PTI-TSE方法进行了全方位的“压力测试”。仿真搭建了一个40-GBaud PM-QPSK DSCM over 40km SSMF的传输链路并加入了各种实际存在的损伤模型。4.1 基础性能与FFT尺寸权衡首先我们在预设X和Y偏振IQ偏斜均为6 ps的条件下测试了不同FFT大小N对估计性能的影响。结果非常有意思估计均值误差无论FFT大小从64变化到512估计误差的均值始终保持在±0.2 ps以内。这说明PTI-TSE方法本身是无偏估计其精度基础很高。估计稳定性标准差随着FFT点数N的增加估计结果的标准差明显减小。这是因为更大的FFT提供了更精细的频率分辨率对相位差的测量更准确抗噪声能力更强。N64时标准差可能在0.15 ps左右而N512时可以降到0.05 ps以下。这给了我们一个工程折衷的依据追求极致稳定性可以选大的N但计算量会增大。考虑到短距系统对延迟和功耗的敏感我们最终选择N128作为一个平衡点此时训练序列开销仅为1帧的1/64估计标准差也已足够小仿真中约0.1 ps完全满足系统要求。4.2 对抗各种“先天不足”的损伤真正的考验在于算法能否容忍发射机和信道本身的不理想特性。1. 发射机IQ不平衡IQ不平衡包括幅度不平衡α_I ≠ α_Q和相位不平衡φ ≠ 90°。这是调制器固有的缺陷。仿真中我们让幅度不平衡从0 dB变化到6 dB即Q路功率比I路高最多一倍同时相位不平衡从0°变化到30°。结果显示PTI-TSE的估计均值误差依然稳如泰山保持在±0.2 ps内。这是因为在我们的推导公式中幅度和相位不平衡因子在计算两个子载波的比值时被消除了。不过一个细微的发现是当幅度不平衡非常严重时例如4 dB估计结果的标准差会有所增大。这是因为在IQ不平衡严重的情况下I路和Q路信号本身的功率差异很大其中功率较低的一路信噪比更差从而引入了更大的测量噪声。但这并不影响算法的无偏性。2. 激光器线宽激光器的相位噪声由其线宽决定。线宽越大相位抖动越快对相位敏感的相干系统影响越大。我们将激光器线宽从理想的100 kHz一路增加到3 MHz这是很多低成本DML激光器的典型值。令人振奋的是PTI-TSE的估计精度几乎没有恶化。这完美验证了“双子载波”设计消除公共相位噪声的有效性。只要两个子载波靠得足够近它们经历的相位噪声就是高度相关的比值运算就能将其抵消。这个特性使得PTI-TSE方法能够兼容低成本、大线宽的激光器这是走向实际应用的关键优势。3. 偏振态旋转在单偏振探测系统中接收到的信号功率是入射信号在接收机偏振主轴上的投影。如果传输链路中的偏振态不断旋转接收到的X和Y偏振的信号功率比例就会实时变化。仿真中我们改变偏振旋转角。发现一个规律当偏振旋转角接近0°即信号几乎全是X偏振时Y偏振的信号功率极低导致对Y偏振IQ偏斜的估计误差会变大反之当接近90°时X偏振的估计误差会变大。这其实非常符合物理直觉你要测量一个信号的参数首先得能“看”清这个信号。当某个偏振的信号功率太弱时它被淹没在噪声里估计自然不准。但这里有一个至关重要的工程洞见这种因SOP导致的估计误差增大对系统最终性能的影响可能远没有想象中严重。我们进一步仿真了在不同偏振旋转角下残留一定IQ偏斜例如0.7 ps这接近估计误差的最大值时带来的系统信噪比 penalty。结果发现即使在偏振旋转导致某一偏振估计误差较大的情况下系的信噪比劣化也小于0.02 dB。这意味着PTI-TSE方法即使在最不利的SOP下其估计结果也足以将IQ偏斜补偿到一个对系统性能影响可忽略的水平。在实际系统中SOP的变化是相对缓慢的毫秒量级而我们的训练序列可以周期性地发送微秒量级因此总能捕捉到SOP相对“友好”的时刻进行高精度估计或者采用多次估计取平均等策略来平滑SOP的影响。5. 实验实录在真实光纤上验证±0.2 ps精度仿真给了我们信心但真正的试金石是实验。我们搭建了一套完整的40-GBaud PM-QPSK DSCM 传输实验系统。实验设置关键点发射端用任意波形发生器产生包含我们特殊设计的训练序列和Alamouti编码数据载荷的基带电信号。IQ偏斜是通过AWG软件在数字域预先精确设置的这为我们提供了评估算法精度的“金标准”。信号通过一个DP-IQ调制器调制到1550 nm的光载波上。传输链路经过40公里标准单模光纤用可调光衰减器控制接收光功率。简化接收端核心是一个单平衡光电探测器进行外差接收。本振激光器与发射激光器有固定的频偏。接收到的电信号由高速数字存储示波器采集进行离线DSP处理。DSP流程重采样、下变频、色散补偿、残余频偏补偿、子载波解复用、帧同步、匹配滤波最后应用我们的PTI-TSE算法进行偏斜估计。5.1 偏斜估计精度测试我们首先对系统进行了初始校准然后将发射端的IQ偏斜从1 ps到6 ps逐步设置。对于每一个预设值我们用PTI-TSE方法进行估计。实验结果如图所示数据以图表形式呈现此处用文字描述估计值与预设值高度吻合在整个1-6 ps范围内估计出的偏斜值几乎完全落在理想的对角线上。误差统计对于X和Y两个偏振所有测试点的估计误差估计值-预设值均落在±0.2 ps的区间内。这以实验数据强有力地证明了PTI-TSE方法在实际系统中的高精度。5.2 对抗残余频偏的鲁棒性测试在实际的相干接收中尽管有频偏补偿算法但总会存在少量的残余频偏。我们特意在系统中引入了高达500 MHz的残余频偏然后测试PTI-TSE在1 ps和4 ps两种偏斜设置下的估计误差。结果非常稳健即使存在500 MHz的巨大残余频偏估计误差依然被牢牢控制在±0.2 ps以内。这再次验证了“双子载波”相位差法消除公共相位扰动的强大能力。残余频偏在频域体现为所有子载波一个相同的线性相位旋转而这个旋转在计算双子载波比值时被减掉了。6. 实操心得与避坑指南基于大量的仿真和实验我总结出几个在工程化实现PTI-TSE时必须注意的关键点这些是论文里不会细写但能让你少走弯路的经验。1. 训练序列与数据帧的编排策略隔离发送训练序列和Alamouti编码的数据载荷必须分时发送中间要有足够的保护间隔。因为在训练序列时段你需要关闭Alamouti编码并可能让其中一个偏振静默。如果混在一起会相互干扰。周期插入IQ偏斜会随温度、器件老化缓慢漂移。训练序列应以一定周期例如每几千个数据符号插入一次插入帧中实现跟踪和自适应补偿。周期太短开销大周期太长跟踪不上漂移。需要根据器件稳定性折衷。同步头设计训练序列本身CAZAC序列可以作为帧同步的引导序列实现一举两得。在DSP流程中先做帧同步找到训练序列的起始点再进行偏斜估计。2. FFT点数与估计速度的权衡N128是个甜点对于40-100 GBaud量级的系统128点FFT在精度和复杂度之间取得了很好的平衡。点数再少如64估计噪声会明显增大点数再多如256或512计算延迟和功耗增加但对精度的提升边际效应递减。平均降噪如果系统对瞬时噪声特别敏感可以对连续多个训练帧的估计结果进行滑动平均能有效平滑随机噪声进一步提升估计稳定性代价是引入一定的补偿延迟。3. 关于偏振态问题的工程处理不必过度焦虑仿真和实验都表明即使因SOP导致某一偏振估计瞬时误差稍大其对系统最终性能的影响也微乎其微。这是因为残留的少量偏斜0.2 ps在现代DSP均衡器容忍范围内。设置质量门限可以在算法中增加一个简单的判断逻辑计算接收到的训练序列总功率或两个偏振通道的功率比。当某一偏振功率低于某个阈值例如比另一偏振低20 dB以上时可以认为当前SOP下对该偏振的估计不可靠可以选择不更新该偏振的偏斜补偿值而是沿用上一次的可靠估计值。SOP是时变的稍等片刻下一个训练帧到来时SOP很可能已经变得有利于估计。4. 与其他DSP模块的协同频偏补偿需在先虽然PTI-TSE对残余频偏鲁棒但前提是残余频偏不能大到引起子载波间串扰ICI。因此在子载波解复用之前必须进行初步的、粗频偏补偿将残余频偏控制在子载波间隔的很小比例内例如1%。我们的实验验证了500 MHz残余频偏下仍能工作这已经给了频偏补偿算法很大的容限。与均衡器的关系PTI-TSE估计出的偏斜值可以用于在时域或频域对发射信号进行预补偿也可以在接收端作为后补偿。通常预补偿更好因为它从源头消除了损伤。补偿后后续的偏振解复用、载波相位恢复等DSP模块会工作得更轻松系统整体性能更优。这个方法的价值在于它用巧妙的序列设计和简洁的确定性计算解决了简化相干系统中的一个关键校准难题。它不追求大而全的通用性而是针对特定架构Alamouti 单PD DSCM的痛点给出了一个高效、精准的解决方案。这种思路在追求极致成本效益的短距光互联领域尤其具有吸引力。