动态子阵列混合预编码:毫米波大规模MIMO中性能与效率的平衡之道 1. 项目概述毫米波大规模MIMO中的混合预编码挑战与动态子阵列机遇在5G及未来6G移动通信的演进蓝图中毫米波频段因其丰富的频谱资源被视为突破容量瓶颈的关键。然而毫米波信号在传播中面临严重的路径损耗这需要大规模多输入多输出技术来提供巨大的阵列增益进行补偿。但问题随之而来为成百上千根天线中的每一根都配备一套独立的射频链路和数模转换器其硬件成本、功耗和系统复杂度将高到无法承受。这就是混合预编码技术诞生的背景它通过在模拟域使用低成本、低精度的移相器进行波束成形在数字域使用少量射频链路进行高维信号处理从而在逼近全数字预编码性能的同时大幅降低硬件开销。传统的混合预编码架构主要有两种全连接架构和部分连接架构。全连接架构中每根天线都通过移相器连接到所有射频链路性能最优但移相器和射频合路器数量庞大能效低下。固定子阵列架构则简单地将天线均匀分组每组固定连接一个射频链路硬件最简单但牺牲了波束成形的灵活性性能损失显著。那么有没有一种方案能兼顾性能与效率动态子阵列架构应运而生。它允许根据实时的信道状态信息动态地将天线元素划分给不同的射频链路从而在硬件复杂度和系统性能之间取得一个巧妙的平衡。本文要探讨的正是在这种动态子阵列架构下如何为多个用户同时服务设计高效的混合预编码方案这是一个在学术界和工业界都极具挑战性的前沿课题。2. 系统模型与核心问题拆解2.1 毫米波大规模MIMO系统模型我们考虑一个典型的毫米波大规模MIMO下行链路多用户通信场景。基站装备有NTX根发射天线但受限于成本和功耗只配备了NRF条射频链路且NRF远小于NTX。同时基站需要服务K个单天线或多天线用户并且K ≤ NRF即服务的用户数不能超过射频链路数。信号传输过程可以概括为数字基带预编码器FBB首先对K个用户的发送符号向量s进行处理然后经过模拟预编码器FRF最终通过天线阵列发射出去。接收端用户k收到的信号可以表示为yk Wk Hk FRF Fk_BB sk Σ_{i≠k} Wk Hk FRF Fi_BB si Wk nk其中Hk是基站到用户k的信道矩阵nk是加性高斯白噪声。公式第一项是期望信号第二项是多用户干扰。Wk是用户端的接收合并向量在本文的设定中通常取为信道矩阵Hk左奇异矩阵的共轭转置以最大化接收信噪比。这里的关键在于模拟预编码矩阵FRF。由于其元素由移相器实现因此每个元素的模值必须恒定通常为1这构成了一个非凸的恒模约束。数字预编码矩阵FBB则需满足总发射功率约束。2.2 动态子阵列架构的精髓动态子阵列是部分连接架构的一种高级形式。与固定子阵列每个射频链路固定连接一组相邻或交织的天线不同动态子阵列打破了这种僵化的连接关系。其核心思想是根据长期或实时的信道状态信息动态地将NTX根天线划分成NRF个子集每个子集连接一个射频链路。这意味着服务于用户A的天线子集和用户B的天线子集其天线成员和数量都不是固定的而是随着信道条件变化而自适应调整。用数学语言描述模拟预编码矩阵FRF是一个块对角矩阵非对角线元素为零其非零块FSr_RF对应第r个射频链路所连接的子阵列Sr的模拟预编码向量。子阵列集合S {S1, S2, ..., SNRF}满足所有子集互不相交且并集为全部天线。子阵列的大小Nr也是可变的只要满足总和为NTX即可。这种灵活性正是动态子阵列性能优于固定子阵列的根本原因——它能更好地匹配信道的空间特性。2.3 信道模型稀疏性是关键毫米波信道的一个显著特征是空间稀疏性。由于高频信号的传播特性信号主要经由少数几条路径如直射径和少数强反射径到达接收端。因此广泛采用基于几何的稀疏信道模型。对于用户k其信道矩阵Hk可以建模为多条路径的叠加Hk sqrt(NTX * NRX / Lk) * Σ_{l1}^{Lk} α_{k,l} * a_MS(θ_{k,l}) * a_BS^H(φ_{k,l})其中Lk是路径数通常很小比如3-5条α_{k,l}是第l条路径的复增益θ_{k,l}和φ_{k,l}分别是到达角和离开角。a_MS和a_BS是接收端和发射端的阵列响应向量。对于均匀线性阵列a_BS(φ)具有范德蒙德结构其元素为[1, e^{j2πd/λ sin(φ)}, ..., e^{j(NTX-1)2πd/λ sin(φ)}]^T。这种结构化的稀疏性为低复杂度预编码算法设计提供了可能。2.4 核心优化问题一个棘手的联合优化我们的目标是在动态子阵列架构下设计模拟预编码矩阵FRF、数字预编码矩阵FBB以及天线子集划分S以最大化系统和速率{F*_RF, F*_BB, S*} argmax Σ_{k1}^K log2(1 SINR_k)约束条件包括FRF的恒模约束以及发射功率约束||FRF FBB||_F^2 K。这是一个极其复杂的联合优化问题。三个优化变量(FRF, FBB, S)高度耦合且约束条件非凸。直接求解全局最优解在计算上是不可行的属于NP-hard问题。因此必须设计低复杂度的次优算法。一个自然的思路是解耦将这个联合问题分解为几个相对独立、可顺序求解的子问题例如先设计初始模拟预编码再进行用户选择接着进行动态天线划分最后优化混合预编码。这正是本文所提出框架的核心思路。注意在实际系统设计中这种解耦策略是平衡性能与复杂度的常用手段。虽然会损失一部分最优性但能获得可行的实时算法。关键在于如何设计每个子问题的优化准则使得分步优化的结果尽可能接近联合优化的目标。3. 提出的多用户混合预编码框架详解面对上述挑战本文提出了一套完整的、面向动态子阵列的多用户混合预编码解决方案。该框架将复杂的联合优化问题分解为四个逻辑清晰、可顺序执行的步骤模拟预编码初始化、多用户选择、动态子阵列划分、以及针对划分后架构的混合预编码优化。下面我们逐一深入剖析。3.1 模拟预编码初始化利用信道的方向性毫米波信道的空间稀疏性意味着每个用户的信道能量主要集中在一个或几个主要波束方向上。因此第一步是为每个候选用户寻找其“最佳波束”。这个过程通常通过波束训练完成基站使用预定义的模拟预编码码本F例如基于离散傅里叶变换的码本中的各个码字依次发送参考信号用户测量接收信号功率并将功率最大的码字索引反馈给基站。这个码字即用户k的初始模拟预编码向量fo_k通过求解下式获得fo_k argmax_{b_q ∈ F} ||H̃_k b_q||_F^2其中H̃_k W_k H_k是等效信道。这一步的本质是让每个用户先独立地找到能最大化自身接收功率的模拟波束为后续的多用户调度和干扰管理提供基础信息。实操心得码本设计至关重要。常用的DFT码本虽然简单但在角度分辨率上有限。在实际系统中可能会采用过完备码本或基于压缩感知的码本以更精细地捕捉信道的角度信息。此外波束训练会带来额外的信令开销需要在系统设计时权衡训练精度与开销。3.2 多用户选择最大化系统和速率当基站同时服务多个用户时用户间的信道相关性会带来严重的多用户干扰。多用户选择的目的就是从众多候选用户中挑选出一组信道方向尽可能“正交”的用户使得他们在共享相同时频资源时相互干扰最小。本文采用的是一种贪婪用户选择算法。其核心思想是逐步将能带来最大系统和速率增量的用户加入服务集合。算法开始时服务用户集U为空候选用户集T包含所有用户。首先选择信道增益最大的用户作为第一个服务用户。然后在每一轮迭代中从剩余候选用户里选择这样一个用户将其加入当前服务集后根据现有用户的初始模拟预编码向量估算出的新用户信干噪比最大。具体地对于候选用户n其SINR估算为SINR_n (Pt/K * ||H̃_n fo_n||^2) / (σ_n^2 Pt/K * Σ_{i∈U} ||H̃_n fo_i||^2)选择使SINR_n最大的用户加入服务集U并从T中移除。重复此过程直到服务集中的用户数达到K即射频链路数。为什么这样有效这个准则同时考虑了“我想要什么”和“我不想要什么”。“我想要什么”体现在分子项即用户自身的信道增益“我不想要什么”体现在分母的求和项即该用户受到现有服务用户的干扰。选择SINR最大的用户意味着选择了自身信道质量好、且与已选用户干扰小的用户这直接有利于提升系统和速率。3.3 动态子阵列划分算法本文的核心创新这是整个框架中最关键、也最具挑战性的一步。在固定子阵列中天线划分是预先设定的。而在动态子阵列中我们需要根据已选多用户的信道信息动态地将NTX根天线分配给K个射频链路每个链路对应一个用户。一个最直观的想法是穷举搜索遍历所有可能的天线划分方式并计算每种划分下的系统和速率选择最优者。但天线划分的组合数是一个巨大的数字斯特林数计算复杂度是指数级的完全不具备实用性。本文提出了一个基于信干噪比最大增量准则的低复杂度贪婪算法。其核心思想非常巧妙不再一次性划分所有天线而是一根一根地分配。在分配每一根天线时都将其分配给那个能因此获得最大SINR增量的用户。算法流程详解初始化为每个服务用户k创建一个空的子阵列Sk。所有天线构成候选天线集合S0。迭代分配对于候选天线集合S0中的每一根天线j实际执行中通常按某种顺序如天线索引顺序 a. 对于每一个用户k计算如果把这根天线j加入其子阵列Sk所能带来的SINR增量∇k。∇k SINR(Sk ∪ {j}) - SINR(Sk)其中SINR(Sk)的计算基于当前子阵列Sk和用户的初始模拟预编码向量fo_k仅取Sk中天线对应的元素。 b. 找出所有用户中SINR增量最大的那个用户k*k* argmax_k ∇k。 c. 将天线j分配给用户k*Sk* Sk* ∪ {j}。 d. 将天线j从候选集S0中移除。终止当所有天线都被分配完毕算法结束输出最终的动态子阵列划分{S1, S2, ..., SK}。这个算法的精妙之处在于低复杂度计算SINR时是基于等效信道H̃_k和稀疏的fo_Sk维度大大降低。算法复杂度仅为O(K * NTX)与穷举搜索的指数复杂度相比是质的飞跃。兼顾公平与效率最大SINR增量准则天然地倾向于平衡用户间的性能。如果某个用户已经分配了很多天线其SINR基数较大再增加一根天线带来的边际收益增量可能会变小。反之天线数少的用户增加一根天线可能带来显著的SINR提升。因此算法会自动调整避免出现某个用户独占绝大多数天线的情况保证了用户间的公平性。自适应子阵列大小算法最终产生的各个子阵列大小Nk是完全由信道决定的不需要预先设定。这比固定大小的划分灵活得多。注意事项该算法是一种贪婪算法得到的是局部最优解而非全局最优。但在实际仿真中其性能非常接近穷举搜索的结果证明了该准则的有效性。此外在计算SINR增量时假设其他用户的子阵列不变这是一种近似但在低复杂度要求下是合理的。3.4 动态子阵列下的混合预编码优化完成天线划分后我们得到了每个用户对应的天线子集Sk。但这并不意味着初始的模拟预编码向量fo_k可以直接用了。因为fo_k是针对全部天线设计的而现在每个用户只能使用其子集Sk中的天线。波束的形状和宽度都可能发生变化。因此需要更新码本和重新选择模拟预编码码本更新为每个子阵列Sk生成一个新的码本F_Sk。这个码本中的每个码字b_Sk_q其定义与全阵列码本类似但只在Sk包含的天线索引位置有非零值由对应的波束方向决定在其他位置为零。模拟预编码重选在每个用户更新后的码本F_Sk中重新选择最优的模拟预编码向量F_Sk_RFF_Sk_RF argmax_{b_Sk_q ∈ F_Sk} ||H̃_k b_Sk_q||_F^2这一步确保了在给定的天线子集上仍然能获取最大的阵列增益。数字预编码设计模拟预编码主要处理波束成形和获取阵列增益而残留的多用户干扰则需要数字预编码来消除。在获得所有用户的模拟预编码后可以构建全局的模拟预编码矩阵FRF块对角矩阵。然后基于等效数字信道H̄ [H̃1 F_S1_RF, ..., H̃K F_SK_RF]^H来设计数字预编码矩阵FBB。 最常用的方法是迫零预编码F_ZF_BB H̄^H (H̄ H̄^H)^{-1}迫零预编码能完全消除用户间的干扰在理想信道信息下是最大化系统和速率的常用方法。当然也可以使用匹配滤波等更简单的方法但性能会有所损失。最后需要对FBB进行功率归一化以满足总发射功率约束。至此我们就完成了动态子阵列架构下从用户选择、天线划分到混合预编码设计的完整流程。4. 性能仿真与结果深度分析理论需要实践的检验。我们通过大量的仿真实验将提出的方案与几种基准方案进行对比以验证其有效性。基准方案包括1)全连接架构混合预编码性能上界2)固定子阵列架构混合预编码两种相邻连接和交织连接3)动态子阵列的穷举搜索算法性能上界但复杂度极高。仿真参数设置遵循领域内通用设置。基站天线数NTX为64或128用户天线数NRX2射频链路数NRF为2、4、6、8。信道采用几何模型路径数Lk3。信噪比范围通常在-10dB到10dB之间。码本采用DFT码本。4.1 和速率性能对比和速率是衡量系统频谱效率的核心指标。仿真结果清晰地展示了不同架构的性能差异。首先在NTX64, NRF2, K2的典型场景下我们提出的动态阵列方案的和速率显著优于两种固定子阵列方案。这是因为动态划分能更好地适配信道获取更多的阵列处理增益。更重要的是我们的方案性能非常接近全连接架构例如在0dB信噪比下能达到全连接架构97.8%的和速率同时大幅超越了固定子阵列增益超过7%。与动态子阵列的穷举搜索相比我们的低复杂度算法性能损失很小这证明了最大SINR增量准则的有效性。其次考察射频链路数NRF的影响。随着NRF从2增加到4、8动态子阵列相对于全连接架构的性能差距会有所增大。例如在NTX128, NRF8时动态子阵列的和速率约为全连接的91%SNR-10dB到96%SNR0dB。这很容易理解NRF越大全连接架构能进行的数字域干扰消除维度越高优势越明显而动态子阵列受限于部分连接自由度有所损失。然而这个性能损失换来了硬件上的巨大优势全连接需要NRF * NTX个移相器和NTX个射频合路器而动态子阵列仅需NTX个移相器且无需合路器。在NTX128, NRF8时这意味着移相器从1024个减少到128个并省去了128个合路器硬件复杂度和功耗大幅降低。最后观察天线数NTX增长的影响。当NTX从64增加到128、256时在所有架构下和速率都因阵列增益增加而提升。动态子阵列始终能很好地跟踪全连接架构的性能趋势并在天线数很大时如256依然能保持很高的性能比例。这表明该方案非常适合大规模天线场景。4.2 能效性能对比能效是5G/6G系统的另一个核心指标定义为系统和速率与总功耗的比值。总功耗包括发射功率、射频链路功耗和移相器功耗。仿真结果给出了更令人振奋的结论动态子阵列架构在能效上全面优于全连接架构并且也优于固定子阵列。这是因为硬件功耗大幅降低如前所述动态子阵列极大地减少了移相器数量并消除了合路器。性能损失可控虽然和速率略有损失但损失的比例远小于硬件功耗减少的比例。具体来看随着射频链路数NRF增加所有架构的能效都会下降因为射频链路功耗增加但动态子阵列的下降幅度最缓优势越来越明显。同样随着天线数NTX增加动态子阵列的能效优势也持续保持。这揭示了一个关键结论在追求极致能效的绿色通信场景中动态子阵列混合预编码是一个极具吸引力的选择。4.3 复杂度与公平性分析计算复杂度我们提出的天线划分算法复杂度为O(K * NTX)是线性复杂度。而穷举搜索的复杂度是天线划分组合数的函数是一个巨大的数字。例如将64根天线划分给4个用户穷举的搜索空间是S(64,4)第二类斯特林数的量级计算完全不可行。我们的算法将其降低到了4*64256次SINR计算实现了从指数级到线性级的跨越具备了实际部署的潜力。用户公平性我们使用Jain‘s公平性指数来评估。仿真表明基于最大SINR增量准则的算法其公平性指数非常接近1完全公平且优于某些基于最大信道增益的简单划分算法。这是因为最大SINR增量准则在分配天线时会自然倾向于改善当前处于劣势的用户从而实现了较好的长期公平性。5. 工程实现考量与未来扩展理论算法最终需要走向工程实践。在实现本文提出的动态子阵列混合预编码框架时有几个关键的工程问题需要仔细考量。5.1 信道状态信息获取整个算法的前提是基站需要知道用户的信道信息Hk或至少是等效信道H̃k。在毫米波频段由于信道带宽大、天线数量多获取完整的信道矩阵开销巨大。通常采用基于压缩感知或网格搜索的稀疏信道估计技术。另一种更实用的思路是利用信道互易性在时分双工系统中通过上行链路探测参考信号来估计下行信道。但无论哪种方式信道估计的精度和开销都是系统设计时必须权衡的。不完美的信道信息会导致波束失准、用户间干扰消除不彻底从而影响算法性能。5.2 动态切换的开销与延迟动态子阵列的核心是“动态”即天线连接关系需要根据信道变化进行调整。这个调整过程涉及射频开关网络的重新配置。虽然本文算法复杂度低但物理上的切换需要时间会引入额外的处理延迟和信令开销。因此动态划分的更新频率是一个关键参数。如果更新太快如每个时隙开销可能无法承受如果更新太慢则无法跟踪信道的快速变化。一个折中的方案是基于长期统计特性如用户的位置、主要来波方向进行划分只在信道发生显著变化如用户移动出当前波束覆盖时才重新计算。这需要在算法性能和系统开销之间取得平衡。5.3 码本设计与波束训练优化本文假设使用标准的DFT码本。在实际系统中码本设计直接影响波束成形的精度和开销。过完备的码本能提供更精细的角度分辨率但会增加波束训练和搜索的复杂度。此外对于动态子阵列每个用户子阵列的码本F_Sk都需要实时生成或从预定义的码本库中选取这也需要额外的存储和计算资源。一种优化思路是基于划分后的子阵列Sk直接计算其最优的连续域模拟预编码向量通过特征值分解等方式然后再量化到可用的移相器精度上这可能比在离散码本中搜索性能更好。5.4 扩展至宽带频率选择性信道本文主要针对窄带平坦衰落信道进行了讨论。然而毫米波通信为了获得高数据速率通常会使用很大的带宽导致信道具有频率选择性。在这种情况下混合预编码设计变得更加复杂因为模拟预编码通常是宽带的在所有子载波上相同而数字预编码可以在每个子载波上独立优化。如何将动态子阵列的思想扩展到宽带OFDM系统是一个重要的研究方向。可能的思路包括基于信道协方差矩阵频域平均进行天线划分或者设计能覆盖多个子载波公共空间特征的模拟波束。5.5 与其它先进技术的结合未来的6G系统将是多种技术融合的系统。动态子阵列混合预编码可以与以下技术进一步结合智能超表面RIS可以主动塑造无线环境。动态子阵列基站与RIS协同能实现更灵活、更节能的空间波束赋形。人工智能利用机器学习模型来学习信道环境与最优天线划分、预编码之间的映射关系可以进一步降低在线计算复杂度并适应更复杂的非理想情况。集成传感与通信毫米波信号也适用于感知。动态子阵列可以一部分用于通信另一部分用于感知实现硬件资源的动态共享。踩过的坑与心得在早期尝试实现类似算法时我曾忽略了一个细节在计算SINR增量时如果直接使用未更新的模拟预编码向量即全阵列最佳波束在子集上的投影在子阵列天线数很少时波束方向可能会严重偏离实际最优方向导致增量计算不准最终划分结果不佳。后来改进为在算法每一步迭代中当为一个用户子集临时添加一根天线后立即在该子集对应的更新码本中重新选择最优的模拟预编码向量再用这个更新后的向量计算SINR。虽然计算量稍有增加但划分性能得到了显著提升。这个细节告诉我们在解耦的优化框架中子问题之间的耦合关系不能完全忽略需要在关键步骤进适当的“再优化”来弥补性能损失。