CABAC 基础二-算术编码

发布时间：2026/6/4 15:10:00

2. 算术编码与变长编码不同算术编码的本质是为整个输入序列分配一个码字而不是给每个字符分别指定码字因此平均意义上可以为单个字符分配码长小于1的码字。算术编码用到两个基本的参数符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率也决定编码过程中信源符号的间隔而这些间隔包含在L到H之间。编码过程中的间隔决定了符号压缩后的输出。给定事件序列的算术编码步骤如下1. 编码器在开始时将“当前间隔”设置为[ L H)2. 对每一事件编码器按步骤a和b进行处理a) 编码器将“当前间隔”分为子间隔每一个事件一个b) 一个子间隔的大小与下一个将出现的事件的概率成比例编码器选择子间隔对应于下一个确切发生的事件相对应并使它成为新的“当前间隔”3. 最后输出的“当前间隔”的下边界和上边界之间的一个合适的值就是该给定事件序列的算术编码。2.1. 浮点算术编码在做算术编码前需要定义一个模型有很多定义模型的算法其主要目的都是为了能够精确的估计符号出现的概率同时保证编码和解码的概率是一致的。为了简单起见本节定义一个静态的概率模型假设我们对大写字母进行编码且前24个字母的概率为均为0.04最后2个字母的概率均为0.02如此26个字母的概率之和为1。按照以上定义我们将[01)区间划分为26份其中A拥有区间[00.04)B拥有区间[0.040.08)…M拥有区间[0.480.52)…Y拥有区间[0.960.98) Z拥有区间[0.981)。算术编码时采用了子区间划分的方法计算公式如下range high – low (1)high low range * prob_high; (2)low low range * prob_low (3)其中range表示当前编码是区间大小low和high分别表示当前区间的最小值和最大值prob_low和prob_high分别表示当前待编码字符的概率区间的最小值和最大值。假设我们编码“PASS”由上述定义可知“P”对应区间[0.60.64)“A”对应区间[00.04)“S”对应区间[0.720.76)计算过程如图2所示。1) 当编码“P”时按照公式(1)、(2)和(3)计算如下range 1.0 – 0 1high 0 1 * 0.64 0.64low 0 1 * 0.6 0.62) 当编码“A”时按照公式计算如下range 0.64 – 0.6 0.04high 0.6 0.04 * 0.04 0.6016low 0.6 0.04 * 0 0.63) 当编码“S”时按照公式计算如下range 0.6016 – 0.6 0.0016high 0.6 0.0016 * 0.76 0.601216low 0.6 0.0016 * 0.72 0.6011524) 当编码“S”时按照公式计算如下range 0.601216 – 0.601152 0.000064high 0.601152 0.000064 * 0.76 0.60120064low 0.601152 0.000064 * 0.72 0.60119808图2. 编码“PASS”过程从最后的结果可以看出字符串“PASS”编码后的区间是[0.601198080.60120064)从该区间中选择一个合适的值即可作为字符串“PASS”最终的算术编码值。解码时使用和编码时类似的公式如公式(4)、(5)、(6)和(7)。range high – low (4)c (val - low) / range (5)high low range * c_prob_high (6)low low range * c_prob_low (7)假设我们最终选择了0.6012作为“PASS”算术编码后的值。其对应的解码过程如下所示1) high 1low 0val 0.6012range high – low 1c (val - low) / range (0.6012 - 0) / 1 0.6012可知0.6012∈[0.60.64)对应字符“P”因此解码的第一个字符为“P”high low range * c_prob_high 0 1 * 0.64 0.64low low range * c_prob_low 0 1 * 0.6 0.62) high 0.64low 0.6val 0.6012range high – low 0.04c (val - low) / range (0.6012 – 0.6) / 0.04 0.03可知0.003∈[00.04)对应字符“A”因此解码的第二个字符为“A”high low range * c_prob_high 0.60 0.04 * 0.04 0.6016low low range * c_prob_low 0.60 0.04 * 0 0.603) high 0.6016low 0.60val 0.6012range high – low 0.0016c (val - low) / range (0.6012 – 0.60) / 0.0016 0.75可知0.75∈[0.720.76)对应字符“S”因此解码的第三个字符为“S”high low range * c_prob_high 0.60 0.0016 * 0.76 0.601216low low range * c_prob_low 0.60 0.0016 * 0.72 0.6011524) high 0.601216low 0.601152val 0.6012range high – low 0.000064c (val - low) / range (0.6012 –0.601152) / 0.000064 0.75可知0.75∈[0.720.76)对应字符“S”因此解码的第四个字符为“S”high low range * c_prob_high 0.601152 0.000064 * 0.76 0.60120064low low range * c_prob_low 0.601152 0.000064 * 0.72 0.60119808经过以上步骤就解码出了“PASS”字符串但由于计算机的精度问题浮点算术编码在实际情况下回带来诸多不便因此在实际中使用的基本都是基于定点数的算术编码。2.2. 定点算术编码在浮点数编码时区间被限定在[01)之间做定点算术编码时区间范围视寄存器位数而定本节假设为32位的定点算术编码。在浮点算术编码中low0high1.0在32位定点算术编码中由于寄存器只能表示整数因此我们假想在low和high的最前面有一个小数点存在。即low 0high 0xFFFFFFFFU可以被假想为low 0.0high 0x0.FFFFFFFFU由于寄存器位数有限(本节假设为32位)但是算术编码时需要的是一个无限趋近于1的一个数因此low 0.0high 0x0.FFFFFFFFU进一步可以被假想为low 0.00000000…high 0x0.FFFFFFFF…U也就是说我们可以假设在寄存器有限的精度之后还存在着无限多个后缀low之后存在无限多个0high之后存在无限多个F(针对16进制)或者无限多个1(针对二进制)每次当寄存器中low的高位移出之后低位都补0high高位移出之后低位都补1(因为前面说high后有无限个F是针对16进制而言针对移位操作而言高位每移出一位二进制数低位就补1)。在浮点算术编码中我们可以发现随着编码的进行在编码过程中将满足三个不变式a) low将单步递增b) high将单步递减c) high low在满足以上三个条件的基础上一旦high的二进制最高位为0那么它将在以后的编码过程中保持不变同理low的二进制最高位为1那么它在以后的编码过程中也不会发生变化。由于寄存器的位数有限为了充分的利用寄存器进行接下来的编码当high和low的二进制最高位相同的时候可以将他们移出寄存器保存起来然后将low末尾的无穷个0移进一位到low的最低位从high末尾的无限个1移进一位到high的末尾如此这样可以保证寄存器的位数被充分利用且不会造成算法错误。下面以定点算术编码方式来编码上面的“PASS”字符串如下1) 编码“P”字符时low和high值如下这里为了简单直接用概率与区间大小相乘编码后寄存器状态如图3所示range 0xfffffffflow 0.6 *0xffffffff 0x99999999high 0.64 * 0xffffffff 0xa3d70a3c图3. 编码“P”字符后寄存器状态由上面分析可知low和high的前两位都不再发生变化因此可以直接移出寄存器存储起来同时将尾部的0移入low将尾部的1移入high。经过移出和移入操作后low和high值如下low 0x66666664high 0x8f5c28f32) 编码“A”字符时low和high值如下公式所示移出移入后寄存器状态如图4所示“Emitted”部分移出了6个比特其中最高2比特是在第一步操作中移出的range high – low 0x8f5c28f3 – 0x6666664 0x28f5c28fhigh low 0.04 * range 0x66666664 0.04 * 0x28f5c28f 0x6809d493low low 0 * range 0x66666667图4. 编码字符“A”后寄存器状态按照同样的原理可以得出编码第一个字符“S”和第二个字符“S”后寄存器状态如图5(a)和5(b)所示。(a)编码第一个字符“S”后寄存器状态(b)编码第二个字符“S”后寄存器状态图5. 编码字符“S”后寄存器状态2.3. 区间缩放为了充分利用寄存器有限的位宽保证计算精度定点算术编码的同时结合了区间缩放。在上一节中提到的当low和high最高位相同时可以移出寄存器同时在末尾移入0或1就属于区间缩放中的两种情况。定点数算术编码中区间缩放一共分为三种。1) 当low的最高位为1时也就是low mid时由于high low这个不变式一直成立因此high的最高位也是1此时可以将high和low的最高位移出也就是将high和low左移一位同时低位补上相应的1和0。由于high和low都左移一位相当于对区间进行了第一种情况的缩放如图6(a)所示。此时类似于low (low – 0.5) * 2high (high – 0.5 * 2图3中编码后移出了二进制“10”其中最高位移出的“1”就是这种情况。2) 当high的最高位为0时也就是high mid时由于high low这个不变式一直成立因此low的最高位也是0此时可以将high和low的最高位移出也就是将high和low左移一位同时低位补上相应的1和0。由于high和low都左移一位相当于对区间进行了第二种情况的缩放如图6(b)所示。此时类似于low low * 2high high * 2图3中编码后移出了二进制“10”其中次高位移出的“0”就是这种情况。3) 当high的最高两位为“10”而low的最高两位为“01”时也就是low属于[1/4 full range1/2 full range)这个区间而high属于[1/2 full range3/4 full range)时需要将high的次高位“0”和low的次高位“1”移出寄存器最高位都保持不变同时记录下次高位移出的次数cnt。当遇到第一种方式的区间扩展时向缓冲区输出一个1和cnt个0作为算术编码的结果当遇到第二种区间扩展方式时向缓冲区输出一个0和cnt个1作为算术编码的结果。如图6(c)所示其对应的公式如下。low (low – 0.25) * 2high (high – 0.25 * 2(a) 第一种区间缩放(b) 第二种区间缩放(c) 第三种区间缩放图6. 算术编码区间缩放对于第三种缩放形式通过如下的例子来进行说明。我们仍然采用浮点数算术编码部分的概率模型假设我们编码字符串“MMMMMMM”也就是连续编码7个字符“M”按照定点数算术编码的方式进行计算可以得到如下结果。编码第一个字符“M”之后low 0x7ae147ad high 0x851eb851 range 171798692编码第二个字符“M”之后low 0x7fcb9239 high 0x80346dc4 range 6871947编码第三个字符“M”之后low 0x7ffde71f high 0x800218dd range 274878编码第四个字符“M”之后low 0x7fffea84 high 0x80001577 range 10995编码第五个字符“M”之后low 0x7fffff21 high 0x 800000d9 range 440编码第六个字符“M”之后low 0x7ffffff4 high 0x80000005 range 17编码第七个字符“M”之后low 0x7ffffffc high0x7ffffffc range 0。从上面的编码字符“M”之后的low和high可以看出前六次编码后的结果low和high都没有相同的最高位且low和high无限趋近于中点值mid0x80000000同时还可以看出第六次之后range17但概率模型中一共存在26种字符(“A”~“Z”)该range值太小会导致无法为每个字符都分配独立的概率区间因此是需要缩放的且每次编码字符“M”后low的最高两位是“01”high的最高两位是“10”从第七次的编码结果来看low和high最终的结果是0x7ffffffc可以知道这也是符合第三种缩放的算法的即一个0后有cnt个1或者一个1后有cnt个0至于cnt的数值大小这里不再计算可以按照第三种缩放算法的方式自行计算。

Arduino音乐点唱机：从3D打印到编程的完整数字制造实践

1. 项目概述：从零打造一台桌面级复古音乐点唱机几年前，当我第一次接触数字制造这个概念时，就被它那种“所想即所得”的魔力深深吸引。它不像传统木工或金工，需要常年累月的技艺积累，而是将创意、设计、电子和制造无缝衔…

2026/6/4 15:10:00 阅读更多

前端全套基础知识点整理（HTML+CSS+JS+正则）

一、JavaScript 核心进阶1.1 函数柯里化与反柯里化1.1.1 函数柯里化柯里化：把多参数函数，拆分为多个单参数嵌套函数，延迟执行、参数复用。// 原多参数函数 function ad(a,b,c){return abc; }// 柯里化封装函数 function ac(ad,a,b){return fu…

2026/6/4 15:09:39 阅读更多

别再让GPU‘摸鱼’了！用Megatron-LM的流水线并行实战，把LLM训练效率拉满

解锁Megatron-LM流水线并行的终极性能：从MicroBatch调优到1F1B实战当你的128块A100集群在训练千亿参数模型时，有超过30%的时间处于空闲状态，这意味着每天近万元的算力资源在无声蒸发。这不是科幻场景，而是大多数团队在实施流水线并…

2026/6/4 15:09:19 阅读更多

Translumo：免费实时屏幕翻译工具，打破游戏和视频语言障碍的终极指南

Translumo：免费实时屏幕翻译工具，打破游戏和视频语言障碍的终极指南【免费下载链接】Translumo Advanced real-time screen translator for games, hardcoded subtitles in videos, static text and etc. 项目地址: https://gitcode.com/gh_mirrors/t…

2026/6/4 16:26:23 阅读更多

shopify前端开发

摘要：Shopify 前端分3 大主流开发体系：Online Store2.0 主题开发（Liquid）、Theme App Extension 插件前端、Hydrogen 无头 React 独立站，是跨境独立站主流前端岗位技术栈。一、1. 主题开发（最常用、入门首选…

2026/6/4 16:26:02 阅读更多

如何用91160-cli实现全自动医院挂号：告别熬夜抢号的终极指南

如何用91160-cli实现全自动医院挂号：告别熬夜抢号的终极指南【免费下载链接】91160-cli 健康160全自动挂号脚本，捡漏神器项目地址: https://gitcode.com/gh_mirrors/91/91160-cli 还在为医院挂号难而烦恼吗？91160-cli是一款专为医疗…

2026/6/4 16:25:40 阅读更多

【监管合规优先的AI担保方案】：覆盖银保监2024新规的6层可信验证机制详解

更多请点击： https://kaifayun.com 第一章：AI工具与智能担保整合的监管逻辑基座现代金融基础设施正经历从规则驱动向逻辑可验证的智能合约范式迁移。AI工具不再仅作为辅助分析组件，而是深度嵌入担保决策链路，承担风险识别、动态…

2026/6/4 16:24:36 阅读更多

LabVIEW 2023机器视觉三件套（VDM+VAS）保姆级安装避坑指南

LabVIEW 2023机器视觉三件套（VDMVAS）安装避坑实战手册第一次接触LabVIEW机器视觉套件时，我被各种安装报错折磨得几乎放弃。直到在实验室前辈的指点下，才发现那些看似玄学的安装失败背后，其实隐藏着清晰的逻辑链。本文将…

2026/6/4 16:23:34 阅读更多

树莓派与舵机制作智能模拟电压表：从PWM控制到ADC读取的嵌入式实践

1. 项目概述：用树莓派和伺服电机复活经典指针表在数字显示屏无处不在的今天，指针式模拟电压表那种优雅的机械摆动和直观的读数方式，依然让很多工程师和爱好者着迷。它不仅仅是一个测量工具，更像是一件融合了机械美学与电子原理的艺…

2026/6/4 16:22:32 阅读更多

告别激活烦恼：IAR Embedded Workbench 许可证管理的最佳实践与合法替代方案探讨

IAR Embedded Workbench 许可证管理全指南与合规开发方案在嵌入式开发领域，IAR Embedded Workbench 以其高效的编译器和强大的调试功能著称，成为众多工程师的首选工具。然而，随着团队规模扩大和项目复杂度提升，许可证管理问题逐渐…

2026/6/4 0:03:11 阅读更多

赤铁矿磨矿过程运行优化控制软件系统【附程序】

✨ 长期致力于赤铁矿磨矿过程、磨矿粒度、数据驱动、运行优化控制、神经网络、案例推理、规则推理、软件系统研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1&…

2026/6/4 0:03:32 阅读更多

终极指南：如何使用Attu轻松管理你的Milvus向量数据库

终极指南：如何使用Attu轻松管理你的Milvus向量数据库【免费下载链接】attu The Best GUI for Milvus 项目地址: https://gitcode.com/gh_mirrors/at/attu Attu是一款专为Milvus向量数据库设计的现代化AI工作台管理工具，提供全面的可视化界面&…

2026/6/4 0:04:12 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/4 9:21:37 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/4 7:15:04 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/4 9:21:48 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/4 9:21:45 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/4 9:21:52 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/4 9:21:53 阅读更多

相关文章