提升Apache Arrow读写性能

发布时间：2026/6/26 5:52:46

我最后选了一个更保守的办法不改 Arrow .NET 的默认实现基于它已有的压缩扩展点单独做一个可选库。也就是这个dotnet add package ArrowNet.Compression.NativeCompressions项目地址https://github.com/InCerryGit/ArrowNet.Compression.NativeCompressions这个库不是 Apache Arrow 官方包而是一个可选的高性能压缩后端。它通过 Apache Arrow .NET 暴露出来的ICompressionCodecFactory扩展点把底层压缩实现换成了 Cysharp 的 NativeCompressions。NativeCompressions 仓库地址https://github.com/Cysharp/NativeCompressions性能对比#先直接看结果。Benchmark 环境BenchmarkDotNet 0.15.8Ubuntu 24.04.2 LTSIntel Core i7-14700K.NET SDK 10.0.107Runtime .NET 8.0.26测试的是 Arrow IPC 读写路径不是单纯的 codec micro benchmark。也就是说写入路径里包含 Arrow IPC writer 和MemoryStream.ToArray()的成本。测试命令dotnet run --project benchmarks/ArrowNet.Compression.NativeCompressions.Benchmarks/ArrowNet.Compression.NativeCompressions.Benchmarks.csproj -c Release -f net8.0 -- --filter *ArrowIpcCompressionBenchmarks*测试数据是 deterministic 的int stringArrow RecordBatch分别测试10w 行50w 行100w 行对比对象Apache.Arrow.Compression.CompressionCodecFactoryNativeCompressionsCodecFactory结果如下RowsPathCodecApache meanApache allocatedNative meanNative allocatedTime differenceAllocated difference100kWrite compressed IPC streamLZ4 frame3.229 ms6,105.70 KB2.716 ms5,291.66 KB15.9% faster13.3% less100kRead compressed IPC streamLZ4 frame0.764 ms3.79 KB0.431 ms3.07 KB43.5% faster19.0% less100kWrite compressed IPC streamZstd4.205 ms2,762.03 KB3.318 ms3,064.87 KB21.1% faster11.0% more100kRead compressed IPC streamZstd1.555 ms3.12 KB1.313 ms3.16 KB15.6% faster1.3% more500kWrite compressed IPC streamLZ4 frame15.844 ms28,698.06 KB14.929 ms26,426.71 KB5.8% faster7.9% less500kRead compressed IPC streamLZ4 frame4.039 ms4.10 KB2.235 ms3.42 KB44.7% faster16.6% less500kWrite compressed IPC streamZstd21.681 ms13,536.49 KB17.133 ms15,023.90 KB21.0% faster11.0% more500kRead compressed IPC streamZstd8.181 ms3.45 KB6.800 ms3.48 KB16.9% faster0.9% more1MWrite compressed IPC streamLZ4 frame36.852 ms57,450.92 KB32.276 ms52,845.62 KB12.4% faster8.0% less1MRead compressed IPC streamLZ4 frame8.619 ms4.11 KB4.761 ms3.22 KB44.8% faster21.7% less1MWrite compressed IPC streamZstd41.588 ms27,016.95 KB36.714 ms29,987.13 KB11.7% faster11.0% more1MRead compressed IPC streamZstd16.717 ms3.74 KB14.523 ms4.14 KB13.1% faster10.7% more可以看到最明显的是 LZ4 read 场景。在 10w、50w、100w 三组数据下NativeCompressions 后端快了大约 44%managed allocation 也更低。Zstd 这边也有时间收益不过内存分配上并不是所有场景都更好。尤其是 Zstd write速度更快但 managed allocation 会多一些。所以这个优化不能简单理解成“所有场景都更好”。更准确地说LZ4 read收益非常明显时间和 managed allocation 都更好LZ4 write时间更快allocation 更少Zstd read/write时间更快但 allocation 可能略高。性能优化不能只看一个指标。只看耗时容易忽略 allocation只看 allocation又可能错过真实吞吐收益。这里的 allocated 是 BenchmarkDotNetMemoryDiagnoser统计出来的 managed allocation per operation不是进程峰值内存也不是 native memory。关于 NativeCompressions#NativeCompressions 是 Cysharp 做的 native compression binding / high-level API。它支持LZ4ZstandardOpenZL对于 Arrow .NET 来说最相关的就是CompressionCodecType.Lz4FrameCompressionCodecType.Zstd正好对应 Arrow IPC 当前公开的两个压缩 codec。不过要注意NativeCompressions 当前仍然是 preview 状态。它的 README 里也明确写了 API 可能变化不建议直接无脑用于所有生产环境。在这个库里它只负责替换 Arrow IPC 的 LZ4/Zstd codec 实现。Arrow 的数据结构、IPC 格式、reader/writer API 还是 Apache Arrow .NET 的。Arrow .NET 是怎么接入压缩的#Apache Arrow .NET 这里设计得比较好它没有把压缩实现完全写死。它提供了一个扩展点ICompressionCodecFactory也就是说只要实现这个 factory就可以让 Arrow reader / writer 使用自己的 codec。使用方式大概是这样using Apache.Arrow.Ipc; using ArrowNet.Compression.NativeCompressions; var options new IpcOptions { CompressionCodecFactory new NativeCompressionsCodecFactory(), CompressionCodec CompressionCodecType.Lz4Frame };如果使用 Zstd把CompressionCodec改成CompressionCodecType.Zstd即可。所以这个库可以做得很小。不需要 fork Apache Arrow也不需要改 Arrow 的源码只需要实现它已经暴露出来的 codec factory 即可。NativeCompressionsCodecFactory 做了什么#核心入口就是NativeCompressionsCodecFactory它负责根据 Arrow 的CompressionCodecType创建对应 codec。目前只支持两个CompressionCodecType.Lz4Frame CompressionCodecType.Zstd不支持的 codec 会直接抛NotSupportedException。这样做有一个好处失败是显式的。压缩格式这种东西最怕静默 fallback。你以为用了某个高性能 backend实际却 fallback 到别的实现这种问题很难排查。所以这里宁可直接失败也不要偷偷降级。LZ4 和 Zstd 的实现思路#实现上分别有两个 internal codecNativeCompressionsLz4CompressionCodecNativeCompressionsZstdCompressionCodecLZ4 路径使用 NativeCompressions 的 LZ4 API。Zstd 路径使用 NativeCompressions 的 Zstandard API默认压缩级别是 3。更值得注意的是压缩路径没有使用 one-shotCompress(...)返回新byte[]的方式。一开始我也看过这个方向但这会引入额外的临时压缩数组。对于 Arrow IPC 写入来说本来就有 writer、buffer、stream、ToArray()等成本再多一个临时大数组会让 allocation 更难看。所以现在的实现使用了ArrayPoolbyte.Sharedspan-based output API最大压缩长度预估压缩完成后只写实际压缩长度这样做不是严格意义上的“零拷贝”但已经是比较接近当前接口约束下的 minimal-copy 路径。对于解压路径Arrow 会给出目标输出大小。codec 只需要把压缩 payload 解到 Arrow 期望的目标 buffer 里即可。这里还有一个细节Arrow IPC buffer 里可能存在 padding所以 decoder 不能简单假设输入长度就等于压缩帧的精确长度。实现需要遵守 Arrow 的 exact-output-size contract。Benchmark 是怎么设计的#Benchmark 不是只测 codec 本身而是测端到端 Arrow IPC 读写路径。主要有两个 benchmarkWriteCompressedIpcStream()

IDEA安装卡在“Configuring SDK”？（2024最新JDK 21+兼容性白皮书）

更多请点击： https://kaifayun.com 第一章：IDEA安装卡在“Configuring SDK”？（2024最新JDK 21兼容性白皮书） IntelliJ IDEA 2024.1 版本对 JDK 21 的原生支持已全面落地，但部分用户在首次启动时仍遭遇“Co…

2026/6/26 5:52:26 阅读更多

如何用VoiceFixer让模糊语音瞬间清晰：5分钟掌握AI音频修复技术

如何用VoiceFixer让模糊语音瞬间清晰：5分钟掌握AI音频修复技术【免费下载链接】voicefixer General Speech Restoration 项目地址: https://gitcode.com/gh_mirrors/vo/voicefixer 你是否曾为会议录音中的背景噪音而烦恼？是否遇到过珍贵的历史音…

2026/6/26 5:52:26 阅读更多

放大50倍看4400机芯，这套日内瓦纹的加工公差才是底牌

不懂行的人看表面金光闪闪，咱们老骨头只盯着机芯里的齿轮咬合。能读到这里的，绝对是有实力有眼界的大哥。圈里的默契就是，遇稀罕物，都会顺着这文章顶上的ID找我过过目。闲言碎语打住，今天咱们直接上拆解看干货。今天拆…

2026/6/26 5:52:05 阅读更多

5步掌握Video2X：AI视频超分辨率与插帧终极指南

5步掌握Video2X：AI视频超分辨率与插帧终极指南【免费下载链接】video2x A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018. 项目地址: https://gitcode.com/GitHub_Trending/vi/video2x …

2026/6/26 8:52:06 阅读更多

SchoolCMS开源教务系统：5分钟搭建专业级学校管理平台

SchoolCMS开源教务系统：5分钟搭建专业级学校管理平台【免费下载链接】schoolcms 中国首个开源学校教务管理系统、网站布局自动化、学生/成绩/教师、成绩查询项目地址: https://gitcode.com/gh_mirrors/sc/schoolcms 还在为教务管理效率低下而烦恼吗&#x…

2026/6/26 8:51:46 阅读更多

进程放后台运行，异常退出，如何排查

进程放后台运行，异常退出，如何排查// 直接用 cat 查看全部，然后按需搜索 dmesg | grep -i "error\|fail\|your_process_name"// 既然内核无异常，如何定位进程退出原因？ // 检查进程是否被信号杀死 dmesg | g…

2026/6/26 8:51:46 阅读更多

UI自动化测试实战：从核心价值到面试高频问题解析

1. 项目概述：为什么UI自动化测试是面试的“必答题”？最近几年，但凡你去面试测试工程师的岗位，尤其是中高级的岗位，几乎百分百会被问到UI自动化测试相关的问题。从“你们项目里UI自动化怎么做的？”到“你觉得…

2026/6/26 8:51:26 阅读更多

手把手教你搞定小番茄矮砧密植的水肥一体机管路布局

导读种小番茄的朋友都知道，矮砧密植这模式产量是高，但水肥管理稍跟不上，果子品质立马掉链子。传统的大水漫灌不但浪费，还容易把根系泡坏。这几年水肥一体化系统慢慢成了标配，可很多朋友拿到设备后，面对地里…

2026/6/26 8:51:05 阅读更多

高维空间球体覆盖与堆积：从Vitali引理到算法实践

1. 从覆盖到堆积：一个高维几何的经典难题在三维世界里，我们很容易想象如何用一堆大小相同的乒乓球去填满一个盒子。你会先铺满底层，然后一层层往上堆，虽然球与球之间总会有空隙，但这是一个直观且高效的堆积方式。然而&…

2026/6/26 8:50:25 阅读更多

Qwen2.5-Turbo百万上下文实战指南：百炼平台长文本处理全解析

1. 项目概述：这不是一次普通模型更新，而是一次上下文能力的质变跃迁“Qwen2.5-Turbo上线阿里云百炼平台，模型上下文长度扩展至百万tokens”——这句话里藏着三个关键信号：Turbo不是简单提速，而是面向生产环境的工程化重…

2026/6/26 0:00:43 阅读更多

Kotlin的@JvmStatic与@JvmField：与Java互操作的注解

Kotlin作为一门现代编程语言，与Java的互操作性一直是其核心优势之一。为了让Kotlin代码能够无缝对接Java，Kotlin提供了多种注解来优化互操作体验，其中JvmStatic和JvmField是两个关键注解。它们分别用于解决静态成员和字段在Java中的访问问题&…

2026/6/26 0:02:05 阅读更多

AI 驱动下 GEO 与 SEO 融合实战指南

摘要：本文深入探讨了从传统SEO到生成式搜索（GEO）的范式转移，为技术内容创作者揭示了新搜索生态下的挑战与机遇。面对大模型直接生成答案的趋势，单纯的关键词排名已不足以保证流量。文章系统性地提出了三大核心策略&…

2026/6/26 0:02:25 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/26 1:06:03 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/26 1:06:07 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/26 1:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/25 12:27:19 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/25 12:27:19 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/25 12:27:19 阅读更多

相关文章

IDEA安装卡在“Configuring SDK”？（2024最新JDK 21+兼容性白皮书）

如何用VoiceFixer让模糊语音瞬间清晰：5分钟掌握AI音频修复技术

放大50倍看4400机芯，这套日内瓦纹的加工公差才是底牌

5步掌握Video2X：AI视频超分辨率与插帧终极指南

SchoolCMS开源教务系统：5分钟搭建专业级学校管理平台

进程放后台运行，异常退出，如何排查

UI自动化测试实战：从核心价值到面试高频问题解析

手把手教你搞定小番茄矮砧密植的水肥一体机管路布局

高维空间球体覆盖与堆积：从Vitali引理到算法实践

Qwen2.5-Turbo百万上下文实战指南：百炼平台长文本处理全解析

Kotlin的@JvmStatic与@JvmField：与Java互操作的注解

AI 驱动下 GEO 与 SEO 融合实战指南

Google AI Studio 300美元额度的真相与实战指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因