前言作为.net程序员使用过指针写过不安全代码吗为什么要使用指针什么时候需要使用它以及如何安全、高效地使用它如果能很好地回答这几个问题那么就能很好地理解今天了主题了。C#构建了一个托管世界在这个世界里只要不写不安全代码不操作指针那么就能获得.Net至关重要的安全保障即什么都不用担心那如果我们需要操作的数据不在托管内存中而是来自于非托管内存比如位于本机内存或者堆栈上该如何编写代码支持来自任意区域的内存呢这个时候就需要写不安全代码使用指针了而如何安全、高效地操作任何类型的内存一直都是C#的痛点今天我们就来谈谈这个话题讲清楚 What、How 和 Why 让你知其然更知其所以然以后有人问你这个问题就让他看这篇文章吧呵呵。what - 痛点是什么回答这个问题前先总结一下如何用C#操作任何类型的内存托管内存managed memory var mangedMemory new Student();很熟悉吧只需使用new操作符就分配了一块托管堆内存而且还不用手工释放它因为它是由垃圾收集器GC管理的GC会智能地决定何时释放它这就是所谓的托管内存。默认情况下GC通过复制内存的方式分代管理小对象size 85000 bytes而专门为大对象size 85000 bytes开辟大对象堆LOH管理大对象时并不会复制它而是将其放入一个列表提供较慢的分配和释放而且很容易产生内存碎片。栈内存stack memory unsafe{ var stackMemory stackalloc byte[100]; }很简单使用stackalloc关键字非常快速地就分配好了一块栈内存也不用手工释放它会随着当前作用域而释放比如方法执行结束时就自动释放了。栈内存的容量非常小 ARM、x86 和 x64 计算机默认堆栈大小为 1 MB当你使用栈内存的容量大于1M时就会报StackOverflowException异常 这通常是致命的不能被处理而且会立即干掉整个应用程序所以栈内存一般用于需要小内存但是又不得不快速执行的大量短操作比如微软使用栈内存来快速地记录ETW事件日志。本机内存native memory IntPtr nativeMemory0 default(IntPtr), nativeMemory1 default(IntPtr); try { unsafe { nativeMemory0 Marshal.AllocHGlobal(256); nativeMemory1 Marshal.AllocCoTaskMem(256); } } finally { Marshal.FreeHGlobal(nativeMemory0); Marshal.FreeCoTaskMem(nativeMemory1); }通过调用方法Marshal.AllocHGlobal或Marshal.AllocCoTaskMem来分配非托管堆内存非托管就是垃圾回收器GC不可见的意思并且还需要手工调用方法Marshal.FreeHGlobalorMarshal.FreeCoTaskMem释放它千万不能忘记不然就内存泄漏了。抛砖引玉 - 痛点首先我们设计一个解析完整或部分字符串为整数的API如下public interface IntParser { // allows us to parse the whole string. int Parse(string managedMemory); // allows us to parse part of the string. int Parse(string managedMemory, int startIndex, int length); // allows us to parse characters stored on the unmanaged heap / stack. unsafe int Parse(char* pointerToUnmanagedMemory, int length); // allows us to parse part of the characters stored on the unmanaged heap / stack. unsafe int Parse(char* pointerToUnmanagedMemory, int startIndex, int length); }从上面可以看到为了支持解析来自任何内存区域的字符串一共写了4个重载方法。接下来在来设计一个支持复制任何内存块的API如下public interface MemoryblockCopier { void CopyT(T[] source, T[] destination); void CopyT(T[] source, int sourceStartIndex, T[] destination, int destinationStartIndex, int elementsCount); unsafe void CopyT(void* source, void* destination, int elementsCount); unsafe void CopyT(void* source, int sourceStartIndex, void* destination, int destinationStartIndex, int elementsCount); unsafe void CopyT(void* source, int sourceLength, T[] destination); unsafe void CopyT(void* source, int sourceStartIndex, T[] destination, int destinationStartIndex, int elementsCount); }脑袋蒙圈没以前C#操纵各种内存就是这么复杂、麻烦。通过上面的总结如何用C#操作任何类型的内存相信大多数同学都能够很好地理解这两个类的设计但我心里是没底的因为使用了不安全代码和指针这些操作是危险的、不可控的根本无法获得.net至关重要的安全保障并且可能还会有难以预估的问题比如堆栈溢出、内存碎片、栈撕裂等等微软的工程师们早就意识到了这个痛点所以span诞生了它就是这个痛点的解决方案。how - span如何解决这个痛点先来看看如何使用span操作各种类型的内存伪代码托管内存managed memory var managedMemory new byte[100]; Spanbyte span managedMemory;栈内存stack memory var stackedMemory stackalloc byte[100]; var span new Spanbyte(stackedMemory, 100);本机内存native memory var nativeMemory Marshal.AllocHGlobal(100); var nativeSpan new Spanbyte(nativeMemory.ToPointer(), 100);span就像黑洞一样能够吸收来自于内存任意区域的数据实际上现在在.Net的世界里Span就是所有类型内存的抽象化身表示一段连续的内存它的API设计和性能就像数组一样所以我们完全可以像使用数组一样地操作各种内存真的是太方便了。现在重构上面的两个设计如下public interface IntParser { int Parse(Spanchar managedMemory); int Parse(Spanchar, int startIndex, int length); } public interface MemoryblockCopier { void CopyT(SpanT source, SpanT destination); void CopyT(SpanT source, int sourceStartIndex, SpanT destination, int destinationStartIndex, int elementsCount); }上面的方法根本不关心它操作的是哪种类型的内存我们可以自由地从托管内存切换到本机代码再切换到堆栈上真正的享受玩转内存的乐趣。why - 为什么span能解决这个痛点浅析span的工作机制先来窥视一下源码我已经圈出的三个字段偏移量、索引、长度使用过ArraySegmentbyte的同学可能已经大致理解到设计的精髓了这就是它的主要设计当我们访问span表示的整体或部分内存时内部的索引器会按照下面的算法运算指针伪代码ref T this[int index] { get ref ((ref reference byteOffset) index * sizeOf(T)); }整个变化的过程如图所示上面的动画非常清楚了吧旧span整合它的引用和偏移成新的span的引用整个过程并没有复制内存也没有返回相对位置上存在的副本而是直接返回实际存储位置的引用因此性能非常高因为新span获得并更新了引用所以垃圾回收器GC知道如何处理新的span从而获得了.Net至关重要的安全保障并且内部还会自动执行边界检查确保内存安全而这些都是span内部默默完成的开发人员根本不用担心非托管世界依然美好。正是由于span的高性能目前很多基础设施都开始支持span甚至使用span进行重构比如System.String.Substring方法我们都知道此方法是非常消耗性能的首先会创建一个新的字符串然后再从原始字符串中复制字符集给它而使用span可以实现Non-Allocating、Zero-coping下面是我做的一个基准测试使用String.SubString和Span.Slice分别截取长度为10和1000的字符串的前一半从指标Mean可以看出方法SubString的耗时随着字符串长度呈线性增长而Slice几乎保持不变从指标Allocated Memory/Op可以看出方法Slice并没有被分配新的内存实践出真知可以预见Span未来将会成为.Net下编写高性能应用程序的重要积木应用前景也会非常地广微服务、物联网、云原生都是它发光发热的好地方。基准测试示例总结从技术的本质上看SpanT是一种ref-like type类似引用的结构体从应用的场景上看它是高性能的sliceable type可切片类型综上所诉Span是一种类似于数组的结构体但具有创建数组一部分视图而无需在堆上分配新对象或复制数据的超能力。看完本篇博客如果理解了Span的What、Why、How那么作者布道的目的就达到了不懂的同学建议多读几遍下一篇我将会进一步畅谈Span的脾气秉性让大家能够安全高效地使用好它。补充从评论区交流发现有的同学误解了span表面上认为只是对指针的封装从而绕过unsafe带来的限制避免开发人员直接面对指针而已其实不是下面我们来看一个示例var nativeMemory Marshal.AllocHGlobal(100); Spanbyte nativeSpan; unsafe { nativeSpan new Spanbyte(nativeMemory.ToPointer(), 100); } SafeSum(nativeSpan); Marshal.FreeHGlobal(nativeMemory); // 这里不关心操作的内存类型即不用为一种类型写一个重载方法就好比上面的设计一样。 static ulong SafeSum(Spanbyte bytes) { ulong sum 0; for(int i0; i bytes.Length; i) { sum bytes[i]; } return sum; }看到了吗并没有绕过unsafe以前该如何用现在还是一样的span解决的是下面几点高性能避免不必要的内存分配和复制。高效率它可以为任何具有无复制语义的连续内存块提供安全和可编辑的视图极大地简化了内存操作即不用为每一种内存类型操作写一个重载方法。内存安全span内部会自动执行边界检查来确保安全地读写内存但它并不管理如何释放内存而且也管理不了因为所有权不属于它希望大家要明白这一点。它的目标是未来将成为.Net下编写高性能应用程序的重要积木。最后如果有什么疑问和见解欢迎评论区交流。如果你觉得本篇文章对您有帮助的话感谢您的【推荐】。如果你对.NET高性能编程感兴趣的话可以【关注我】我会定期的在博客分享我的学习心得。欢迎转载请在明显位置给出出处及链接。
C#如何安全、高效地玩转任何种类的内存之Span的本质(一)。
发布时间:2026/7/1 21:32:30
前言作为.net程序员使用过指针写过不安全代码吗为什么要使用指针什么时候需要使用它以及如何安全、高效地使用它如果能很好地回答这几个问题那么就能很好地理解今天了主题了。C#构建了一个托管世界在这个世界里只要不写不安全代码不操作指针那么就能获得.Net至关重要的安全保障即什么都不用担心那如果我们需要操作的数据不在托管内存中而是来自于非托管内存比如位于本机内存或者堆栈上该如何编写代码支持来自任意区域的内存呢这个时候就需要写不安全代码使用指针了而如何安全、高效地操作任何类型的内存一直都是C#的痛点今天我们就来谈谈这个话题讲清楚 What、How 和 Why 让你知其然更知其所以然以后有人问你这个问题就让他看这篇文章吧呵呵。what - 痛点是什么回答这个问题前先总结一下如何用C#操作任何类型的内存托管内存managed memory var mangedMemory new Student();很熟悉吧只需使用new操作符就分配了一块托管堆内存而且还不用手工释放它因为它是由垃圾收集器GC管理的GC会智能地决定何时释放它这就是所谓的托管内存。默认情况下GC通过复制内存的方式分代管理小对象size 85000 bytes而专门为大对象size 85000 bytes开辟大对象堆LOH管理大对象时并不会复制它而是将其放入一个列表提供较慢的分配和释放而且很容易产生内存碎片。栈内存stack memory unsafe{ var stackMemory stackalloc byte[100]; }很简单使用stackalloc关键字非常快速地就分配好了一块栈内存也不用手工释放它会随着当前作用域而释放比如方法执行结束时就自动释放了。栈内存的容量非常小 ARM、x86 和 x64 计算机默认堆栈大小为 1 MB当你使用栈内存的容量大于1M时就会报StackOverflowException异常 这通常是致命的不能被处理而且会立即干掉整个应用程序所以栈内存一般用于需要小内存但是又不得不快速执行的大量短操作比如微软使用栈内存来快速地记录ETW事件日志。本机内存native memory IntPtr nativeMemory0 default(IntPtr), nativeMemory1 default(IntPtr); try { unsafe { nativeMemory0 Marshal.AllocHGlobal(256); nativeMemory1 Marshal.AllocCoTaskMem(256); } } finally { Marshal.FreeHGlobal(nativeMemory0); Marshal.FreeCoTaskMem(nativeMemory1); }通过调用方法Marshal.AllocHGlobal或Marshal.AllocCoTaskMem来分配非托管堆内存非托管就是垃圾回收器GC不可见的意思并且还需要手工调用方法Marshal.FreeHGlobalorMarshal.FreeCoTaskMem释放它千万不能忘记不然就内存泄漏了。抛砖引玉 - 痛点首先我们设计一个解析完整或部分字符串为整数的API如下public interface IntParser { // allows us to parse the whole string. int Parse(string managedMemory); // allows us to parse part of the string. int Parse(string managedMemory, int startIndex, int length); // allows us to parse characters stored on the unmanaged heap / stack. unsafe int Parse(char* pointerToUnmanagedMemory, int length); // allows us to parse part of the characters stored on the unmanaged heap / stack. unsafe int Parse(char* pointerToUnmanagedMemory, int startIndex, int length); }从上面可以看到为了支持解析来自任何内存区域的字符串一共写了4个重载方法。接下来在来设计一个支持复制任何内存块的API如下public interface MemoryblockCopier { void CopyT(T[] source, T[] destination); void CopyT(T[] source, int sourceStartIndex, T[] destination, int destinationStartIndex, int elementsCount); unsafe void CopyT(void* source, void* destination, int elementsCount); unsafe void CopyT(void* source, int sourceStartIndex, void* destination, int destinationStartIndex, int elementsCount); unsafe void CopyT(void* source, int sourceLength, T[] destination); unsafe void CopyT(void* source, int sourceStartIndex, T[] destination, int destinationStartIndex, int elementsCount); }脑袋蒙圈没以前C#操纵各种内存就是这么复杂、麻烦。通过上面的总结如何用C#操作任何类型的内存相信大多数同学都能够很好地理解这两个类的设计但我心里是没底的因为使用了不安全代码和指针这些操作是危险的、不可控的根本无法获得.net至关重要的安全保障并且可能还会有难以预估的问题比如堆栈溢出、内存碎片、栈撕裂等等微软的工程师们早就意识到了这个痛点所以span诞生了它就是这个痛点的解决方案。how - span如何解决这个痛点先来看看如何使用span操作各种类型的内存伪代码托管内存managed memory var managedMemory new byte[100]; Spanbyte span managedMemory;栈内存stack memory var stackedMemory stackalloc byte[100]; var span new Spanbyte(stackedMemory, 100);本机内存native memory var nativeMemory Marshal.AllocHGlobal(100); var nativeSpan new Spanbyte(nativeMemory.ToPointer(), 100);span就像黑洞一样能够吸收来自于内存任意区域的数据实际上现在在.Net的世界里Span就是所有类型内存的抽象化身表示一段连续的内存它的API设计和性能就像数组一样所以我们完全可以像使用数组一样地操作各种内存真的是太方便了。现在重构上面的两个设计如下public interface IntParser { int Parse(Spanchar managedMemory); int Parse(Spanchar, int startIndex, int length); } public interface MemoryblockCopier { void CopyT(SpanT source, SpanT destination); void CopyT(SpanT source, int sourceStartIndex, SpanT destination, int destinationStartIndex, int elementsCount); }上面的方法根本不关心它操作的是哪种类型的内存我们可以自由地从托管内存切换到本机代码再切换到堆栈上真正的享受玩转内存的乐趣。why - 为什么span能解决这个痛点浅析span的工作机制先来窥视一下源码我已经圈出的三个字段偏移量、索引、长度使用过ArraySegmentbyte的同学可能已经大致理解到设计的精髓了这就是它的主要设计当我们访问span表示的整体或部分内存时内部的索引器会按照下面的算法运算指针伪代码ref T this[int index] { get ref ((ref reference byteOffset) index * sizeOf(T)); }整个变化的过程如图所示上面的动画非常清楚了吧旧span整合它的引用和偏移成新的span的引用整个过程并没有复制内存也没有返回相对位置上存在的副本而是直接返回实际存储位置的引用因此性能非常高因为新span获得并更新了引用所以垃圾回收器GC知道如何处理新的span从而获得了.Net至关重要的安全保障并且内部还会自动执行边界检查确保内存安全而这些都是span内部默默完成的开发人员根本不用担心非托管世界依然美好。正是由于span的高性能目前很多基础设施都开始支持span甚至使用span进行重构比如System.String.Substring方法我们都知道此方法是非常消耗性能的首先会创建一个新的字符串然后再从原始字符串中复制字符集给它而使用span可以实现Non-Allocating、Zero-coping下面是我做的一个基准测试使用String.SubString和Span.Slice分别截取长度为10和1000的字符串的前一半从指标Mean可以看出方法SubString的耗时随着字符串长度呈线性增长而Slice几乎保持不变从指标Allocated Memory/Op可以看出方法Slice并没有被分配新的内存实践出真知可以预见Span未来将会成为.Net下编写高性能应用程序的重要积木应用前景也会非常地广微服务、物联网、云原生都是它发光发热的好地方。基准测试示例总结从技术的本质上看SpanT是一种ref-like type类似引用的结构体从应用的场景上看它是高性能的sliceable type可切片类型综上所诉Span是一种类似于数组的结构体但具有创建数组一部分视图而无需在堆上分配新对象或复制数据的超能力。看完本篇博客如果理解了Span的What、Why、How那么作者布道的目的就达到了不懂的同学建议多读几遍下一篇我将会进一步畅谈Span的脾气秉性让大家能够安全高效地使用好它。补充从评论区交流发现有的同学误解了span表面上认为只是对指针的封装从而绕过unsafe带来的限制避免开发人员直接面对指针而已其实不是下面我们来看一个示例var nativeMemory Marshal.AllocHGlobal(100); Spanbyte nativeSpan; unsafe { nativeSpan new Spanbyte(nativeMemory.ToPointer(), 100); } SafeSum(nativeSpan); Marshal.FreeHGlobal(nativeMemory); // 这里不关心操作的内存类型即不用为一种类型写一个重载方法就好比上面的设计一样。 static ulong SafeSum(Spanbyte bytes) { ulong sum 0; for(int i0; i bytes.Length; i) { sum bytes[i]; } return sum; }看到了吗并没有绕过unsafe以前该如何用现在还是一样的span解决的是下面几点高性能避免不必要的内存分配和复制。高效率它可以为任何具有无复制语义的连续内存块提供安全和可编辑的视图极大地简化了内存操作即不用为每一种内存类型操作写一个重载方法。内存安全span内部会自动执行边界检查来确保安全地读写内存但它并不管理如何释放内存而且也管理不了因为所有权不属于它希望大家要明白这一点。它的目标是未来将成为.Net下编写高性能应用程序的重要积木。最后如果有什么疑问和见解欢迎评论区交流。如果你觉得本篇文章对您有帮助的话感谢您的【推荐】。如果你对.NET高性能编程感兴趣的话可以【关注我】我会定期的在博客分享我的学习心得。欢迎转载请在明显位置给出出处及链接。