Java的List.sort()排序方法源码理解

发布时间：2026/6/30 6:41:05

排序的入口List.sort()按照常识List是一个接口照理说sort()是不会实现的。JDK8新增了default关键字来修饰接口里的方法将方法标识为默认方法对应的实现default void sort(Comparator? super E c) { Object[] a this.toArray(); Arrays.sort(a, (Comparator) c); ListIteratorE i this.listIterator(); for (Object e : a) { i.next(); i.set((E) e); } }借用了Arrays.sort()的方法那么Arrays.sort()又是怎么实现的呢二、第一层实现Arrays.sort()public static T void sort(T[] a, Comparator? super T c) { if (c null) { sort(a); } else { if (LegacyMergeSort.userRequested) legacyMergeSort(a, c); else TimSort.sort(a, 0, a.length, c, null, 0, 0); } }这里可以看到一个判断分支if (LegacyMergeSort.userRequested)如果为true使用归并排序否则使用TimSort。userRequested的值是用下面的代码取得的允许用户通过参数手动选择是否使用归并排序userRequested java.security.AccessController.doPrivileged(new sun.security.action.GetBooleanAction(java.util.Arrays.useLegacyMergeSort)).booleanValue();我们先看看归并排序的实现。注意这段代码上方有段注释未来的发行版中会被移除也就意味着后续不会再使用归并排序了。private static T void legacyMergeSort(T[] a, Comparator? super T c) { T[] aux a.clone(); if (cnull) mergeSort(aux, a, 0, a.length, 0); else mergeSort(aux, a, 0, a.length, 0, c); }这两个mergeSort的区别只在于是否使用传入的Comparator。如果不使用则使用Object.equals()的默认比较方式来进行排序。下面先深入看一下mergeSort的实现。三、第二层实现之mergeSort归并排序的思想是将数组拆分成两部分分别对这两部分进行递归的归并排序。排序完成后同时用两个迭代器/指针遍历两个数组依次将其中最符合要求的从小到大排序就是最小的从大到小排序就是最大的放入新数组中。如果一个数组的元素放完了就把另一个数组剩余所有元素按已有顺序全部放入新数组中。3.1 为什么选择归并排序在众多的常见比较排序算法中在以空间换时间的策略下归并排序有着最好的平均性能并且是稳定的。这句话怎么理解呢比较排序即通过比较来决定元素的顺序。常见的比较排序包括插入排序、希尔排序、选择排序、堆排序、冒泡排序、快速排序、归并排序。空间换时间是指归并排序需要额外的临时数组空间复杂度为O(n)最好的平均性能也是O(nlogn)不会像快速排序在最差情况下的O(n^)稳定的是指排序后相同大小的元素前后顺序不会改变。平均性能为O(nlogn)的堆排序和快速排序都是不稳定的。各种常见排序算法的比较和原理本文就不展开讲了网络上连篇累牍非常多有兴趣可以自行了解。3.2 归并排序源码解读private static void mergeSort(Object[] src, Object[] dest, int low, int high, int off) { int length high - low; // Insertion sort on smallest arrays if (length INSERTIONSORT_THRESHOLD) { for (int ilow; ihigh; i) for (int ji; jlow ((Comparable) dest[j-1]).compareTo(dest[j])0; j--) swap(dest, j, j-1); return; } // Recursively sort halves of dest into src int destLow low; int destHigh high; low off; high off; int mid (low high) 1; mergeSort(dest, src, low, mid, -off); mergeSort(dest, src, mid, high, -off); // If list is already sorted, just copy from src to dest. This is an // optimization that results in faster sorts for nearly ordered lists. if (((Comparable)src[mid-1]).compareTo(src[mid]) 0) { System.arraycopy(src, low, dest, destLow, length); return; } // Merge sorted halves (now in src) into dest for(int i destLow, p low, q mid; i destHigh; i) { if (q high || p mid ((Comparable)src[p]).compareTo(src[q])0) dest[i] src[p]; else dest[i] src[q]; } }这个算法分两部分当数组长度INSERTIONSORT_THRESHOLD(源码中是7)时直接使用插入排序用一部分时间复杂度上升换取一部分空间复杂度的下降。对于归并排序的递归部分off表示偏移量这个参数只有在数组内部分元素排序时才是一个非0值整个数组排序时是0可以不关心。high表示传入的是数组长度因此数组最后一个元素的下标是(high-1)。low则是第一个元素的下标。计算中值使用了位操作。当长度为大于1的奇数时均分的两个子数组由于舍去了小数值前一个数组的元素比后一个少一个。对于归并排序的归并部分如果前一个数组的最后一个元素比后一个数组的第一个元素(大/小)直接合并这里的System.arraycopy是native方法。归并的遍历简化了写法没有先做下标的运算再调用System.arraycopy而是直接两个数组一起遍历。可以看出此处for循环中的if是合并了很多场景写成的。四、第二层实现之TimSort4.1 背景看完归并排序的实现才是重头TimSort。以下摘自JDK注释A stable, adaptive, iterative mergesort that requires far fewer than nlg(n) comparisons when running on partially sorted arrays, while offering performance comparable to a traditional mergesort when run on random arrays. Like all proper mergesorts, this sort is stable and runs O(n log n) time (worst case). In the worst case, this sort requires temporary storage space for n/2 object references; in the best case, it requires only a small constant amount of space.简单概括一下TimSort是稳定、自适应、迭代的归并排序在部分有序的数组上比较次数远少于nlogn在随机数组上的表现和传统的归并排序一样。TimSort的理论最初在1993年由Peter Mcllroy提出由Tim Peters于2002年在Python中应用后续逐步成为了包括Java、Swift、谷歌浏览器的默认排序方法。Tim Peters 本人对 TimSort 原理的介绍见http://svn.python.org/projects/python/trunk/Objects/listsort.txt4.2 基本概念不打算在这里介绍过多的概念造成阅读代码时的困难先知道一些核心的概念就行了。run —— 可以直观地翻译为一趟跑步的距离、旅程、航程等代表了一部分已经有序的子数组。这里不打算自己造概念以下仍称为run。galloping mode —— 可以译为加速模式同样不翻译。4.3 算法框架先不纠结具体细节看一下TimSort的整体框架。注意在Arrays.sort()调用处的入参是TimSort.sort(a, 0, a.length, c, null, 0, 0)其中a是待排序数组T[] a,c是比较器Comparator? super T c。static T void sort(T[] a, int lo, int hi, Comparator? super T c, T[] work, int workBase, int workLen) { assert c ! null a ! null lo 0 lo hi hi a.length; // (1)第一部分 int nRemaining hi - lo; if (nRemaining 2) return; // Arrays of size 0 and 1 are always sorted // If array is small, do a mini-TimSort with no merges if (nRemaining MIN_MERGE) { int initRunLen countRunAndMakeAscending(a, lo, hi, c); binarySort(a, lo, hi, lo initRunLen, c); return; } //(2) /** * March over the array once, left to right, finding natural runs, * extending short natural runs to minRun elements, and merging runs * to maintain stack invariant. */ TimSortT ts new TimSort(a, c, work, workBase, workLen); int minRun minRunLength(nRemaining); do { // Identify next run int runLen countRunAndMakeAscending(a, lo, hi, c); // If run is short, extend to min(minRun, nRemaining) if (runLen minRun) { int force nRemaining minRun ? nRemaining : minRun; binarySort(a, lo, lo force, lo runLen, c); runLen force; } // Push run onto pending-run stack, and maybe merge ts.pushRun(lo, runLen); ts.mergeCollapse(); // Advance to find next run lo runLen; nRemaining - runLen; } while (nRemaining ! 0); // Merge all remaining runs to complete sort assert lo hi; ts.mergeForceCollapse(); assert ts.stackSize 1; }先看最开头的部分(1)。如果待排序部分nRemaining过小(为0或1)直接返回结果很好理解。如果nRemainingMIN_MERGE(MIN_MERGE被设置为32)则使用一个“微型”的TimSort也即二分插入排序的变体。这个二分插入排序内部不做任何合并。这一步的解读参考后文5.1节这里暂时跳过只需要知道countRunAndMakeAscending方法的目的是计算待排序部分__从起始位置起保持升序或降序的最长的run的长度initRunLen__。接着看第(2)部分。这部分先创建了一个TimSort对象对象内有什么先不管继续看框架部分。int minRun minRunLength(nRemaining)是一个纯粹对数值计算方法目的是计算出将数组需要划分成多少个run这时的run的长度使用minRun表示并且需要让nRemaining/minRun最接近一个2的幂实际上nRemaining/k严格小于2的幂。这种情况下的分组的个数接近2的幂更利于合并。具体的计算方法minRunLength()不在这节展开请参考后文5.2节。计算出要拆分的run的个数minRun后进入循环循环中包括计算数组中从lo开始最长连续递增的序列长度如果长度不满一个minRun强制将从lo开始的数组扩展到minRun长度或在排序中可以处理的最大长度nRemaining。将当前处理的run压栈pushRun并视情况mergemergeCollapse并将lo下标前移未排序个数nRemaining减去本次的runLen循环直到nRemaining0。循环完成时做一次强制merge——mergeForceCollapse更具体的实现接下来需要研究一下TimSort这个类使用的三个类方法pushRun、mergeCollapse、mergeForceCollapse。4.4 TimSort类的实例化TimSort类只会在调用TimSort.sort()方法时实例化一次并且这个构造方法是private的。借助这个对象实例保存一些处理中数据。4.4.1 成员变量简单翻译了一下注释。如果看不懂可以先不纠结继续看后续的排序方法来理解。/** * 最小的待合并的run长度的阈值 */ private static final int MIN_MERGE 32; /** * 待排序的数组 */ private final T[] a; /** * 比较器 */ private final Comparator? super T c; /** * galloping mode 的初始阈值。连续取胜达到该次数后切换到 gallop */ private static final int MIN_GALLOP 7; /** * 当前进入 galloping mode 的阈值随数据特征动态调整 */ private int minGallop MIN_GALLOP; /** * 初始化用于存放临时排序数据的数组长度最大值 */ private static final int INITIAL_TMP_STORAGE_LENGTH 256; /** * 用于归并的临时数组 */ private T[] tmp; private int tmpBase; // base of tmp array slice private int tmpLen; // length of tmp array slice /** * 待归并的run的栈。第i个run下标从base[i]开始长度是len[i]。 * 满足runBase[i] runLen[i] runBase[i 1] * */ private int stackSize 0; // Number of pending runs on stack private final int[] runBase; private final int[] runLen;4.4.2 构造方法排序时创建的参数是worknull的因此不会走下面的分支。构造方法初始化了用于存放临时数据的数组以及用来存放待排序栈的run的起始下标和长度。private TimSort(T[] a, Comparator? super T c, T[] work, int workBase, int workLen) { this.a a; this.c c; // Allocate temp storage (which may be increased later if necessary) int len a.length; int tlen (len 2 * INITIAL_TMP_STORAGE_LENGTH) ? len 1 : INITIAL_TMP_STORAGE_LENGTH; if (work null || workLen tlen || workBase tlen work.length) { SuppressWarnings({unchecked, UnnecessaryLocalVariable}) T[] newArray (T[])java.lang.reflect.Array.newInstance

一分钟搞明白RPC远程过程调用

在互联网大厂的微服务架构中，几百、上千个服务拆分部署在不同服务器、不同机房，用户的一次点击，往往需要调用十余个服务协同完成。支撑这些跨机器、跨服务高效通信的核心技术，正是RPC（远程过程调用）。很多新手开发者会混淆HTTP和RPC，简单来说：HTTP是面向浏览器、通用…

2026/6/30 6:40:45 阅读更多

ASP通用防SQL注入代码实战：原理、部署与绕过分析

1. 项目概述：为什么ASP防注入代码需要“通用”且“最新”？ 十多年前，我刚开始接触Web开发时，ASP（Active Server Pages）还是构建动态网站的主流技术。那时候，SQL注入攻击已经非常猖獗&#xff0c…

2026/6/30 6:40:45 阅读更多

计算机毕业设计之基于深度学习的危险驾驶行为识别系统

基于深度学习的危险驾驶行为识别系统，通过引入YOLO检测模块，实现了对危险驾驶行为的精准识别。用户只需上传图片，系统即可实时显示置信度与识别结果，极大提升了识别效率与准确性。此外，系统还提供数据图表功能&#xf…

2026/6/30 6:40:24 阅读更多

关于软件测试统计月度报告的方案总结（更新中）

开个文章记录个人总结方法图表测试平台的图表一般限制类型，如需自定义则需要付费。可以使用第三方文档方式从测试平台api自动拉取数据，自己在文档中进行自定义图表，随时可以更新图表计算方式测试耗时和开发修复质量一次修复率&#xff08…

2026/6/30 7:53:17 阅读更多

魔兽世界API与宏工具：新手玩家的终极免费指南

魔兽世界API与宏工具：新手玩家的终极免费指南【免费下载链接】wow_api Documents of wow API -- 魔兽世界API资料以及宏工具项目地址: https://gitcode.com/gh_mirrors/wo/wow_api 想要在魔兽世界中提升游戏效率，掌握API查询和宏命令编写是每个…

2026/6/30 7:53:17 阅读更多

人形机器人动作模仿的关键问题：如何让策略既像人，又能在真机上稳定执行

1. 动作模仿不是复制姿势人形机器人动作模仿不是逐帧复制人体姿态，而是在动态系统中跟踪参考运动。一个动作模仿策略需要同时控制：关节位置关节速度躯干姿态手、脚、膝、肘等关键 body 位置身体重心地面接触动作连续性因此，动作模仿本质上是一…

2026/6/30 7:53:17 阅读更多

客流统计如何结合AI分析？从传统计数到智能决策的技术升级路径

一、客流统计行业现状与技术迭代历程线下实体商业与公共空间的数字化转型浪潮中，客流数据始终是最基础也最核心的决策依据。从早期的人工点数到如今的AI智能分析，客流统计技术的每一次迭代，都在推动线下运营从"经验驱动"向"数…

2026/6/30 7:52:37 阅读更多

ChatGPT提示词设计终极框架（工业级Prompt模板SOP v3.2——附GitHub开源模板仓库链接）

更多请点击： https://kaifayun.com 第一章：ChatGPT提示词设计终极框架概览提示词设计不是经验主义的试错，而是一套可复用、可验证、可迭代的系统性工程。本框架以目标对齐、角色锚定、上下文约束、输出规范、反馈闭环五大支柱为内核&#x…

2026/6/30 7:52:17 阅读更多

【CANdelaStudio-从入门到深入到实战】81 从“普通话”到“方言”：如何用CANdelaStudio管理多车型变体配置

81 从“普通话”到“方言”：如何用CANdelaStudio管理多车型变体配置开篇故事去年夏天，我帮一家新势力车企做诊断架构评审。他们的OBD诊断团队有30多人，同时开发三款车型：一款纯电轿车、一款增程SUV、一款换电MPV。团队用了统一的CANdelaStudio项目模板，看起来“普通…

2026/6/30 7:51:56 阅读更多

Google限制Meta使用Gemini模型凸显AI授权竞争白热化

近日，据多家科技媒体报道，Google已对Meta施加限制，禁止其在部分产品或服务中直接使用Gemini AI模型。这一消息一经传出，便在人工智能领域掀起波澜，凸显出当前大厂间AI模型授权竞争的激烈程度。新闻导语：根…

2026/6/30 0:01:09 阅读更多

XGBoost超参数实战：从理论到调优策略

1. XGBoost超参数基础认知第一次接触XGBoost时，我被它那密密麻麻的参数列表吓到了。这感觉就像面对一架波音747的驾驶舱——每个按钮都可能有神奇的效果，但按错了就可能坠机。经过多年实战，我发现其实掌握十几个核心参数就能解决90%的问题。…

2026/6/30 0:02:51 阅读更多

ChatGPT函数调用从入门到高并发落地：3步完成生产级集成，附可直接运行的TypeScript+Python双模版

更多请点击： https://kaifayun.com 第一章：ChatGPT函数调用的核心原理与演进脉络函数调用（Function Calling）是大语言模型从纯文本生成迈向结构化交互的关键跃迁。其本质并非模型原生具备“执行代码”的能力，而是通…

2026/6/30 0:04:11 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/30 0:04:06 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/30 1:24:32 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/30 1:24:32 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/29 13:06:32 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/29 13:32:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/29 13:32:14 阅读更多

相关文章

一分钟搞明白RPC远程过程调用

ASP通用防SQL注入代码实战：原理、部署与绕过分析

计算机毕业设计之基于深度学习的危险驾驶行为识别系统

关于软件测试统计月度报告的方案总结（更新中）

魔兽世界API与宏工具：新手玩家的终极免费指南

人形机器人动作模仿的关键问题：如何让策略既像人，又能在真机上稳定执行

客流统计如何结合AI分析？从传统计数到智能决策的技术升级路径

ChatGPT提示词设计终极框架（工业级Prompt模板SOP v3.2——附GitHub开源模板仓库链接）

【CANdelaStudio-从入门到深入到实战】81 从“普通话”到“方言”：如何用CANdelaStudio管理多车型变体配置

Google限制Meta使用Gemini模型 凸显AI授权竞争白热化

XGBoost超参数实战：从理论到调优策略

ChatGPT函数调用从入门到高并发落地：3步完成生产级集成，附可直接运行的TypeScript+Python双模版

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

Google限制Meta使用Gemini模型凸显AI授权竞争白热化