HNU计算机系统实验三

发布时间：2026/5/20 11:01:52

前言做得很粗糙可能有很多问题仅供参考(x)手搓最小ELF可执行文件1.实验项目1.1项目名称最小ELF可执行文件1.2实验目的深入理解ELF文件结构掌握Linux系统调用机制理解链接器的工作原理学习汇编语言编程基础体验极致优化的思维方式。1.3实验资源本实验采用个性化设计每位学生的目标返回值即return的数值为其学号的末尾6位或4位数字。这里用的是后两位要不然有前导零本质上只是需要个性化2.实验任务2.1实验任务本实验包含六个阶段阶段一从最简单的C程序开始了解编译器生成的可执行文件大小学习使用基本优化手段减小文件“尺寸”。阶段二将C程序改写为汇编语言去除C运行时库的依赖直接使用Linux系统调用退出程序。阶段三理解ELF文件中的节Section 概念学习如何去除“非必要”内容使用ld直接链接。阶段四使用 nasm的bin输出格式手动构建—个完整的ELF可执行文件精确控制每个字节。阶段五通过让程序头表与ELF头重叠进一步减小文件大小。这是ELF优化的关键技巧。阶段六尝试达到ELF可执行文件的绝对最小值。利用Linux加载器的容错性移除文件末尾的零字节。2.2实验过程1实验资源处理使用命令sudo apt install nasm安装nasm为后续实验做准备2阶段一1编写基础C程序创建一个名为tiny.c的文件填入目标值xx后内容如下/* tiny.c */ int main () { return xx; }执行以下命令编译程序并查看返回值:~/exp3$ gcc -Wall tiny.c:~/exp3$ ./a.out; echo $?目标值:~/exp3$ wc -c a.out15776 a.out由输出结果可得该可执行文件大小为15776字节即约15.4KB从代码层面上无法继续简化因为只能修改return值而该值对文件大小并没有过多影响但使用gcc编译可减小文件大小例如使用指令gcc -Os -s tiny.c编译可发现文件大小为14336字节。2热身演习创建Example.asm文件并尝试编译BITS 32 GLOBAL main SECTION .text main: mov eax, 5 mov ebx, 10 add eax, ebx ret所用指令nasm -f elf32 Example.asmgcc -m32 -Wall -s Example.o -o example./exampleecho $?输出结果为15使用指令时会弹一个警告但不影响3使用strip优化使用 -s 选项移除可执行文件中的部分内容执行命令可得优化前的可执行文件大小为15776字节而优化后为14336字节:~/exp3$ gcc -Wall -s tiny.c:~/exp3$ wc -c a.out14336 a.out4使用编译器优化由图可知使用编译器优化后的大小仍然为14336效果不明显:~/exp3$ gcc -Wall -s -O3 tiny.c:~/exp3$ wc -c a.out14336 a.out5思考①strip命令移除了可执行文件中的符号表和调试信息等非运行必要内容仅保留机器指令和数据段因此可以减少文件大小。②-O3优化程序的计算逻辑而该程序构极其简单没有循环、函数调用或复杂计算因此编译器无法进行有效的高级优化。③一个可执行文件包括代码操作系统运行环境标准库和链接器信息。在这些内容里c代码占比大概在1%-10%。6阶段验证记录原始文件大小15776字节strip后大小14336字节-O3优化后大小 14336字节阶段一解锁密钥为上述三个数字用连字符连接格式数字1-数字2-数字3密钥15776-14336-143363阶段二1编写汇编程序创建tiny.asm文件BITS 32 GLOBAL _start SECTION .text _start: mov eax, 1 mov ebx, 32 int 0x802编译汇编程序nasm -f elf tiny.asmld -m elf_i386 -s tiny.o./a.out; echo $?输出32wc -c a.out输出4248 a.out3指令优化分析当前程序的机器码大小尝试使用更短的指令优化BITS 32 GLOBAL _start SECTION .text _start: xor eax, eax inc eax mov bl, 32 int 0x80nasm -f elf tiny.asmld -m elf_i386 -s tiny.o./a.out; echo $?输出32wc -c a.out输出4240 a.out4阶段验证记录优化前文件大小4248优化后文件大小 4240节省的字节数8阶段二解锁密钥为优化后大小×4节省字节数因此密钥169684阶段三1分析当前ELF结构使用readelf查看当前可执行文件的结构与内容(这里偷懒了结果太长只截了关键部分TT)观察下图可知映射表中出现.interp和.dynamic等关键词以及Dynamic section动态段表示当前可执行文件中存在动态链接行为。即使程序未显式调用外部库函数但gcc默认会链接标准库因此链接过程必然发生。尝试在gcc时使用-nostdlib 取消链接标准库和相关启动代码。nasm -f elf32 tiny.asmgcc -m32 -Wall -s -nostdlib tiny.o出现_start未定义报错2直接对_start 编程BITS 32 GLOBAL _start SECTION .text _start: mov eax, 32 retnasm -f elf tiny.asmgcc -m32 -nostdlib tiny.o./a.outSegmentation fault (core dumped)出现段错误因为代码最后用了retret会从栈中取返回地址然后跳转。在普通的C函数里ret的返回地址是调用者压入栈的而裸程序入口_start没有调用者也没有压入返回地址。因此执行ret时CPU取到的是随机或非法地址会出现段错误。在函数调用过程中栈会压入以下参数并由call指令自动压入返回地址函数内部可进一步保存旧基址寄存器及局部变量从而形成完整的栈帧结构。argc参数数量argv命令行参数内容envp环境变量信息使用gdb分析当前栈可得argc 0x00000001,argv[0] 0xffffd1a8, 后面则为envp内容如何从_start退出裸汇编程序_start必须自己调用系统调用退出。用int 0x80指令唤醒内核若要结束该进程并返回相应的值需要对寄存器eax赋值为1告诉内核结束进程对ebx赋返回值。因为在x86 Linux中eax 决定调用哪个功能而ebx/ecx/...是功能参数这是内核规定的固定接口。修改代码编译执行后再次查看文件发现修改后的程序仍然不符合预期BITS 32 GLOBAL _start SECTION .text _start: mov eax, 1 mov ebx, 32 int 0x803使用ld直接链接ld -m elf_i386 -s tiny.o可以发现终于没有链接部分了再查看当前的文件大小wc -c a.out4248 a.out进行缩减最后的内容是BITS 32 GLOBAL _start SECTION .text _start: xor eax, eax inc eax mov bl, 32 int 0x80nasm -f elf tiny.asmld -m elf_i386 -s tiny.owc -c a.out4240 a.out4理解大小变化1.gcc链接时默认添加了启动代码、标准库、编译器支持库以及动态链接器等以提供程序入口、运行时初始化、函数支持和正确退出机制从而保证程序能够在操作系统中正常运行。2.ld链接不会自动链接启动代码、标准库和运行时支持仅包含用户提供的目标代码针对按用户要求拼接因此文件更小5阶段验证记录阶段三解锁密钥格式LD-字节数密钥42405阶段四1编写ELF模板;tiny_elf.asm BITS 32 org 0x08048000 ehdr: db 0x7f, ELF, 1, 1, 1, 0 ; e_ident times 8 db 0 dw 2 ; e_type dw 3 ; e_machine dd 1 ; e_version dd _start ; e_entry dd phdr - $$ ; e_phoff dd 0 ; e_shoff dd 0 ; e_flags dw ehdrsize ; e_ehsize dw phdrsize ; e_phentsize dw 1 ; e_phnum dw 0 ; e_shentsize dw 0 ; e_shnum dw 0 ; e_shstrndx ehdrsize equ $ - ehdr phdr: dd 1 ; p_type dd 0 ; p_offset dd $$ ; p_vaddr dd $$ ; p_paddr dd filesize ; p_filesz dd filesize ; p_memsz dd 5 ; p_flags dd 0x1000 ; p_align phdrsize equ $ - phdr _start: mov bl, 32 xor eax, eax inc eax int 0x80 filesize equ $ - $$2编译并测试nasm -f bin -o a.out tiny_elf.asmchmod x a.outwc -c a.out91 a.out3分析文件结构输入指令xxd a.out | head -10验证ELF魔数前4字节 7F 45 4C 464思考ELF头大小程序头表大小 84字节程序代码大小 7字节文件总大小等于上述之和因为bin没有对齐或链接器干预。5阶段验证记录阶段四解锁密钥为文件大小 × 2 - 程序代码大小即1756阶段五1编写重叠版本原先ehdr的后八字节与phdr前八字节用小端法表示时均为01 00 00 00 00 00 00 00可以重叠;tiny_elf.asm BITS 32 org 0x08048000 ehdr: db 0x7f, ELF, 1, 1, 1, 0 ; e_ident db 0 _start: mov bl, 32 xor eax, eax inc eax int 0x80 ELF头剩余部分 dw 2 ; e_type dw 3 ; e_machine dd 1 ; e_version dd _start ; e_entry dd phdr - $$ ; e_phoff dd 0 ; e_shoff dd 0 ; e_flags dw ehdrsize ; e_ehsize dw phdrsize ; e_phentsize phdr: dd 1 ; p_type dd 0 ; p_offset ehdrsize equ $ - ehdr dd $$ ; p_vaddr dd $$ ; p_paddr dd filesize ; p_filesz dd filesize ; p_memsz dd 5 ; p_flags dd 0x1000 ; p_align phdrsize equ $ - phdr filesize equ $ - $$2编译并验证...省略指令...输出76 a.out3进一步优化org 0x08048000 -org 0x00010000dd 5 ; p_flags -dd 4 ; p_flags4阶段验证记录阶段五解锁密钥为文件大小即765思考在.bin文件里org只是逻辑偏移不是实际虚拟地址Linux不会按这个地址加载因此加载地址可以被改到如此“低”的数字。在.bin文件里操作系统不会解析p_flags因此可以填4.7阶段六1完成终极代码;tiny_elf.asm BITS 32 org 0x00010000 db 0x7f, ELF ; e_ident dd 1 ; p_type dd 0 ; p_offset dd $$ ; p_vaddr dw 2 ; e_type dw 3 ; e_machine dd _start ; e_version ;p_filesz dd _start ; e_entry ;p_memsz dd 4 ; e_phoff;p_flags _start: mov bl, 32 xor eax, eax inc eax int 0x80 db 0 dw 0x34 dw 0x20 db 1 filesize equ $ - $$2编译验证...省略指令...输出45 a.out3预期能够获得最⼩可执⾏⽂件⼤⼩是45字节其构成如下输入指令xxd a.out | head -10魔数依旧存在且占4字节程序头表有28字节代码7字节以及剩余部分5字节和填充的1字节。4))思考题bin输出纯二进制⽂件不会添加任何ELF结构因此e_phnum可以使用1字节并且p_filesz和p_memsz都⽐实际文件大小大也能正常运行db 0x7f,ELF违反了ELF标准标准要求16字节但实际只写4字节e_version / p_filesz和e_entry / p_memsz有字段覆盖情况_start:有头重叠情况e_phoff地址偏低。从一开始的15776字节到现在的45字节一共优化了15731字节压缩比约为99.7%。3总结3.1实验中出现的问题①在本次实验中出现了对nasm以及elf相关指令不熟悉的情况由于不同阶段对实验细节的要求不断提高指令也变得复杂②对elf结构不够熟悉即使参考指南更改代码也会遇到阻碍。3.2心得体会在本次实验中我通过一步步编写最小的ELF文件深入理解了 ELF 文件结构、程序头表、代码段以及裸二进制输出的原理。整个实验过程让我对加载程序、二进制文件格式和汇编编程有了更直观的认识。

微信小游戏性能天花板在哪？用Unity URP项目实测告诉你（附与iOS原生对比）

Unity URP项目在微信小游戏平台的性能边界实测与优化策略当Unity开发者将目光投向微信小游戏平台时，一个无法回避的核心问题是：这个平台的性能天花板究竟在哪里？本文将通过一组精心设计的URP项目实测数据，结合iOS原生平台的对比测…

2026/5/20 11:00:30 阅读更多

AI Agent到底是什么

AI Agent 到底是什么？看完我悟了今天看了几个产品，跟 AI 聊了聊，突然对 AI Agent 有了个很朴素的理解。AI Agent 不神秘很多人觉得 AI Agent 是什么高深的东西，只有大厂才能搞。但我现在的理解就一句话：❝ 「AI Age…

2026/5/20 10:59:08 阅读更多

集成测试实战

软件测试理论：https://blog.csdn.net/2402_88266590/article/details/160966638?spm1011.2415.3001.5331 单元测试实战：https://blog.csdn.net/2402_88266590/article/details/161017518?spm1001.2014.3001.5502 下面就开始进入集成测试的学习吧&…

2026/5/20 10:59:08 阅读更多

TrollInstallerX终极指南：3分钟解决iOS 14-16.6.1设备TrollStore安装难题

TrollInstallerX终极指南：3分钟解决iOS 14-16.6.1设备TrollStore安装难题【免费下载链接】TrollInstallerX A TrollStore installer for iOS 14.0 - 16.6.1 项目地址: https://gitcode.com/gh_mirrors/tr/TrollInstallerX 如果你曾经为在iOS设备上安装Troll…

2026/5/20 12:32:21 阅读更多

AMD Ryzen终极调试工具：免费开源硬件调优完全指南

AMD Ryzen终极调试工具：免费开源硬件调优完全指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitcod…

2026/5/20 12:32:20 阅读更多

从渔船到货轮：聊聊AIS数据在渔业监管、港口调度和海事保险里的那些事儿

从渔船到货轮：AIS数据驱动的海事产业变革与实践清晨五点，东海某渔场的电子围栏突然触发警报——一艘未报备的渔船正以异常轨迹靠近禁捕区。与此同时，上海洋山港的调度系统正根据实时到港船舶数据，动态调整泊位分配方案&#xff…

2026/5/20 12:31:19 阅读更多

用emWin定时器给你的STM32 GUI界面“注入灵魂”：实现动态数据刷新与简易动画（基于WM_TIMER消息）

用emWin定时器为STM32 GUI注入动态交互的灵魂在嵌入式设备的人机交互设计中，静态界面往往给人呆板的印象。想象一下工业仪表盘上凝固的数字，或是医疗设备上永不变化的指示灯——这种缺乏生命力的呈现方式不仅降低用户体验，还可能掩盖关键数据…

2026/5/20 12:30:18 阅读更多

如何快速下载B站4K高清视频：bilibili-downloader完全指南

如何快速下载B站4K高清视频：bilibili-downloader完全指南【免费下载链接】bilibili-downloader B站视频下载，支持下载大会员清晰度4K，持续更新中项目地址: https://gitcode.com/gh_mirrors/bil/bilibili-downloader 你是否曾想在B站…

2026/5/20 12:29:36 阅读更多

setup-java企业级实践：大型项目的依赖缓存和版本矩阵测试

setup-java企业级实践：大型项目的依赖缓存和版本矩阵测试【免费下载链接】setup-java Set up your GitHub Actions workflow with a specific version of Java 项目地址: https://gitcode.com/gh_mirrors/se/setup-java 在现代软件开发中，Java环…

2026/5/20 12:28:35 阅读更多

顶伯在线语音工具背后的技术力量：AI语音合成与深度学习解析

顶伯在线语音工具背后的技术力量在人工智能浪潮中，语音交互正成为人机沟通的核心方式。顶伯作为行业领先的在线语音工具，凭借自主研发的深度学习架构，将文字转化为高度自然的语音，广泛应用于有声阅读、智能客服、教育辅助等领域。…

2026/5/20 0:00:25 阅读更多

全志V3s开发板实战：用Buildroot 2020.02.4定制你的第一个最小Linux文件系统

全志V3s开发板实战：用Buildroot 2020.02.4定制最小Linux文件系统在嵌入式开发领域，构建一个精简高效的Linux文件系统往往是项目成功的关键第一步。全志V3s作为一款高性价比的ARM Cortex-A7芯片，搭配Buildroot这一经典构建工具，能…

2026/5/20 0:00:25 阅读更多

百考通：AI赋能期刊论文写作，智能生成优质内容

在学术研究领域，期刊论文的撰写是成果输出的关键环节，却也让众多科研工作者与学生倍感压力：选题迷茫、逻辑梳理困难、格式规范复杂、内容提炼耗时，严重拖慢了学术成果的发表节奏。百考通（https://www.baikaotongai.com…

2026/5/20 0:00:46 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/20 5:14:40 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/19 6:17:20 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/20 2:02:06 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/20 5:46:58 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/20 3:00:53 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/19 22:33:20 阅读更多

相关文章