Node.js 流处理：高效处理大数据的艺术

发布时间：2026/5/21 8:32:27

Node.js 流处理高效处理大数据的艺术什么是流在 Node.js 中流Stream是处理大量数据的抽象接口。它允许我们逐块读取或写入数据而不需要一次性将全部数据加载到内存中。为什么需要流想象一下处理一个 10GB 的日志文件如果使用fs.readFile会将整个文件加载到内存中可能导致内存溢出使用流可以逐块读取每处理完一块就释放内存流的四种类型1. Readable可读流用于读取数据例如从文件或网络读取。const fs require(fs); const readable fs.createReadStream(large-file.txt); readable.on(data, (chunk) { console.log(Received ${chunk.length} bytes); }); readable.on(end, () { console.log(Finished reading); });2. Writable可写流用于写入数据例如写入文件或发送到网络。const fs require(fs); const writable fs.createWriteStream(output.txt); writable.write(Hello, ); writable.write(World!); writable.end();3. Duplex双工流既可以读取也可以写入例如 TCP socket。const net require(net); const server net.createServer((socket) { socket.write(Hello from server); socket.on(data, (data) { console.log(Received: ${data}); }); });4. Transform转换流在读取和写入之间进行数据转换例如压缩、加密。const { Transform } require(stream); const upperCase new Transform({ transform(chunk, encoding, callback) { this.push(chunk.toString().toUpperCase()); callback(); } });流的核心概念背压Backpressure当写入速度慢于读取速度时数据会在内存中堆积导致内存溢出。流自动处理背压问题。readable.on(data, (chunk) { if (!writable.write(chunk)) { readable.pause(); } }); writable.on(drain, () { readable.resume(); });Pipe管道使用pipe方法可以自动处理背压是推荐的数据传输方式。const fs require(fs); const zlib require(zlib); fs.createReadStream(input.txt) .pipe(zlib.createGzip()) .pipe(fs.createWriteStream(input.txt.gz));实战创建自定义流创建自定义可读流const { Readable } require(stream); class NumberStream extends Readable { constructor(max) { super({ objectMode: true }); this.max max; this.current 1; } _read() { if (this.current this.max) { this.push(this.current); } else { this.push(null); } } } const stream new NumberStream(5); stream.on(data, (num) console.log(num));创建自定义转换流const { Transform } require(stream); class JSONParser extends Transform { constructor() { super({ readableObjectMode: true }); this.buffer ; } _transform(chunk, encoding, callback) { this.buffer chunk; let index; while ((index this.buffer.indexOf(\n)) ! -1) { const line this.buffer.slice(0, index); this.buffer this.buffer.slice(index 1); try { this.push(JSON.parse(line)); } catch (e) { console.error(Invalid JSON:, line); } } callback(); } _flush(callback) { if (this.buffer) { try { this.push(JSON.parse(this.buffer)); } catch (e) { console.error(Invalid JSON:, this.buffer); } } callback(); } }流的高级用法并发流处理const { pipeline, Transform } require(stream); const fs require(fs); const processor new Transform({ transform(chunk, encoding, callback) { const result processChunk(chunk); callback(null, result); } }); pipeline( fs.createReadStream(input.txt), processor, fs.createWriteStream(output.txt), (err) { if (err) { console.error(Pipeline failed:, err); } else { console.log(Pipeline succeeded); } } );流与 Promise 结合const { pipeline } require(stream/promises); const fs require(fs); async function processFile() { try { await pipeline( fs.createReadStream(input.txt), fs.createWriteStream(output.txt) ); console.log(Processing complete); } catch (err) { console.error(Error:, err); } }流在实际项目中的应用场景一日志处理const fs require(fs); const { createInterface } require(readline); const rl createInterface({ input: fs.createReadStream(access.log), crlfDelay: Infinity }); rl.on(line, (line) { const log parseLog(line); if (log.statusCode 400) { console.log(Error:, line); } });场景二数据转换const csv require(csv-parser); const fs require(fs); fs.createReadStream(data.csv) .pipe(csv()) .on(data, (row) { const json transformRow(row); writeToDatabase(json); }) .on(end, () { console.log(CSV parsing complete); });场景三HTTP 响应流const http require(http); const fs require(fs); http.createServer((req, res) { const stream fs.createReadStream(large-file.zip); res.writeHead(200, { Content-Type: application/zip }); stream.pipe(res); }).listen(3000);性能优化建议1. 使用适当的 highWaterMarkconst stream fs.createReadStream(file.txt, { highWaterMark: 64 * 1024 // 64KB });2. 避免不必要的数据转换尽可能在流中直接处理数据避免多次转换。3. 使用对象模式对于非二进制数据使用objectMode: true可以提高可读性。总结Node.js 流是处理大数据的利器掌握流的使用能够显著降低内存占用提高处理速度实现高效的数据管道从日志分析到文件处理从数据转换到 HTTP 响应流的应用无处不在。深入理解流的原理和用法将使你成为更优秀的 Node.js 开发者。

打破QQ音乐格式枷锁：qmcdump如何让加密音频重获自由播放权

打破QQ音乐格式枷锁：qmcdump如何让加密音频重获自由播放权【免费下载链接】qmcdump 一个简单的QQ音乐解码（qmcflac/qmc0/qmc3 转 flac/mp3），仅为个人学习参考用。项目地址: https://gitcode.com/gh_mirrors/qm/qmcdump 还…

2026/5/21 8:31:06 阅读更多

中兴光猫破解工具zteOnu：三步解锁隐藏功能，完全掌控你的网络设备

中兴光猫破解工具zteOnu：三步解锁隐藏功能，完全掌控你的网络设备【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 你是否曾经想要深度配置中兴光猫却苦于没有权限…

2026/5/21 8:31:06 阅读更多

发票OCR识别总是失败？一文解决90%的常见问题（附Python/Java调试指南）

发票OCR识别总是失败？一文解决90%的常见问题（附Python/Java调试指南） 导语：发票OCR识别明明API调通了，但返回结果要么是空，要么字段乱码，甚至直接报错“识别失败”……别急着怪API，8…

2026/5/21 8:31:06 阅读更多

VMware虚拟机突然断网？别慌，试试这个NAT模式一键重置法（附主机WiFi适配器设置）

VMware虚拟机断网急救指南：NAT模式重置与主机适配器深度解析从一次紧急调试说起深夜11点23分，程序员老张正在虚拟机里调试一个即将上线的微服务接口。突然，git pull命令卡住不动，ping测试显示"Destination Host Unreachabl…

2026/5/21 9:01:24 阅读更多

Keil5写注释总变问号？3步搞定UTF-8编码和字体设置，告别中文乱码

Keil5中文乱码终极解决方案：从编码原理到实战配置作为一名长期使用Keil进行嵌入式开发的工程师，我深知中文乱码问题对开发效率的影响有多大。刚接触Keil时，我也曾被满屏的问号和方块困扰过。经过多次实践和深入研究，我发现解决这…

2026/5/21 9:00:21 阅读更多

别再复制粘贴了！VS2022配置MySQL C++ Connector的5个常见坑点与解决方案

VS2022配置MySQL C Connector避坑指南：从错误中学习的实战手册在Visual Studio 2022中配置MySQL C Connector看似简单，但实际操作中开发者常会遇到各种"坑"。这些错误信息往往晦涩难懂，让人摸不着头脑。本文将带你深入分析五个最常…

2026/5/21 9:00:21 阅读更多

ai-agent框架spring ai/alibaba原理源码分析(三) 外部调用III-skills

简介 spring ai alibaba是java的ai agent框架，本系列将深入剖析 Spring AI Alibaba 的源码实现与核心原理，不仅指导agent的开发，更可以改造框架，增加新特性，贡献Spring AI Alibaba的发展。系列内容： 系列…

2026/5/21 8:59:40 阅读更多

第33天：Web前端之JavaScript与框架

Python学习100天（从入门到精通系列文章）文章目录 Python学习100天（从入门到精通系列文章）前言一、JavaScript基本语法 1.1 语句和注释 1.2 变量和数据类型 1.3 表达式和运算符 1.4 分支与循环结构 1.5 函数二、面向对象编程 2.1 对象的概念 2.2 标准对象三、BOM与DOM操…

2026/5/21 8:59:40 阅读更多

CSS基础知识总结

CSS 全称 Cascading Style Sheets（层叠样式表），作用就是美化HTML页面——给HTML标签设置颜色、大小、间距、布局等，让单调的标签变得更美观、更有层次感。HTML是页面的“骨架”，CSS就是页面的“皮肤”。一、CSS的引入…

2026/5/21 8:59:40 阅读更多

别只刷固件了！用MissionPlanner搞定四旋翼‘飘移’问题，校准compass_mot全流程

四旋翼飞行品质优化：MissionPlanner高级校准实战指南当你的四旋翼无人机已经能够稳定起飞，却在定高模式下出现难以解释的飘移现象时，这往往意味着需要进入更深层次的飞控调校阶段。许多飞手在完成基础校准后便止步不前，殊不知电机…

2026/5/21 0:00:23 阅读更多

科研学术篇---论文搜索方法

高效搜集和研读论文，是构建扎实知识体系的基石。要想做到“高效”与“高质”并重，需要把整个过程当作一个闭环系统来优化——从目标锁定、来源筛选、检索策略，到快速粗筛、深度内化、持续追踪，每一步都有对应的工具和心法。下面逐…

2026/5/21 0:01:25 阅读更多

YOLOv11城市道路摩托车与自行车目标检测数据集-1569张-motorcycle-1_2

YOLOv11城市道路摩托车与自行车目标检测数据集 📊 数据集基本信息目标类别： [‘bike’, ‘motorcycle’]中文类别：[‘自行车’, ‘摩托车’]训练集：1374 张验证集：130 张测试集：65 张总计：1569…

2026/5/21 0:03:28 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/21 8:30:37 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/20 16:14:50 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/21 8:30:37 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/21 5:00:59 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/21 1:50:14 阅读更多

相关文章

打破QQ音乐格式枷锁：qmcdump如何让加密音频重获自由播放权

中兴光猫破解工具zteOnu：三步解锁隐藏功能，完全掌控你的网络设备

发票OCR识别总是失败？一文解决90%的常见问题（附Python/Java调试指南）

VMware虚拟机突然断网？别慌，试试这个NAT模式一键重置法（附主机WiFi适配器设置）

Keil5写注释总变问号？3步搞定UTF-8编码和字体设置，告别中文乱码

别再复制粘贴了！VS2022配置MySQL C++ Connector的5个常见坑点与解决方案

ai-agent框架spring ai/alibaba原理源码分析(三) 外部调用III-skills

第33天：Web前端之JavaScript与框架

CSS基础知识总结

别只刷固件了！用MissionPlanner搞定四旋翼‘飘移’问题，校准compass_mot全流程

科研学术篇---论文搜索方法

YOLOv11城市道路摩托车与自行车目标检测数据集-1569张-motorcycle-1_2

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)