StarRocks导入数据：从本地文件导入数据（Stream Load）

发布时间：2026/5/23 5:44:13

STREAM LOAD 允许您从本地文件系统或流式数据源导入数据。提交导入作业后系统会同步运行该作业并在作业完成后返回作业结果。您可以根据作业结果判断作业是否成功。有关 Stream Load 的应用场景、限制和支持的数据文件格式的信息请参阅通过 Stream Load 从本地文件系统导入数据。语法curl --location-trusted -u username:password -XPUT url ( data_desc ) [opt_properties]用户名和密码指定用于连接集群的账户的用户名和密码。这是一个必需参数。如果您使用的账户未设置密码则只需输入username:XPUT指定 HTTP 请求方法。这是一个必需参数。Stream Load 仅支持 PUT 方法。urlhttp://fe_host:fe_http_port/api/database_name/table_name/_stream_load参数是否必填描述fe_host是集群中 FE 节点的 IP 地址。注意如果您将导入作业提交到特定的 BE 或 CN 节点则必须输入该 BE 或 CN 节点的 IP 地址。fe_http_port是集群中 FE 节点的 HTTP 端口号。默认端口号为8030。注意如果您将导入作业提交到特定的 BE 或 CN 节点则必须输入该 BE 或 CN 节点的 HTTP 端口号。默认端口号为8030。database_name是表所属的数据库名称。table_name是表的名称。data_desc核心描述您要导入的数据文件。data_desc描述符可以包含数据文件的名称、格式、列分隔符、行分隔符、目标分区以及与表的列映射。语法-T file_path -H format: CSV | JSON -H column_separator: column_separator -H row_delimiter: row_delimiter -H columns: column1_name[, column2_name, ... ] -H partitions: partition1_name[, partition2_name, ...] -H temporary_partitions: temporary_partition1_name[, temporary_partition2_name, ...] -H jsonpaths: [ \json_path1\[, \json_path2\, ...] ] -H strip_outer_array: true | false -H json_root: json_path -H ignore_json_size: true | false -H compression: compression_algorithm | Content-Encoding: compression_algorithmopt_properties指定一些可选参数这些参数应用于整个导入作业。语法-H label: label_name -H where: condition1[, condition2, ...] -H max_filter_ratio: num -H timeout: num -H strict_mode: true | false -H timezone: string -H load_mem_limit: num -H partial_update: true | false -H partial_update_mode: row | column -H merge_condition: column_name实操演练csv文件导入csv文件准备在本地创建一个example.csv文件并写入数据vim example.csv # 写入以下数据 1,Lily,23 2,Rose,23 3,Alice,24 4,Julia,25进入StarRocks数据库创建数据库和表table1测试msyql -uroot -P9030 -h127.0.0.1 -p create database testdb; use testdb; CREATE TABLE table1 ( id int(11) NOT NULL COMMENT user ID, name varchar(65533) NULL COMMENT user name, score int(11) NOT NULL COMMENT user score ) ENGINEOLAP PRIMARY KEY(id) DISTRIBUTED BY HASH(id);包含id name 和score字段对应example.csv文件的内容现在设置导入参数-XPUThttp://198.134.198.12:8030/api/testdb/table1/_stream_load198.134.198.12:8030填写对应的IP和端口可以进入StarRocks数据库使用show proc frontends\G;查看http_port端口定义导入标识标签-H label:label1设置超时时间最长不超过100秒-H timeout:100设置错误容忍度最大为0.2-H max_filter_ratio:0.2指定用逗号,作为 CSV 列分隔符文件格式一致-H column_separator:,导入文件 -T 文件地址-T example.csvHTTP 1.1 标准请求头-H Expect:100-continue导入curl --location-trusted -u root:StarRocks123 -H label:label1 \ -H Expect:100-continue \ -H timeout:100 \ -H column_separator:, \ -H max_filter_ratio:0.2 \ -T example.csv \ -XPUT http://198.134.198.12:8030/api/testdb/table1/_stream_load导入作业完成后系统以 JSON 格式返回作业结果{ TxnId: 7399, Label: label1, Db: testdb, Table: table1, Status: Success, Message: OK, NumberTotalRows: 4, NumberLoadedRows: 4, NumberFilteredRows: 0, NumberUnselectedRows: 0, LoadBytes: 42, LoadTimeMs: 284, BeginTxnTimeMs: 1, StreamLoadPlanTimeMs: 3, ReadDataTimeMs: 0, WriteDataTimeMs: 107, CommitAndPublishTimeMs: 171 }参数名称说明TxnId导入作业的事务 ID。Label导入作业的标签。Status此次导入的数据的最终状态。Success表示数据导入成功数据已经可见。Publish Timeout表示导入作业已经成功提交但是由于某种原因数据并不能立即可见。可以视作已经成功、不必重试导入。Label Already Exists表示该标签已经被其他导入作业占用。数据可能导入成功也可能是正在导入。Fail表示数据导入失败。您可以指定标签重试该导入作业。Message导入作业的状态详情。如果导入作业失败这里会返回具体的失败原因。NumberTotalRows读取到的总行数。NumberLoadedRows成功导入的总行数。只有当返回结果中的Status为Success时有效。NumberFilteredRows导入过程中因数据质量不合格而过滤掉的行数。NumberUnselectedRows导入过程中根据 WHERE 子句指定的条件而过滤掉的行数。LoadBytes此次导入的数据量大小。单位字节 (Bytes)。LoadTimeMs此次导入所用的时间。单位毫秒 (ms)。BeginTxnTimeMs导入作业开启事务的时长。StreamLoadPlanTimeMs导入作业生成执行计划的时长。ReadDataTimeMs导入作业读取数据的时长。WriteDataTimeMs导入作业写入数据的时长。CommitAndPublishTimeMs导入作业提交和数据发布的耗时。如果导入作业失败系统还会返回ErrorURL例如{ErrorURL: http://172.26.195.68:8045/api/_load_error_log?fileerror_log_3a4eb8421f0878a6_9a54df29fd9206be}可以wget下来查看详情wget http://172.26.195.68:8045/api/_load_error_log?fileerror_log_3a4eb8421f0878a6_9a54df29fd9206be进入StarRocks客户端查看数据是否导入成功mysql use testdb; Reading table information for completion of table and column names You can turn off this feature to get a quicker startup with -A Database changed mysql select * from table1; -------------------- | id | name | score | -------------------- | 4 | Julia | 25 | | 1 | Lily | 23 | | 2 | Rose | 23 | | 3 | Alice | 24 | -------------------- 4 rows in set (0.04 sec)导入JSON文件在您的本地文件系统中创建一个名为example.json的 JSON 文件。该文件由两列组成依次表示城市 ID 和城市名称。{name: Beijing, code: 2}创建一个名为table2的主键表。该表由两列组成id和city其中id是主键。CREATE TABLE table2 ( id int(11) NOT NULL COMMENT city ID, city varchar(65533) NULL COMMENT city name ) ENGINEOLAP PRIMARY KEY(id) DISTRIBUTED BY HASH(id);启动 Stream Load运行以下命令将example2.json的数据导入到table2中curl -v --location-trusted -u root:StarRocks123 -H strict_mode: true \ -H Expect:100-continue \ -H format: json -H jsonpaths: [\$.name\, \$.code\] \ -H columns: city,tmp_id, id tmp_id * 100 \ -T example2.json -XPUT \ http://198.134.198.12:8030/api/testdb/table2/_stream_load如果您使用的账户未设置密码则只需输入username:。您可以使用 SHOW FRONTENDS 查看 FE 节点的 IP 地址和 HTTP 端口。example.json由两个键name和code组成映射到table2的id和city列如下图所示。上述图中的映射描述如下StarRocks 提取example2.json的name和code键并将它们映射到jsonpaths参数中声明的name和code字段。StarRocks 提取jsonpaths参数中声明的name和code字段并按顺序将它们映射到columns参数中声明的city和tmp_id字段。StarRocks 提取columns参数中声明的city和tmp_id字段并按名称将它们映射到table2的city和id列。-H columns: city,tmp_id, id tmp_id * 100在上述示例中example.json中code的值在加载到table2的id列之前乘以 100。有关jsonpaths、columns和 StarRocks 表列之间的详细映射请参见 STREAM LOAD 中的“列映射”部分。导入完成后您可以查询table2以验证导入是否成功mysql select * from testdb.table2; --------------- | id | city | --------------- | 200 | Beijing | --------------- 1 row in set (0.04 sec)官方文档https://docs.starrocks.io/zh/docs/loading/StreamLoad/大家有空可以看看CLup平台https://www.csudata.com/clup/manualhttps://www.csudata.com/clup/manual

MCP Server 集成：让 AI Agent 自动调用知识库

本文面向：想让 Claude Code 等 AI 工具自动访问 ChatCrystal 知识库的开发者。预计阅读时间：8 分钟 MCP 协议是什么 MCP（Model Context Protocol）是 Anthropic 提出的开放协议，定义了 AI 模型与外部工具之间的通信标…

2026/5/23 5:44:13 阅读更多

混合波束成形技术解析与工程实践

1. 混合波束成形技术架构解析混合波束成形（Hybrid Beamforming）是现代无线通信系统中的关键技术突破，它创造性地将射频（RF）域波束成形与基带数字波束成形相结合，解决了传统全数字波束成形硬件复杂度高、功耗…

2026/5/23 5:41:52 阅读更多

VRChat手势开发革命：Unity原生预览与实时绑定工作流

1. 这不是插件，是VRChat动画工作流的“手术台”你有没有在VRChat里调试一个手势动画，反复打包、上传、等待审核、再进世界测试，结果发现手指弯错了3度？我试过连续七次上传同一个Avatar，就为了调准一个拇指的旋转轴心—…

2026/5/23 5:41:52 阅读更多

基于Hugging Face的可解释视觉问答系统构建实践

1. 项目概述：这不是一个“调用API”的玩具，而是一套可落地、可调试、可解释的视觉问答闭环系统你有没有遇到过这样的场景：把一张工厂巡检现场的照片发给同事，问“3号冷却塔顶部法兰有没有漏液痕迹”，对方盯着图看了半分…

2026/5/23 6:25:16 阅读更多

设备端LLM优化Wi-Fi漫游：动态阈值与上下文感知

1. 设备端LLM在Wi-Fi漫游中的创新应用在移动设备普及的今天，Wi-Fi漫游质量直接影响着用户体验。传统基于固定RSSI阈值的漫游机制存在明显局限性：当信号强度低于预设阈值（通常为-70dBm）时，设备会启动扫描并切换至信号更…

2026/5/23 6:25:16 阅读更多

Unity连接Arduino BLE实战：5分钟实现PC端双向通信

1. 这不是“配对”，而是让Unity像手机App一样和Arduino对话很多人第一次尝试Unity连接Arduino蓝牙模块时，会下意识打开Windows的“蓝牙设置”去“添加设备”——结果折腾半小时，Unity里依然收不到任何数据。我最初也这么干过，直到…

2026/5/23 6:23:14 阅读更多

Godot MCP协议实战：构建游戏与AI的双向状态同步层

1. 这不是又一个“AI玩具”，而是能真正进游戏管线的MCP协议落地实践最近两周，我连续收到7位独立游戏开发者发来的私信，问题高度一致：“Godot里怎么让AI模型和游戏逻辑实时对话？不是调个API跑个文本，是让AI能…

2026/5/23 6:22:33 阅读更多

告别DDK噩梦：用WinDriver 2024快速搞定你的第一个USB设备驱动

告别DDK噩梦：用WinDriver 2024快速搞定你的第一个USB设备驱动在嵌入式开发和硬件接口编程领域，Windows设备驱动开发一直被视为高门槛的技术领域。传统Windows Driver Development Kit (DDK)开发方式需要开发者深入理解操作系统内核机制，面对…

2026/5/23 6:22:13 阅读更多

终极Windows键盘重映射指南：用SharpKeys解锁键盘隐藏潜力

终极Windows键盘重映射指南：用SharpKeys解锁键盘隐藏潜力【免费下载链接】sharpkeys SharpKeys is a utility that manages a Registry key that allows Windows to remap one key to any other key. 项目地址: https://gitcode.com/gh_mirrors/sh/sharpkeys …

2026/5/23 6:19:30 阅读更多

红黑树完全指南：从五条性质到完整插入删除实现

引言在前面的树系列中，我们学习了二叉搜索树（BST）和 AVL 树。AVL 树通过严格的平衡条件（|BF| ≤ 1）保证 O(log n) 的性能，但代价是删除操作可能触发 O(log n) 次旋转。红黑树（Red-Black Tree&am…

2026/5/23 0:01:37 阅读更多

黎曼猜想：哲学 × 数学思维范式全链条

黎曼猜想：哲学数学思维范式全链条华夏之光永存｜七大数学猜想思维范式全链条第二篇开篇黎曼猜想被公认为数学史上最伟大的未解难题。希尔伯特曾说：“如果我沉睡百年后醒来，第一个问题就是：黎曼猜想证明了吗&…

2026/5/23 0:02:38 阅读更多

在Nodejs后端服务中集成稳定可靠的大模型能力

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在Nodejs后端服务中集成稳定可靠的大模型能力应用场景类，针对需要构建智能对话或内容生成功能的后端工程师&#xff0…

2026/5/23 0:03:18 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/22 17:05:13 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/22 16:54:23 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/23 4:55:00 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/22 14:41:35 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/22 11:03:47 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…