使用TiSpark在Spark中访问TiDB

发布时间：2026/5/17 17:28:05

下面通过具体的操作步骤来演示如何使用TiSpark查询TiKV中的数据。1进入Spark的conf目录生成spark-defaults.conf文件。cd /root/training/spark-3.0.0-bin-hadoop3.2/conf/ cp spark-defaults.conf.template spark-defaults.conf2在spark-defaults.conf中添加如下配置spark.sql.extensions org.apache.spark.sql.TiExtensions spark.tispark.pd.addresses 127.0.0.1:2379 spark.sql.catalog.tidb_catalog org.apache.spark.sql.catalyst.catalog.TiCatalog spark.sql.catalog.tidb_catalog.pd.addresses 127.0.0.1:23793重启Spark集群。4启动TiDB数据库集群tiup playground v8.5.1 \ --db 1 --pd 1 --kv 2 \ --tiflash 0 --without-monitor # 提示这里将会使用部门表dept和员工表emp进行演示。5启动Spark交互式命令行工具spark-shell并同时加载TiSpark的包bin/spark-shell --master spark://192.168.79.10:7077 \ --jars /root/tools/tispark-assembly-3.0-2.5.3.jar6通过TiSpark执行一个多表连接查询。scala spark.sql(use tidb_catalog) scala spark.sql(select d.dname,e.ename,e.sal from scott.dept d,scott.emp e where d.deptnoe.deptno).show # 输出的结果如下 -------------------- | dname| ename| sal| -------------------- | RESEARCH| SMITH| 800| | SALES| ALLEN|1600| | SALES| WARD|1250| | RESEARCH| JONES|2975| | SALES|MARTIN|1250| | SALES| BLAKE|2850| |ACCOUNTING| CLARK|2450| | RESEARCH| SCOTT|3000| |ACCOUNTING| KING|5000| | SALES|TURNER|1500| | RESEARCH| ADAMS|1100| | SALES| JAMES| 950| | RESEARCH| FORD|3000| |ACCOUNTING|MILLER|1300| --------------------通过Spark Web Console可以进一步查看TiSpark任务执行的过程。通过使用TiSpark也可以连接不同数据源中的数据从而进行多表连接查询。下面的示例将两张表一张表是部门表dept该表存储在文件系统中如本地文件系统或者Hadoop HDFS中另一张表是员工表emp该表存储在TiDB中。具体的操作步骤如下1查看部门表dept中的数据# cat dept.csv 10,ACCOUNTING,NEW YORK 20,RESEARCH,DALLAS 30,SALES,CHICAGO 40,OPERATIONS,BOSTON # 提示这是一个本地文件系统上的csv文件。2启动Spark Shellbin/spark-shell --master spark://192.168.79.10:7077 \ --jars /root/tools/tispark-assembly-3.0-2.5.3.jar3将部门表加载到Spark的DataFrame中scala val deptDF spark.read.format(csv).option(seq,,).schema(deptno int,dname string,loc string).load(/root/dept.csv) # 提示通过Spark可以加载本地文件系统、Hadoop HDFS、Hive等数据源中的数据。4将deptDF注册为视图。scala deptDF.createOrReplaceTempView(dept)5通过TiSpark关联TiDB数据库中的员工表emp执行多表查询。scala spark.sql(use tidb_catalog) scala spark.sql(select d.dname,e.ename,e.sal from dept d,scott.emp e where d.deptnoe.deptno).show # 输出的结果如下 -------------------- | dname| ename| sal| -------------------- | RESEARCH| SMITH| 800| | SALES| ALLEN|1600| | SALES| WARD|1250| | RESEARCH| JONES|2975| | SALES|MARTIN|1250| | SALES| BLAKE|2850| |ACCOUNTING| CLARK|2450| | RESEARCH| SCOTT|3000| |ACCOUNTING| KING|5000| | SALES|TURNER|1500| | RESEARCH| ADAMS|1100| | SALES| JAMES| 950| | RESEARCH| FORD|3000| |ACCOUNTING|MILLER|1300| --------------------

从F1 90到62 F1 90：用Wireshark和CANoe‘解剖’一次完整的UDS 0x22数据读取会话

从F190到62F190：用Wireshark和CANoe解剖UDS 0x22数据读取会话当你第一次在Wireshark中看到22服务请求和62响应报文时，那些十六进制字节可能就像天书一样难以理解。但正是这些看似杂乱的数据流，承载着现代汽车电子系统最核心的诊断信息交换。…

2026/5/17 3:01:53 阅读更多

三相三电平Vienna整流器：SPWM与SVPWM调制仿真及控制策略对比分析

三相三电平vienna整流器SPWM和SVPWM调制仿真基于plecs搭建温度场分析双PI控制锁相环控制中点电压平衡控制功率因数为1 SPWM和SVPWM调制对比谐波畸变率对比分析电压利用率对比分析电压平衡和不平衡控制对比图1 仿真模型图2 温度场分析图3 交流电压电流三电平…

2026/5/16 22:41:43 阅读更多

C# 核心技术解析：Parse vs TryParse 实战指南

文章目录1. 核心区别：暴力型 vs. 稳重型Parse: 默认数据正确TryParse: 典型的 C# 模式示例2. 执行流程图3. 性能4. 高性能方案4.1. 高性能转换：Span<char> 与 Utf8Parser4.2. 执行流程：内存视角4.3. 类型转换对比5. 易混淆在 C# 处理字…

2026/5/17 3:01:54 阅读更多

HttpOnly Cookie 深度解析

一、什么是 HttpOnly Cookie HttpOnly 是一个可以附加在 Set-Cookie 响应头上的标志位（flag）。当一个 Cookie 被标记为 HttpOnly 后，客户端脚本（如 JavaScript）将无法通过 document.cookie 等 API 访问该 Cookie&…

2026/5/17 11:08:34 阅读更多

GA/T 1400视图库实战：从零部署Easy1400平台到设备级联全流程解析

1. 初识GA/T 1400与Easy1400平台第一次接触GA/T 1400标准时，我完全被各种专业术语绕晕了。简单来说，这是一套专门针对视频监控领域的行业标准，规定了视频图像信息在采集、传输、存储等环节的技术要求。而Easy1400就是基于这个标准开发的一套…

2026/5/17 11:08:34 阅读更多

OAuth 2.0 and OIDC 三大安全机制对比：State vs Nonce vs PKCE

一、问题背景 OAuth 2.0 和 OpenID Connect 的授权流程依赖浏览器重定向，这天然暴露了多种攻击面： 攻击类型描述CSRF攻击者诱导用户的浏览器携带恶意授权码完成绑定Token 重放窃取的 id_token 被重复提交给客户端授权码劫持恶意应用在同一设备上拦截授…

2026/5/17 11:08:34 阅读更多

AI驱动i18n翻译：基于LLM的JSON本地化文件批量处理实践

1. 项目概述与核心价值最近在折腾一个多语言项目，需要把几百条中文文案翻译成英文、日文、法文等十几种语言。手动翻译？不现实，成本高、周期长、一致性还难保证。用传统的翻译API？虽然方便，但面对专业术语、产品特有名…

2026/5/17 11:07:33 阅读更多

Cloudflare Sandbox SDK：本地开发无缝调用云端服务的RPC解决方案

1. 项目概述：一个被低估的云端开发利器如果你正在寻找一种能让你在本地开发环境中，就能安全、高效地调用云端服务的方法，那么cloudflare/sandbox-sdk绝对是一个值得你花时间研究的项目。乍看之下，这个名字可能有些抽象——“沙盒S…

2026/5/17 11:07:33 阅读更多

基于MCP协议构建巴西开放数据网关：架构设计与工程实践

1. 项目概述：一个为巴西数据开放平台量身定制的MCP服务器如果你正在开发一个需要接入巴西官方开放数据平台（Dados Abertos）的应用，或者你是一名数据分析师、研究员，希望以编程化的方式高效、稳定地获取巴西的各类公共数…

2026/5/17 11:07:12 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/17 0:01:09 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/17 0:01:09 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/17 0:02:11 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

2026/5/17 0:01:09 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/17 0:01:09 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

2026/5/17 0:02:11 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/16 21:19:19 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/16 19:35:34 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/16 17:57:38 阅读更多

相关文章

从F1 90到62 F1 90：用Wireshark和CANoe‘解剖’一次完整的UDS 0x22数据读取会话

三相三电平Vienna整流器：SPWM与SVPWM调制仿真及控制策略对比分析

C# 核心技术解析：Parse vs TryParse 实战指南

HttpOnly Cookie 深度解析

GA/T 1400视图库实战：从零部署Easy1400平台到设备级联全流程解析

OAuth 2.0 and OIDC 三大安全机制对比：State vs Nonce vs PKCE

AI驱动i18n翻译：基于LLM的JSON本地化文件批量处理实践

Cloudflare Sandbox SDK：本地开发无缝调用云端服务的RPC解决方案

基于MCP协议构建巴西开放数据网关：架构设计与工程实践

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)