Python实战：如何用几行代码解析通达信申万宏源的tnf股票数据（附完整代码）

发布时间：2026/5/22 1:11:46

Python实战高效解析通达信申万宏源TNF股票数据的完整指南在金融数据分析领域获取和处理原始数据往往是第一步也是最关键的一步。对于使用通达信申万宏源金融终端的分析师和开发者来说TNF文件是存储股票基础信息的重要数据源。本文将带你深入探索如何用Python高效解析这些二进制文件构建一个完整的股票代码与名称数据库。1. 理解TNF文件结构与解析原理TNF文件是通达信系统中用于存储股票基础信息的二进制格式文件通常包含股票代码、名称、拼音缩写等关键字段。与常见的CSV或JSON格式不同二进制文件需要精确了解其内部结构才能正确读取。通过十六进制编辑器分析shs.tnf文件我们可以发现其记录结构具有以下特征每条记录固定占用0x168字节360字节股票代码存储在记录起始位置0x00偏移处占6字节股票名称存储在0x1F偏移处占8字节GBK编码拼音缩写存储在0x149偏移处占4字节关键解析参数表字段偏移量长度编码说明股票代码0x006字节ASCII如600000股票名称0x1F8字节GBK中文名称拼音缩写0x1494字节ASCII如PFYH注意不同版本的TNF文件结构可能略有差异建议先用十六进制编辑器验证偏移量2. 构建基础解析函数让我们从最核心的解析函数开始逐步构建完整的解决方案。以下代码展示了如何读取单个TNF文件并提取所有股票记录import os from typing import List, Dict def parse_tnf_file(file_path: str) - List[Dict]: 解析通达信TNF文件返回股票信息列表 :param file_path: TNF文件路径 :return: 包含股票信息的字典列表 stocks [] with open(file_path, rb) as f: # 获取文件大小并初始化偏移量 file_size os.path.getsize(file_path) current_offset 0x32 # 第一条记录的起始偏移 while current_offset 0x14C file_size: f.seek(current_offset) # 读取股票代码(6字节ASCII) code_bytes f.read(6) stock_code code_bytes.decode(ascii).rstrip(\x00) # 读取股票名称(8字节GBK) f.seek(current_offset 0x1F) name_bytes f.read(8) stock_name name_bytes.decode(gbk, errorsignore).rstrip(\x00) # 读取拼音缩写(4字节ASCII) f.seek(current_offset 0x149) py_bytes f.read(4) py_abbr py_bytes.decode(ascii).rstrip(\x00) # 添加到结果列表 if stock_code: # 过滤空记录 stocks.append({ code: stock_code, name: stock_name, pinyin: py_abbr, market: os.path.basename(file_path)[:3].upper() }) # 移动到下一条记录 current_offset 0x168 return stocks这个基础函数已经可以处理单个TNF文件但实际应用中我们通常需要处理多个市场的数据文件如shs.tnf、szs.tnf等。3. 多文件批量处理与数据整合通达信通常将不同市场的股票数据分开存储我们需要扩展解析功能以支持批量处理def batch_parse_tnf(tnf_dir: str) - List[Dict]: 批量解析指定目录下的所有TNF文件 :param tnf_dir: 包含TNF文件的目录路径 :return: 合并后的股票信息列表 all_stocks [] tnf_files [ f for f in os.listdir(tnf_dir) if f.lower().endswith(.tnf) ] for tnf_file in tnf_files: file_path os.path.join(tnf_dir, tnf_file) try: stocks parse_tnf_file(file_path) all_stocks.extend(stocks) except Exception as e: print(f解析文件{tnf_file}时出错: {str(e)}) return all_stocks典型目录结构示例C:/zd_swhy_gm/T0002/hq_cache/ ├── shs.tnf # 上海市场 ├── szs.tnf # 深圳市场 └── bjs.tnf # 北京市场4. 数据存储与SQLite集成将解析后的数据存入SQLite数据库可以极大提高后续查询效率。以下是创建数据库并存储股票信息的完整代码import sqlite3 from typing import List def create_stocks_db(db_path: str, stocks: List[Dict]) - None: 创建股票信息数据库 :param db_path: 数据库文件路径 :param stocks: 股票信息列表 conn sqlite3.connect(db_path) cursor conn.cursor() # 创建数据表 cursor.execute( CREATE TABLE IF NOT EXISTS stocks ( code TEXT PRIMARY KEY, name TEXT NOT NULL, pinyin TEXT, market TEXT, update_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP ) ) # 批量插入数据 cursor.executemany( INSERT OR REPLACE INTO stocks (code, name, pinyin, market) VALUES (:code, :name, :pinyin, :market) , stocks) conn.commit() conn.close()数据库优化建议为常用查询字段如market、pinyin创建索引添加update_time字段跟踪数据更新时间考虑使用WAL模式提高并发性能5. 完整解决方案与异常处理将上述组件整合我们得到一个健壮的TNF解析管道包含完善的错误处理和日志记录import logging from datetime import datetime def setup_logging(): 配置日志记录 logging.basicConfig( levellogging.INFO, format%(asctime)s - %(levelname)s - %(message)s, handlers[ logging.FileHandler(tnf_parser.log), logging.StreamHandler() ] ) def main(): setup_logging() # 配置路径 config { tnf_dir: C:/zd_swhy_gm/T0002/hq_cache, db_path: stocks.db } try: logging.info(开始解析TNF文件...) start_time datetime.now() # 解析所有TNF文件 stocks batch_parse_tnf(config[tnf_dir]) logging.info(f成功解析{len(stocks)}条股票记录) # 存储到数据库 create_stocks_db(config[db_path], stocks) elapsed (datetime.now() - start_time).total_seconds() logging.info(f处理完成耗时{elapsed:.2f}秒) except Exception as e: logging.error(f处理过程中发生错误: {str(e)}, exc_infoTrue) raise if __name__ __main__: main()异常处理要点文件不存在或权限问题文件格式不匹配或损坏编码解析错误数据库连接问题6. 高级应用与性能优化对于大规模数据处理我们可以进一步优化解析性能内存映射技术加速文件读取import mmap def parse_with_mmap(file_path: str) - List[Dict]: stocks [] with open(file_path, rb) as f: with mmap.mmap(f.fileno(), 0, accessmmap.ACCESS_READ) as mm: file_size len(mm) current_offset 0x32 while current_offset 0x14C file_size: # 使用内存映射直接读取 code mm[current_offset:current_offset6].decode(ascii).rstrip(\x00) name mm[current_offset0x1F:current_offset0x27].decode(gbk, errorsignore).rstrip(\x00) pinyin mm[current_offset0x149:current_offset0x14D].decode(ascii).rstrip(\x00) if code: stocks.append({ code: code, name: name, pinyin: pinyin }) current_offset 0x168 return stocks多进程并行处理from multiprocessing import Pool def parallel_parse(tnf_dir: str, workers: int 4) - List[Dict]: 多进程并行解析TNF文件 tnf_files [ os.path.join(tnf_dir, f) for f in os.listdir(tnf_dir) if f.lower().endswith(.tnf) ] with Pool(workers) as pool: results pool.map(parse_tnf_file, tnf_files) return [stock for sublist in results for stock in sublist]性能对比表方法10万条记录耗时内存占用适用场景常规读取3.2秒较低小文件处理内存映射1.8秒较高大文件处理多进程1.2秒高多文件批量处理7. 实际应用案例解析后的数据可以广泛应用于各种金融分析场景案例1构建股票代码名称映射服务class StockCodeMapper: def __init__(self, db_path): self.conn sqlite3.connect(db_path) self.conn.row_factory sqlite3.Row def code_to_name(self, code): cursor self.conn.cursor() cursor.execute(SELECT name FROM stocks WHERE code?, (code,)) result cursor.fetchone() return result[name] if result else None def name_to_code(self, name): cursor self.conn.cursor() cursor.execute(SELECT code FROM stocks WHERE name?, (name,)) result cursor.fetchone() return result[code] if result else None def search_by_pinyin(self, pinyin): 通过拼音缩写搜索股票 cursor self.conn.cursor() cursor.execute(SELECT code, name FROM stocks WHERE pinyin LIKE ?, (f{pinyin}%,)) return [dict(row) for row in cursor.fetchall()]案例2与日线数据关联分析def analyze_stock_trend(db_path, code, start_date, end_date): 结合日线数据进行分析 conn sqlite3.connect(db_path) # 获取股票基本信息 stock_info conn.execute( SELECT name, market FROM stocks WHERE code?, (code,) ).fetchone() if not stock_info: return None # 根据市场确定日线数据路径 market_dir sh if stock_info[market] SHS else sz day_file fC:/zd_swhy_gm/vipdoc/{market_dir}/lday/{code}.day # 解析日线数据(这里需要另外的解析函数) day_data parse_day_file(day_file, start_date, end_date) return { code: code, name: stock_info[name], data: day_data }在处理实际项目时我发现最常遇到的坑是编码问题——不同版本的TNF文件可能使用不同的字符编码。一个实用的技巧是准备多种编码方案GBK、GB2312、UTF-8等并实现自动检测机制当主要编码解析失败时尝试备选方案。

前端CSS精讲02：外边距合并与塌陷，彻底解决布局间距错乱

前端CSS精讲02：外边距合并与塌陷，彻底解决布局间距错乱文章目录前端CSS精讲02：外边距合并与塌陷，彻底解决布局间距错乱一、什么是外边距合并？常见场景：兄弟元素上下相邻二、什么是外边距塌陷？常见场景：父子元素嵌套三、外边距合并的解决方案四、外边距塌陷的四…

2026/5/22 1:10:16 阅读更多

蓝桥杯国赛C++ B组那道‘皮亚诺曲线’题，我是这么递归拆解的（附完整代码）

蓝桥杯国赛C B组皮亚诺曲线题解：递归分治与空间变换的艺术皮亚诺曲线这道题在蓝桥杯国赛现场确实让不少选手望而生畏——包括最初的我。但当我静下心来拆解后，发现它完美展现了递归思维和空间变换的魅力。本文不会直接给你答案，而是带你经历…

2026/5/21 16:36:44 阅读更多

老显卡重生指南：HD5770、HD7770与Haswell在Sonoma下的Metal/QE/CI修复实战

1. 老显卡在Sonoma系统下的困境与转机最近苹果发布了全新的macOS Sonoma系统，带来了不少令人兴奋的新功能。但对于我们这些还在使用老硬件的黑苹果玩家来说，却面临着一个严峻的问题：苹果又一次放弃了对老旧显卡的支持。特别是AMD的HD5770、…

2026/5/21 9:40:42 阅读更多

打通本地与云端，LangChain 混合部署环境的兼容性避坑手册

当合规遇上架构：混合部署的真实痛点你是否遇到过这样的困境：本地开发时 LangChain 调用本地大模型一切顺畅，一旦部署到云端生产环境，却因数据合规要求必须将敏感数据保留在本地，而计算任务上云？这种“数据…

2026/5/22 1:11:43 阅读更多

2026年5月降AI软件红黑榜出炉：论文AI率90%降至3.8%，精准去除ai痕迹！

2025 年 12 月 25 日知网 AIGC 检测系统升级，2026 年 4 月 27 日维普 AI 率检测平台升级…2026 毕业季，各大主流 AIGC 检测软件陆续升级系统，识别 AI 痕迹更加精准。临近毕业，同学们看者飘红的 AIGC 检测报告、纷繁复杂的降 AI 系…

2026/5/22 1:11:22 阅读更多

【大模型12步学习路线 · 第10步 · ③IC验证实战篇】Veri-Copilot v0.6:领域 Retriever + Verilog LoRA 三层微调

【大模型12步学习路线第10步 ③IC验证实战篇】Veri-Copilot v0.6:领域 Retriever + Verilog LoRA 三层微调,DATE 2027 ablation 实验定型系列定位:「大模型正确学习顺序」12 步系列第 10 步微调的 ③IC 验证实战篇。**Veri-Copilot 完成"通用模型 + 通用 retrieve…

2026/5/22 1:11:02 阅读更多

[智能体-3]：RESTful 接口超全详解（通俗易懂 + 实战规范）

一、基础概念1. 名词解释REST：Representational State Transfer，表述性状态转移RESTful：遵循 REST 设计风格的接口，就是 RESTful API核心思想：用 HTTP 标准方法，对网络资源做增删改查2. 核心定位前后端分离…

2026/5/22 1:10:20 阅读更多

离散几何拓扑数论（终稿·全定义完整版一）

离散几何拓扑数论（终稿全定义完整版） 作者：乖乖数学日期：2026 年 5 月 21 日体系：离散几何拓扑数论（ Discrete Geometric Topological Number Theory）

2026/5/22 1:09:33 阅读更多

一次一密临时票据：医疗跨系统SSO的安全设计方案

在医疗信息化建设中，跨系统集成（例如 HIS/EMR 嵌入移动护理系统的体温单、评估单等页面）是一个极具代表性的业务场景。然而，如何安全、优雅、轻量化地实现系统间的单点登录与数据隔离，往往是研发过程中的难点。本文将…

2026/5/22 1:09:11 阅读更多

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

5月21日，华泰柏瑞中韩半导体ETF（513310.SH）延续强势表现，当日收盘价报5.625元，涨幅达4.52%，盘中交投异常活跃，换手率109.80%，量比为1.32，市场资金交易热情高涨。然而&…

2026/5/22 0:00:46 阅读更多

11. 架构：前端工程化与状态管理实战

写在前面：如果说后端 MVT 引擎是 GIS 系统的“心脏”，那么前端就是它的“大脑”和“面孔”。在现代 WebGIS 开发中，如何优雅地管理复杂的图层状态、如何处理海量瓦片的渲染逻辑，是决定项目成败的关键。今天，我们将深入 light-mvt-server 的前端核心，看看如何利用 Vite …

2026/5/22 0:01:27 阅读更多

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟【免费下载链接】taojinbi 淘宝淘金币自动执行脚本，包含蚂蚁森林收取能量，芭芭农场全任务，解放你的双手项目地址: https://gitcode.com/gh_mi…

2026/5/22 0:02:07 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/21 8:30:37 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/21 16:37:36 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/21 8:30:37 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/21 5:00:59 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/21 1:50:14 阅读更多

相关文章