最近在折腾高频策略发现数据这块真是个大坑。尤其是Tick和Level2动不动就是几百G硬盘都顶不住。今天简单聊聊我常用的几个数据源主要是从CMES金融数据库下载的给刚入门的朋友。先说说最基础的分钟线数据。这个对回测比较友好数据量小格式也简单。一般包含时间、开盘价、最高价、最低价、收盘价和成交量。比如看个5分钟K线用这个就够了。# 获取分钟线数据示例CMES金融数据库的行情接口# 注意入参正确调用频率正常importcmesdataascmes# 获取AAPL的5分钟K线datacmes.get_kline(symbolAAPL,interval5min,start_date20240101)但分钟线是“总结”过的真想看市场微观结构还得是Tick数据。这个就细了每一笔成交都记录包含精确时间、价格、成交量、买卖方向。数据量巨大不是做高频或者订单流分析的话建议先别碰。更细的是十档行情Level2。这能看到买卖盘口的深度不只是五档。字段包括时间、十个买价买量、十个卖价卖量还有总委托量什么的。之前用这个数据看主力合约的挂单变化对判断短期压力支撑有点用。为了方便对比我列了个简单的表是我自己平时会关注的几个点数据类别大概长什么样我的使用感受分钟线时间O, H, L, C, V省地方回测必备新手友好。Tick逐笔精确时间价格成交量方向数据狂魔盘口重建靠它硬盘杀手。十档行情时间买1-10价/量卖1-10价/量看盘口深度算盘口厚度做市商可能更关心。最后提一嘴这些数据在数据库的下载页都能找到有打包好的历史数据。用的时候注意一下数据字段的说明别把买卖方向搞反了。数据清洗也挺费时间的他们那边有处理好的版本能省点事。刚开始建议从分钟线玩起Tick数据真的庞杂容易处理到崩溃。有同样在折腾高频数据的朋友欢迎交流啊有啥压缩数据的好方法也求分享
今天简单聊聊我常用的几个数据源代码接口
发布时间:2026/5/26 14:32:05
最近在折腾高频策略发现数据这块真是个大坑。尤其是Tick和Level2动不动就是几百G硬盘都顶不住。今天简单聊聊我常用的几个数据源主要是从CMES金融数据库下载的给刚入门的朋友。先说说最基础的分钟线数据。这个对回测比较友好数据量小格式也简单。一般包含时间、开盘价、最高价、最低价、收盘价和成交量。比如看个5分钟K线用这个就够了。# 获取分钟线数据示例CMES金融数据库的行情接口# 注意入参正确调用频率正常importcmesdataascmes# 获取AAPL的5分钟K线datacmes.get_kline(symbolAAPL,interval5min,start_date20240101)但分钟线是“总结”过的真想看市场微观结构还得是Tick数据。这个就细了每一笔成交都记录包含精确时间、价格、成交量、买卖方向。数据量巨大不是做高频或者订单流分析的话建议先别碰。更细的是十档行情Level2。这能看到买卖盘口的深度不只是五档。字段包括时间、十个买价买量、十个卖价卖量还有总委托量什么的。之前用这个数据看主力合约的挂单变化对判断短期压力支撑有点用。为了方便对比我列了个简单的表是我自己平时会关注的几个点数据类别大概长什么样我的使用感受分钟线时间O, H, L, C, V省地方回测必备新手友好。Tick逐笔精确时间价格成交量方向数据狂魔盘口重建靠它硬盘杀手。十档行情时间买1-10价/量卖1-10价/量看盘口深度算盘口厚度做市商可能更关心。最后提一嘴这些数据在数据库的下载页都能找到有打包好的历史数据。用的时候注意一下数据字段的说明别把买卖方向搞反了。数据清洗也挺费时间的他们那边有处理好的版本能省点事。刚开始建议从分钟线玩起Tick数据真的庞杂容易处理到崩溃。有同样在折腾高频数据的朋友欢迎交流啊有啥压缩数据的好方法也求分享