前OpenAI安全研究VP万字长文扒Scaling Laws：你用的模型可能喂错数据量！

发布时间：2026/6/26 22:11:59

【导语前OpenAI安全研究VP翁荔停更13个月后发表万字新文《Scaling Laws, Carefully》扒了支撑大模型行业数百亿美元投入的Scaling Laws指出当下模型可能喂错数据量背后是不同团队研究结论的差异及诸多技术细节问题。】Scaling Laws框架结论分歧2020年OpenAI研究员Jared Kaplan提出Scaling Laws框架认为在log - log坐标上训练损失随参数量N、数据量D、算力C的增加呈直线下降且模型规模应比数据增长更快如算力涨10倍模型参数涨5.5倍训练数据只涨1.8倍。GPT - 3就是按此训练1750亿参数只喂了3000亿token参数量近数据量6倍。然而2022年DeepMind的Jordan Hoffmann团队重做实验规模更大、方法更细。对比Gopher2800亿参数3000亿token和Chinchilla700亿参数1.4万亿tokenChinchilla参数仅Gopher四分之一但训练数据是四倍多且在所有评测上碾压Gopher。其结论是参数和token最佳比例约为1:20即参数翻一倍训练数据也应翻一倍。Kaplan结论的问题所在翁荔分析Kaplan结论错误原因一是实验规模问题。Kaplan实验最大模型仅15亿参数却将结论外推到万亿参数在log - log空间里小规模区间的微小拟合差异外推几个数量级后会变成系统性预测偏差。二是参数口径问题。Kaplan不算embedding层参数小模型上embedding占比大去掉后显著改变了N和C的关系。2024年Pearce和Song证明把embedding加回去Kaplan的0.73次方自然收敛到Chinchilla的0.5说明其结论只在局部区间成立。Chinchilla代码的隐藏bug2024年Epoch AI团队逐行复现Chinchilla的拟合代码发现两个bug。Bug 1是损失函数实现里取了均值而不是求和L - BFGS - B优化器因loss值太小以为收敛而提前停止未找到真正的全局最优解。Bug 2是两个核心幂律指数α和β被四舍五入到小数点后两位从两位数反推的其他参数误差被指数级放大置信区间窄得离谱看似“显著”实则是假象。Epoch AI修正后的真实值α ≈ 0.3478β ≈ 0.3658再次确认Chinchilla模型和数据等比增长的方向但原论文具体数字需修正。数据墙训练数据的困境此前所有关于Scaling Laws的讨论都基于训练数据无限、不重复的前提但人类生产的高质量文本数据预计2026到2028年就会耗尽只能重复训练。而重复数据的价值指数衰减Muennighoff等人引入“有效数据量”概念同一批数据反复训练边际价值遵循D_eff U*(1 - e^(-R))规律每多一轮收益递减。Lovelace等人2026年的新工作显式建模了过拟合惩罚项发现强weight decay可有效缓解重复训练的过拟合。Scaling Laws敏感的观测性指南翁荔在博客里嵌了交互式模拟器调整拟合精度、噪声水平、拟合区间等参数会发现看似无关紧要的工程选择如loss保留几位小数、噪声在0.001量级都能导致外推预测差出十万八千里。这表明Scaling Laws不是物理定律而是对工程细节高度敏感的观测性指南。编辑观点翁荔的文章深入剖析了Scaling Laws揭示了行业研究中的问题和数据困境为大模型训练提供了更严谨的思考方向对行业发展有重要指导意义。

Harness Engineering 是什么？AI Agent 工程化框架解析

🔥 个人主页： 杨利杰YJlio ❄️ 个人专栏： 《Windows 疑难杂症与工单复盘案例库》《Sysinternals实战教程》《WINDOWS教程》《Windows PowerShell 实战》《IOS插件分析测试》《超简单：用Python让Excel飞起来》…

2026/6/26 22:11:59 阅读更多

Linux以太网之MDIO扫描注册phy及C22和C45

Linux以太网之MDIO扫描注册phy及C22和C45 | DDNotesLinux以太网之MDIO扫描注册phy及C22和C45MDIO扫描注册phy在 Linux 内核中，MDIO 子系统对 PHY 设备的扫描和注册，从GMAC驱动中对mdiobus注册开始，主要涉及到几个关键文件中： 硬件…

2026/6/26 22:11:18 阅读更多

AQS 原理初探

学 JUC 时发现 AQS 是很多同步工具的基础，记录一下理解。什么是 AQS AQS（AbstractQueuedSynchronizer）是 Java 并发包的一个基类，ReentrantLock、CountDownLatch、Semaphore 都是基于它实现的。核心思想 AQS 内部维护了&…

2026/6/26 22:11:18 阅读更多

UI自动化测试实战：从元素定位到框架搭建的完整指南

1. UI自动化测试：从入门到精通的实战指南如果你是一名测试工程师，或者正在向这个方向发展，那么“UI自动化测试”这个词对你来说一定不陌生。它几乎是现代软件测试工程师的必备技能，也是提升测试效率、保障软件质量的关键手段。简单…

2026/6/26 23:45:36 阅读更多

猫抓浏览器扩展技术架构解析：现代网络资源嗅探的工程实现

猫抓浏览器扩展技术架构解析：现代网络资源嗅探的工程实现【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 猫抓（cat-catch&a…

2026/6/26 23:45:36 阅读更多

OPENCV——查找图形轮廓

图像形状查找在OPENCV里面是非常常见的功能，它常用于视觉任务、目标检测、图像分割等等。在OPENCV中通常使用Canny函数、findContours函数、drawContours函数结合在一起去做轮廓的形检测。一、重要函数讲解1.1 findContours函数的简介以及定义在OPENCV中通常使用fin…

2026/6/26 23:44:53 阅读更多

MyComputerManager终极指南：3分钟彻底清理Windows“此电脑“顽固图标

MyComputerManager终极指南：3分钟彻底清理Windows"此电脑"顽固图标【免费下载链接】MyComputerManager 管理“此电脑”里删不掉的流氓“快捷方式”（包括侧边栏），同时可自己添加这类“快捷方式” 项目地址: https://g…

2026/6/26 23:44:53 阅读更多

构建微信消息路由引擎：wechat-forwarding 架构解析与实战应用

构建微信消息路由引擎：wechat-forwarding 架构解析与实战应用【免费下载链接】wechat-forwarding 在微信群之间转发消息项目地址: https://gitcode.com/gh_mirrors/we/wechat-forwarding 在复杂的组织协作环境中，微信作为主要的沟通工具承载着海…

2026/6/26 23:43:51 阅读更多

现场 w3wp 卡顿，dump 抓回来托管栈全是死的：一次从 696 万对象里挖根因的排查实录

作者：技术从业16年，踩过坑、做过技术负责人、带过团队，也亲眼看着AI把很多”理所当然”的事情重新洗牌。不追热点，只写真实踩过的坑和总结过的东西，欢迎关注一起交流。起因：现场说"系统卡得没法用了&…

2026/6/26 23:42:49 阅读更多

Qwen2.5-Turbo百万上下文实战指南：百炼平台长文本处理全解析

1. 项目概述：这不是一次普通模型更新，而是一次上下文能力的质变跃迁“Qwen2.5-Turbo上线阿里云百炼平台，模型上下文长度扩展至百万tokens”——这句话里藏着三个关键信号：Turbo不是简单提速，而是面向生产环境的工程化重…

2026/6/26 0:00:43 阅读更多

Kotlin的@JvmStatic与@JvmField：与Java互操作的注解

Kotlin作为一门现代编程语言，与Java的互操作性一直是其核心优势之一。为了让Kotlin代码能够无缝对接Java，Kotlin提供了多种注解来优化互操作体验，其中JvmStatic和JvmField是两个关键注解。它们分别用于解决静态成员和字段在Java中的访问问题&…

2026/6/26 0:02:05 阅读更多

AI 驱动下 GEO 与 SEO 融合实战指南

摘要：本文深入探讨了从传统SEO到生成式搜索（GEO）的范式转移，为技术内容创作者揭示了新搜索生态下的挑战与机遇。面对大模型直接生成答案的趋势，单纯的关键词排名已不足以保证流量。文章系统性地提出了三大核心策略&…

2026/6/26 0:02:25 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/26 1:06:03 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/26 1:06:07 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/26 1:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/26 12:42:30 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…