搜索广告算法工程师大模型学习--1.计划

发布时间：2026/5/16 3:49:22

大模型时代搜索广告算法专家理论与数学重构进阶计划前置约束与学习定调核心目标从传统 NLP 分类思维彻底向大模型生成式思维Generative与搜索广告业务思维Ranking/Retrieval转型。学习风格抛弃浅尝辄止拒绝实践调参。直击底层数学公式推导、模型架构差异与目标函数Loss设计。时间规划无强制时间表按“阶段目标”稳步推进。阶段一Transformer 及核心演进理论重构焦点与目标找回 Transformer 的底层直觉并掌握大模型时代对原生 Transformer 的几项关键数学改造。理解为什么现在的模型长这样以及它们为了解决什么计算瓶颈。学习顺序与核心文献1. 原生 Transformer 的数学拆解核心关注Self-Attention 的Q K T / d k QK^T/\sqrt{d_k}QKT/dk缩放意义、FFN 层的升降维逻辑、Residual 与 LayerNorm 对梯度的影响。精读文献Attention Is All You Need (NeurIPS 2017)优质讲解The Illustrated Transformer (Jay Alammar) / 知乎翻译版图解 TransformerTransformer 的数学原理与公式推导知乎2. 位置编码的革命RoPE (Rotary Position Embedding)核心关注从绝对位置编码到相对位置的转换。理解欧拉公式e i θ e^{i\theta}eiθ在注意力机制中的旋转矩阵推导以及它如何保持平移不变性。精读文献RoFormer: Enhanced Transformer with Rotary Position Embedding (2021)优质讲解十分钟读懂旋转位置编码RoPE苏剑林科学空间RoPE 旋转位置编码推导与图解知乎3. 显存优化与推理加速KV Cache 与 Attention 变体核心关注MHA (Multi-Head) - MQA (Multi-Query) - GQA (Grouped-Query)。理解 KV Cache 的显存占用计算公式2 × b × s × h × d 2 \times b \times s \times h \times d2×b×s×h×d。精读文献GQA: Training Generalized Multi-Query Attention Models from Checkpoints (2023)优质讲解大模型推理加速看懂 KV Cache 与 MQA/GQA知乎LLM 推理核心技术原理KV Cache 深入理解4. 激活函数与归一化的进化核心关注为什么用 SwiGLU 替代 ReLU (S w i s h ( x W ) ⊗ x V Swish(xW) \otimes xVSwish(xW)⊗xV)为什么用 RMSNorm 替代 LayerNorm去掉均值计算的数学考量。精读文献GLU Variants Improve Transformer (2020)优质讲解RMSNorm 与 LayerNorm 的对比及推导知乎大模型基础SwiGLU 激活函数详解阶段二通用大模型生态与架构演进 (General LLM Ecosystem) 焦点与目标深入四大主流模型Llama, Qwen, DeepSeek, GLM的底层差异。理解不同模型在架构、注意力机制优化、以及混合专家MoE技术上的不同数学选择。学习顺序与核心文献1. 架构标杆的演进轨迹Llama 体系 (仅查阅关键历史拐点)核心关注Llama 1 的开创性架构RoPE SwiGLU RMSNormLlama 2 的 GQA 引入Llama 3 的大规模数据配比与 Tiktoken 词表优化。精读文献LLaMA: Open and Efficient Foundation Language Models (Llama 1, 2023)The Llama 3 Herd of Models (Llama 3, 2024)优质讲解深入浅出 LLaMA 架构与论文精读知乎Llama 3 论文超硬核拆解它到底强在哪里知乎2. 阿里开源双壁Qwen 技术架构核心关注Qwen 的双词表设计多语言代码长文本 RoPE 外推机制YARN / Dynamic NTK-aware以及其 Dense 架构下的缩放定律Scaling Law。精读文献Qwen Technical Report (2023 最新版报告)优质讲解Qwen 架构与技术原理解析知乎专栏3. 极致性价比与创新DeepSeek (MoE 与 MLA)核心关注DeepSeekMoE 的架构原理共享专家 Shared Expert 细粒度路由Router 的 Load Balancing Loss 设计。DeepSeek-V2/V3 中的 MLA (Multi-head Latent Attention) 如何通过低秩投影Low-Rank Projection极大地压缩 KV Cache。精读文献DeepSeekMoE: Towards Ultimate Expert Specialization in MoE (2024)DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model (2024 - 关注 MLA 部分)优质讲解万字长文解析 DeepSeek MoE 与 Load Balancing (知乎)硬核推导DeepSeek-V2 MLA 到底是怎么压缩 KV Cache 的知乎4. 自回归与双向的折中GLM 架构 (ChatGLM/GLM-4)核心关注Autoregressive Blank Infilling 目标2D 位置编码机制。了解这种架构在长文本和特定任务上的理论优势。精读文献GLM-4 Technical Report (2024)阶段三对齐 (Alignment) 与推理强化 (Reasoning) 焦点与目标掌握模型如何从“续写机器”变成“听指令的助手”甚至“推理专家”。吃透 RLHF、DPO 的损失函数推导以及 DeepSeek-R1 带来的纯强化学习GRPO数学范式。学习顺序与核心文献1. 奖励模型与传统强化学习RLHF 体系核心关注Bradley-Terry 模型奖励函数的数学定义P ( y w y l ) σ ( r ( y w ) − r ( y l ) ) P(y_w y_l) \sigma(r(y_w) - r(y_l))P(ywyl)σ(r(yw)−r(yl))PPOProximal Policy Optimization的 Actor-Critic 架构与 KL 散度约束项。精读文献InstructGPT / Training language models to follow instructions with human feedback (2022)优质讲解强化学习 RLHFInstructGPT 论文硬核解析知乎ChatGPT 技术原理解析PPO 算法与 KL 惩罚项推导2. 损失函数的数学优雅DPO (Direct Preference Optimization)核心关注DPO 如何通过数学推导解方程将复杂的 PPO 目标直接转化为针对 LLM 的二分类交叉熵 Loss。掌握 DPO Loss 公式推导过程这是目前最常用的对齐方法。精读文献Direct Preference Optimization: Your Language Model is Secretly a Reward Model (2023)优质讲解DPO (Direct Preference Optimization) 数学推导与直觉解析知乎RLHF 终结者深入理解 DPO 损失函数科学空间3. System 2 思考与纯 RL 范式突破DeepSeek-R1 与 GRPO核心关注无需 SFT完全依靠规则驱动的强化学习。掌握 GRPO (Group Relative Policy Optimization) 的公式计算如何通过同一 Prompt 采样多个输出计算相对 Advantage (归一化)从而省去 Critic 模型的显存开销。精读文献DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (2025)优质讲解DeepSeek-R1 论文精读GRPO 算法核心公式推导知乎 (注需关注最新的 DeepSeek R1 算法解析文章)告别 Critic 模型GRPO (Group Relative Policy Optimization) 原理解读 (基于 DeepSeekMath)阶段四搜索广告核心漏斗与生成式大模型前沿焦点与目标深入理解搜索广告搜推广的漏斗体系召回-粗排-精排-机制。从传统的点击率预估CTR架构过渡到大模型时代 Generative Retrieval生成式召回的前沿数学范式。学习顺序与核心文献1. 经典广告系统的基石与漏斗核心关注双塔模型Dual-Tower中的内积计算与 ANN (近似最近邻) 的数学边界。特征交叉的演进DCN 的x l 1 x 0 x l T w l b l x l x_{l1} x_0 x_l^T w_l b_l x_lxl1x0xlTwlblxl。精读文献Deep Neural Networks for YouTube Recommendations (2016 双塔启发)Deep Cross Network for Ad Click Predictions (DCN, 2017)优质讲解YouTube DNN 经典论文与双塔模型原理解析知乎特征交叉系列DCN (Deep Cross Network) 原理推导2. 用户行为序列与注意力机制核心关注DIN 提出时的背景。Target Attention 如何通过目标广告 (Target Ad) 对用户的历史点击序列计算 Attention实现千人千面的表示表示精读文献Deep Interest Network for Click-Through Rate Prediction (DIN, 2018)优质讲解阿里妈妈 CTR 预估经典DIN 论文精读与 Attention 机制知乎3. 【前沿核心】大模型在召回层的革命Generative Retrieval核心关注彻底颠覆“双塔ANN”的检索范式。Item ID 如何被 Token化Semantic IDRQ-VAE 在其中的离散表征作用。自回归模型如何直接计算P ( I t e m ∣ U s e r , C o n t e x t ) P(Item | User, Context)P(Item∣User,Context)TIGER 与 GR4AD 的 LazyAR 机制推导。精读文献TIGER: Transformer Index for GEnerative Recommenders (2023, 奠基之作)Generative Retrieval for Ad Generation and Recommendation (GR4AD, 腾讯等 2024)优质讲解推荐系统新范式生成式召回 (Generative Retrieval) 原理剖析知乎深入浅出 RQ-VAE 与 Semantic ID 在生成式推荐中的应用4. LLM for CTR 预估精排/重排核心关注LLM 在精排中的局限性时延问题。大模型如何处理纯表格类特征Tabular Data。位置偏差Position Bias在 LLM Prompt 中的表现与消除。大模型到小模型Teacher - Student的 Knowledge Distillation知识蒸馏在工业界的应用数学考量。延伸查阅 (可选)搜索 “LLM for CTR prediction survey” 获取最新的综述了解工业界目前的通用架构模式。

开发者效率工具openclaw-coding-kit：本地化、模块化与自动化实践

1. 项目概述：一个为开发者量身定制的“瑞士军刀”最近在GitHub上看到一个挺有意思的项目，叫GalaxyXieyu/openclaw-coding-kit。光看名字，openclaw（开放之爪）和coding-kit（编码工具包）就透着一股…

2026/5/16 3:48:21 阅读更多

ARM CHI接口设计原理与多核系统优化实践

1. ARM CHI接口概述与设计背景在当今多核处理器架构中，缓存一致性协议的设计直接决定了系统性能的上限。作为ARMv8-A架构中的关键互连协议，CHI（Coherent Hub Interface）通过创新的分层设计和虚拟通道机制，有效解决了传…

2026/5/16 3:47:40 阅读更多

华硕游侠2-RX键盘多功能滚轮自定义M失效的解决方案

新买了一块游侠2 rx键盘，想着用自定义滚轮方便打开常用程序，但是发现在Armoury Crate中设置后不起作用，网上解决方案伤筋动骨，得不偿失，有一定风险。经测试，自定义滚轮能正常执行宏定义，只是对…

2026/5/16 3:47:20 阅读更多

101种美食-图像分类数据集

101种美食图像分类数据集数据集（文章最后关注公众号获取数据集）： 通过网盘分享的文件： 链接: https://pan.baidu.com/s/1MWasy2HPJSknwgA5IrrNSA?pwdzj6u 提取码: zj6u 数据集信息介绍 apple_pie（苹果派）…

2026/5/16 4:31:20 阅读更多

77种商品-图像分类数据集

77种商品图像分类数据集数据集（文章最后关注公众号获取数据集）：链接: https://pan.baidu.com/s/1Xcj5Z-RSUjGH47OIbH5wjQ?pwd=fq2p 提取码: fq2p 数据集信息介绍：以下是整理后的清晰呈现，按照商品名称首字母顺序进行排列：东方树叶红茶：文件夹中的图片数量为 150 …

2026/5/16 4:31:20 阅读更多

Linux内核构建自动化：jpoindexter/kern工具实战指南

1. 项目概述：一个被低估的Linux内核构建工具如果你和我一样，长期在嵌入式开发、内核模块调试或者需要频繁定制Linux内核的岗位上工作，那么你一定对内核的配置、编译、打包这一套繁琐的流程感到又爱又恨。爱的是，这是深入理解操作…

2026/5/16 4:31:20 阅读更多

leetcode279.完全平方数

给你一个整数 n ，返回和为 n 的完全平方数的最少数量。完全平方数是一个整数，其值等于另一个整数的平方；换句话说，其值等于一个整数自乘的积。例如，1、4、9 和 16 都是完全平方数，而 3 和 11 不是。示…

2026/5/16 4:30:19 阅读更多

Arm Iris Components调试与追踪接口技术解析

1. Arm Iris Components调试与追踪接口深度解析1.1 调试接口架构设计原理Arm Iris Components的调试架构采用分层设计理念，核心由三个关键部分组成：调试访问端口(DAP)：基于Arm CoreSight技术，提供对处理器内核的底层访问通道。在F…

2026/5/16 4:30:19 阅读更多

AI应用评估框架Tonic Validate：从原理到实战的完整指南

1. 项目概述：一个为AI应用量身定制的评估框架如果你正在开发或维护一个基于大语言模型的应用，无论是智能客服、内容生成工具，还是复杂的问答系统，那么你一定绕不开一个核心问题：如何科学、高效地评估它的表现&#xff…

2026/5/16 4:30:19 阅读更多

SD-PPP：在Photoshop中开启智能设计革命的终极AI插件

SD-PPP：在Photoshop中开启智能设计革命的终极AI插件【免费下载链接】sd-ppp A Photoshop AI plugin 项目地址: https://gitcode.com/gh_mirrors/sd/sd-ppp 你是否厌倦了在Photoshop和AI工具之间频繁切换，打断了创意的流畅性？SD-PPP正…

2026/5/16 0:00:07 阅读更多

NomNom存档编辑器：解放你的《无人深空》游戏体验终极指南

NomNom存档编辑器：解放你的《无人深空》游戏体验终极指南【免费下载链接】NomNom NomNom is the most complete savegame editor for NMS but also shows additional information around the data youre about to change. You can also easily look up each item i…

2026/5/16 0:00:27 阅读更多

5个专业策略：构建企业级本地漏洞情报分析平台

5个专业策略：构建企业级本地漏洞情报分析平台【免费下载链接】cve-search cve-search - a tool to perform local searches for known vulnerabilities 项目地址: https://gitcode.com/gh_mirrors/cv/cve-search 在当今复杂的网络安全环境中，快速…

2026/5/16 0:00:27 阅读更多

贾子理论与AI时代文明竞争：从暴力计算到本质贯通的范式重构

贾子理论与AI时代文明竞争：从暴力计算到本质贯通的范式重构摘要本文基于贾子理论的文明竞争视角，揭示中美AI战略差异的本质并非技术参数较量，而是“暴力计算”与“本质贯通”两种文明范式的根本对立。美国依赖算力堆叠与资本逻辑追求技术霸权…

2026/5/14 23:29:16 阅读更多

2026年AI大模型API中转平台排名揭晓，诗云API(ShiyunApi)脱颖而出成省心之选

在AI开发领域，如何接入模型厂商的官方API是一个绕不开的现实问题。对于海外开发者来说，注册、绑卡、调用，三步即可轻松搞定。然而，国内开发者却面临着跨境网络波动、外币支付门槛、发票合规需求以及多厂商Key碎片化管理等诸多“非…

2026/5/15 17:36:19 阅读更多

基于飞书与OpenAI构建企业级AI助手：架构、部署与深度优化指南

1. 项目概述：当飞书遇上AI，一个企业级智能助手的诞生最近在折腾一个挺有意思的项目，叫“ConnectAI-E/feishu-openai”。简单来说，它就是一个桥梁，把飞书这个强大的企业协作平台，和以ChatGPT为代表的OpenA…

2026/5/15 0:06:09 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/15 14:41:25 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/15 14:41:26 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/15 14:41:26 阅读更多

相关文章

开发者效率工具openclaw-coding-kit：本地化、模块化与自动化实践

ARM CHI接口设计原理与多核系统优化实践

华硕游侠2-RX键盘多功能滚轮自定义M失效的解决方案

101种美食-图像分类数据集

77种商品-图像分类数据集

Linux内核构建自动化：jpoindexter/kern工具实战指南

leetcode279.完全平方数

Arm Iris Components调试与追踪接口技术解析

AI应用评估框架Tonic Validate：从原理到实战的完整指南

SD-PPP：在Photoshop中开启智能设计革命的终极AI插件

NomNom存档编辑器：解放你的《无人深空》游戏体验终极指南

5个专业策略：构建企业级本地漏洞情报分析平台

贾子理论与AI时代文明竞争：从暴力计算到本质贯通的范式重构

2026年AI大模型API中转平台排名揭晓，诗云API(ShiyunApi)脱颖而出成省心之选

基于飞书与OpenAI构建企业级AI助手：架构、部署与深度优化指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥