AIDD入门第五课：神经网络如何学习分子世界？

发布时间：2026/5/19 7:54:16

前几篇文章中我们已经讲过机器学习的基本概念、学习类型、模型训练术语以及模型评价指标。现在我们终于要进入一个更常被提起、也更容易被误解的领域神经网络。很多人第一次听到“神经网络”会自然联想到人脑、意识、思考甚至以为模型真的像人一样理解世界。但这是一种美丽而危险的误会。人工神经网络并不是人脑的复制品。它只是借用了“神经元”和“连接”的概念用大量数学函数和参数去拟合数据中的规律。它没有欲望没有痛苦也没有真正的理解。它只是根据输入经过一层又一层计算输出一个结果。在AIDD也就是人工智能辅助药物发现中神经网络已经广泛用于分子性质预测、蛋白质结构建模、分子生成、蛋白-配体相互作用预测、药物重定位、ADMET预测等任务。它像一台复杂的机器能在巨大的分子与生物数据中寻找线索。但要理解这台机器必须先弄懂下面10个基础术语人工神经元、神经网络、隐藏层、激活函数、反向传播、梯度下降、批大小、训练轮数、学习率、批归一化。一、人工神经元Artificial Neuron人工神经元是神经网络中最基本的计算单元。它可以理解为一个小型判断器接收多个输入对这些输入赋予不同权重加总之后再经过一个函数处理最后输出一个结果。生活中可以把人工神经元想象成一个老师给学生打分。比如老师评价一个学生是否适合参加数学竞赛会参考多个因素平时成绩、解题速度、逻辑能力、错题率、兴趣程度。每个因素的重要性不同所以老师会在心里给它们不同权重。最后综合判断适合或者不适合。人工神经元也是类似过程。它接收输入比如一个分子的多个特征分子量、氢键供体数量、疏水性、电荷分布等。然后模型给这些特征分配不同权重计算出一个综合值再输出预测结果。在AIDD中一个人工神经元可能参与判断某个分子是否有活性某个结构片段是否有利于结合某种化学特征是否增加毒性风险某个蛋白位点是否可能形成结合口袋。人工神经元并不神秘。它不是一个会思考的小脑袋而是一个加权计算器。只是当许多这样的计算器连接在一起时就能形成强大的模式识别能力。一个神经元很简单许多神经元连接起来就开始显得复杂。复杂不等于神秘只是我们尚未完全看清它的每一步。二、神经网络Neural Network神经网络是由大量人工神经元按照层次结构连接起来的模型。它通常包括输入层、隐藏层和输出层。生活中可以把神经网络想象成一个多级审核系统。比如一家药企要判断一个候选分子是否值得推进不会只让一个人看一眼就决定。可能先由计算模型初筛再由药物化学家评估结构合理性再由结构生物学团队判断结合模式再由ADMET团队评估成药性最后进入实验验证。每一层都对信息进行处理并把结果传给下一层。最终形成一个综合判断。神经网络也是这样。输入层接收数据隐藏层逐步提取复杂规律输出层给出预测结果。层数越多、结构越复杂模型理论上可以学习更复杂的关系。在AIDD中神经网络可以处理多种数据分子描述符分子指纹SMILES字符串分子图结构蛋白质序列蛋白质三维结构蛋白-配体相互作用特征多组学数据。例如图神经网络可以把分子看作由原子和化学键组成的图蛋白语言模型可以把蛋白质序列看作一种特殊语言生成模型可以学习化学结构的分布并生成新分子。神经网络的价值在于它能从复杂数据中学习非线性关系。它的风险也在于它有时能给出结果却不清楚地告诉我们为什么。神经网络不是神谕。它只是一个复杂函数。只是这个函数太大以至于人类常常把看不清的东西误认为聪明。三、隐藏层Hidden Layer隐藏层是神经网络中位于输入层和输出层之间的层。它之所以叫“隐藏”不是因为它不可见而是因为它不直接对应原始输入也不直接对应最终输出而是在中间进行信息加工。生活中可以把隐藏层想象成一个人的思考过程。当你看到一道题时输入是题目输出是答案。但中间发生了什么你可能先理解题意再提取条件再选择公式再计算再检查。这些中间步骤不一定直接写出来却决定了最终答案。隐藏层就像模型的中间思考过程。在AIDD中如果输入是一个分子结构输出是活性预测结果那么隐藏层可能逐步学习到不同层次的信息较浅层可能学习原子类型、化学键、局部官能团中间层可能学习片段组合、环系结构、极性分布更深层可能学习与活性、毒性、结合能力相关的复杂模式。当然这只是帮助理解的说法。隐藏层到底学到了什么通常需要通过可解释性方法进一步分析并不能直接凭想象断定。隐藏层越多模型表达能力越强但也越容易过拟合越难解释越需要足够数据支撑。一个模型有很多隐藏层不代表它更有智慧。有时它只是把错误藏得更深了。四、激活函数Activation Function激活函数的作用是给神经网络引入非线性能力。这句话看起来抽象可以换成生活中的说法激活函数让模型不只是“简单加权”而是能够表达更复杂的判断。生活中一个人的判断往往不是线性的。比如你判断一道菜好不好吃不是盐多一分就好吃一分糖多一分就好吃一分。盐太少没味道盐适中很好盐太多就难以下咽。很多事情不是简单相加而是存在阈值、转折和复杂关系。药物分子也是如此。一个官能团的加入可能提高活性但继续增加类似基团可能导致毒性升高、溶解度下降或构象不稳定。分子性质之间常常不是直线关系而是复杂的非线性关系。激活函数就是让神经网络能够学习这种复杂关系的关键。常见激活函数包括Sigmoid、Tanh、ReLU、Leaky ReLU、GELU在AIDD中如果没有激活函数神经网络即使堆很多层本质上仍然接近一个线性模型很难表达分子结构与生物活性之间复杂的非线性关系。激活函数像一道门。有些信号被放大有些信号被压制有些信号被截断。模型正是通过这些门学会了不再把世界看成一条直线。五、反向传播Backpropagation反向传播是训练神经网络的核心方法之一。它的作用是根据模型预测错误的程度把误差信息从输出层一层层传回前面的层从而计算每个参数应该如何调整。生活中可以想象一个学生做错了一道复杂题。老师不是只说“错了”而是要追问错在哪里是最后计算错了是公式选错了是题意理解错了还是最开始条件提取就错了错误从最终答案一路追溯到每个步骤学生才能知道该改哪里。反向传播也是类似逻辑。神经网络先根据输入给出预测结果然后损失函数计算预测结果与真实标签之间的差距。接着反向传播把这个误差信号从输出层往回传计算每一层、每一个参数对错误的贡献。在AIDD中比如模型预测某个分子的活性值与实验结果差距很大反向传播会帮助模型判断哪些参数需要调整使下一次预测更接近真实值。反向传播并不是模型在反思人生。它只是按照链式法则计算梯度。但正是这种机械而冷静的计算让神经网络能够从错误中不断调整。人类常说失败是成功之母。在神经网络里失败必须先被量化再被反向传播最后才可能成为进步。六、梯度下降Gradient Descent梯度下降是一种优化方法。它的目标是让模型沿着损失函数下降最快的方向逐步调整参数使错误越来越小。生活中可以把它想象成一个人在雾中下山。山代表损失函数山越高说明错误越大。你站在山坡上看不见整座山只能感知脚下哪个方向更陡、更低。于是你一步一步往下降期望最终走到谷底。这就是梯度下降的直觉。在神经网络训练中模型一开始参数通常是随机初始化的预测结果很差。通过计算梯度模型知道参数应该向哪个方向调整才能让损失下降。在AIDD中训练一个分子性质预测模型时梯度下降会不断更新网络参数使模型对分子活性、毒性或溶解度的预测更准确。不过梯度下降也有问题。走得太快可能越过谷底走得太慢可能耗费太久山路复杂可能困在局部低谷数据噪声太多方向可能摇摆不定。所以梯度下降需要与学习率、批大小、优化器等概念一起理解。梯度下降很像人的修正过程。知道自己错了还不够知道往哪里改也不够。关键还在于每次改多少以及能不能坚持改下去。七、批大小Batch Size批大小指的是模型每次更新参数时使用的训练样本数量。生活中可以想象老师批改作业。如果老师每看一个学生的作业就立刻调整教学方法这种反馈非常及时但可能受单个学生影响太大。一个学生不会不代表全班不会。如果老师等全班所有作业都看完再调整教学方法判断更稳定但速度较慢。如果老师每次看一小组学生的作业再调整教学方式就在效率和稳定性之间取得折中。这就是批大小的思想。在神经网络训练中如果批大小是32就表示模型每次用32个样本计算一次平均损失然后更新参数。在AIDD中如果我们训练一个分子活性预测模型批大小决定了模型每次看多少个分子后调整自己。批大小太小训练过程可能波动较大但有时有助于跳出局部最优批大小太大训练更稳定但可能需要更多显存也可能降低模型的泛化表现合适的批大小通常需要根据数据规模、模型结构、硬件条件和任务目标调整。批大小告诉我们学习既不能只凭一个例子也不能总等所有例子都看完。现实中的判断常常是在一小批经验中不断修正。八、训练轮数Epoch训练轮数指的是模型完整遍历训练集的次数。一个Epoch表示模型把整个训练集学习了一遍。生活中可以把它理解为学生复习教材的轮数。一本教材读一遍可能只知道大意读第二遍开始理解结构读第三遍发现重点读太多遍也可能只是机械重复甚至开始背页码而不是理解知识。模型训练也是如此。在AIDD中如果训练集包含一万个分子一个Epoch就表示模型把这一万个分子都学习了一遍。训练多个Epoch模型会反复接触数据不断调整参数。训练轮数太少模型可能欠拟合还没有学会基本规律训练轮数太多模型可能过拟合把训练集中的噪声和偶然性也记住了。因此训练轮数通常需要结合验证集表现来决定。常见方法是早停也就是当验证集性能不再提升时停止训练。模型不是训练越久越好。人也一样。学习可以带来理解重复也可能制造麻木。九、学习率Learning Rate学习率决定了模型每次更新参数时迈多大的步子。它是神经网络训练中非常重要的超参数。生活中可以想象一个人在山坡上寻找最低点。学习率太大就像一步跨得太远可能直接越过谷底甚至越走越乱学习率太小就像每一步都很谨慎虽然安全但可能走得极慢迟迟到不了较好的位置。在模型训练中学习率控制参数更新幅度。在AIDD中训练一个神经网络预测分子性质时如果学习率太大模型损失可能剧烈波动甚至无法收敛如果学习率太小训练可能非常缓慢也可能停在不理想的位置。学习率常常决定训练是否稳定。很多时候模型效果不好并不是模型结构不行而是学习率没有设置合适。常见策略包括固定学习率学习率衰减预热学习率余弦退火自适应优化器中的动态调整。学习率像人的改变幅度。改得太猛容易摔倒改得太慢又像从未真正改变。十、批归一化Batch Normalization批归一化是一种用于稳定和加速神经网络训练的方法。它通常会对一个批次中的中间层输出进行标准化处理使数据分布更加稳定再通过可学习参数进行缩放和平移。这句话较技术化可以用生活例子理解。假设一个老师要比较不同班级学生的考试成绩。但每个班的试卷难度不同有的满分100分有的满分150分有的平均分特别高有的平均分特别低。直接比较原始分数并不公平。老师需要先把分数标准化比如转换成相对于班级平均水平的位置再进行后续判断。批归一化也有类似作用。在神经网络训练中每一层的输入分布会随着前面层参数变化而不断变化。这会让后面的层学习起来不稳定。批归一化通过对每个批次的数据进行归一化使中间信号分布更稳定从而帮助模型训练更顺利。在AIDD中如果我们训练较深的神经网络例如用于分子性质预测、蛋白质序列建模或多组学数据分析批归一化可能帮助模型更快收敛提高训练稳定性。但批归一化也不是万能药。它对批大小比较敏感训练阶段和预测阶段的处理方式也不同。对于某些任务和模型结构Layer Normalization等方法可能更合适。批归一化的意义在于让每一层不要总面对变化过于剧烈的输入。就像人学习时如果每天的规则都变聪明也会被混乱消耗。把这10个术语串起来神经网络是如何训练的现在我们把这些概念放在一个完整的AIDD任务中。假设我们要训练一个神经网络用来预测某个分子是否能够抑制疾病相关靶点。首先我们把分子转换成模型能理解的输入比如分子描述符、分子指纹、SMILES序列或分子图。这些输入进入神经网络。网络中的人工神经元会对输入进行加权计算。多个神经元连接成不同层构成完整的神经网络。输入层接收原始信息隐藏层逐步提取复杂特征激活函数引入非线性使模型能够学习分子结构与生物活性之间的复杂关系。模型输出预测结果后损失函数计算预测结果与真实标签之间的差距。反向传播把误差信号一层层传回去计算每个参数应该如何调整。梯度下降则根据这些梯度更新参数使损失逐渐降低。训练时模型不会每次都看完整个数据集而是按照批大小分批学习。每完整看完一次训练集就完成一个训练轮数也就是一个Epoch。在这个过程中学习率控制每次参数更新的步子大小。批归一化则帮助中间层保持较稳定的数据分布使训练过程更顺畅。最终如果模型训练得当它就可能学会从分子结构中预测活性、毒性、溶解度、结合能力等性质。但仍要记住模型学到的是数据中的规律不一定是自然本身的真理。它可能学会了真正的结构-活性关系也可能学会了数据偏差、实验噪声和人类无意留下的痕迹。

Claude Code 模型切换脚本 switch.sh 编写

背景 Claude code 使用不同模型，需要切换，之前手动切换重命名 setting.json 和环境变量修改，想着切换麻烦，编写个脚本吧，用 claude code 编写。基本流程是： 将 settings-model.json 复制为 settings-json。…

2026/5/19 7:53:14 阅读更多

如何轻松解包星露谷物语XNB文件：XNBCLI完整使用指南

如何轻松解包星露谷物语XNB文件：XNBCLI完整使用指南【免费下载链接】xnbcli A CLI tool for XNB packing/unpacking purpose built for Stardew Valley. 项目地址: https://gitcode.com/gh_mirrors/xn/xnbcli 想要深度定制星露谷物语的游戏体验吗&#xff1…

2026/5/19 7:53:14 阅读更多

大模型应用开发：小白也能入门！收藏这份超全学习指南，掌握未来AI技能

本文探讨了大模型应用开发、AI应用开发及Agent开发之间的界限，指出随着行业发展，这些岗位的界限逐渐模糊，未来可能统一为AI应用工程师。文章强调，现阶段Agent工程化通常由开发和算法合作实现，分别负责算法优化与开发落…

2026/5/19 7:52:13 阅读更多

深入解析ACP Bridge：构建高效微服务通信与数据同步的协议转换桥梁

1. 项目概述与核心价值最近在折腾一个跨平台数据同步的项目，遇到了一个挺有意思的组件——allvegetable/acp-bridge。乍一看这个名字，可能会有点摸不着头脑，acp是什么？bridge又在这里扮演什么角色？实际上，这…

2026/5/19 8:53:21 阅读更多

LKY Office Tools：一键自动化部署Office的终极解决方案

LKY Office Tools：一键自动化部署Office的终极解决方案【免费下载链接】LKY_OfficeTools 一键自动化下载、安装、激活 Office 的利器。项目地址: https://gitcode.com/GitHub_Trending/lk/LKY_OfficeTools LKY Office Tools 是一款专为Windows用户设计的开…

2026/5/19 8:52:20 阅读更多

clawzero：自动化部署云原生安全靶场，实战演练容器逃逸与K8s权限滥用

1. 项目概述与核心价值最近在安全研究圈子里，一个名为clawzero的项目开始被频繁提及。它不是一个独立的工具，而是一个由mvar-security组织维护的、用于自动化部署和管理一个名为Claw的云原生安全靶场环境的项目。简单来说，clawzero是你的“一…

2026/5/19 8:52:20 阅读更多

终极指南：SMUDebugTool让Ryzen性能调试变得简单快速

终极指南：SMUDebugTool让Ryzen性能调试变得简单快速【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitc…

2026/5/19 8:51:40 阅读更多

基于Unsloth与LoRA的高效大语言模型微调工程化实践指南

1. 项目概述：一个为Unsloth优化的AI开发伴侣如果你最近在折腾大语言模型（LLM）的微调，尤其是想在自己的消费级显卡上跑起来，那你大概率听说过或者正在用Unsloth。这个开源库通过一系列巧妙的优化（比如融合…

2026/5/19 8:51:19 阅读更多

5种高效方案：开源工具全平台IDE试用期管理终极指南

5种高效方案：开源工具全平台IDE试用期管理终极指南【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter 在软件开发领域，JetBrains系列IDE凭借其强大的功能和卓越的开发体验，已成为众…

2026/5/19 8:50:18 阅读更多

5分钟快速上手：biliTickerBuy开源工具助你轻松抢购B站会员购热门票务

5分钟快速上手：biliTickerBuy开源工具助你轻松抢购B站会员购热门票务【免费下载链接】biliTickerBuy b站会员购购票辅助工具项目地址: https://gitcode.com/GitHub_Trending/bi/biliTickerBuy biliTickerBuy是一款专为B站会员购平台设计的开源辅助工具&…

2026/5/19 0:00:10 阅读更多

一口气讲清楚 Monorepo、Turborepo、pnpm、Changesets 到底是什么？

你肯定遇到过这种情况：项目里同时有前端、后端、公共组件，放在一个仓库嫌乱，拆成多个仓库又改一个公共函数要在五个项目里各改一遍。于是出现了 Monorepo、Turborepo、pnpm、Changesets 这四个词。它们不是互相替代，而是分别解决工…

2026/5/19 0:00:31 阅读更多

从ok-skills项目解析技能树：设计理念、技术实现与工程实践

1. 项目概述与核心价值最近在GitHub上看到一个挺有意思的项目，叫“ok-skills”。光看这个名字，可能有点摸不着头脑，但点进去一看，发现这是一个关于“技能树”或“知识图谱”的开源项目。简单来说，它试图用一种结构化的…

2026/5/19 0:01:12 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/19 4:14:12 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/19 6:17:20 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/19 0:56:48 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/19 0:13:34 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/19 0:00:02 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/18 19:34:27 阅读更多

相关文章