1、基本概念与核心名词人工智能Artificial IntelligenceAI是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的交叉科学。其核心目标是让机器能够执行通常需要人类智能才能完成的任务如感知听、看、读、推理、学习、决策与创造。AI领域内部形成了层层递进的技术体系理解各概念之间的包含关系是入门的第一步核心名词速览名词英文本质定义机器学习Machine Learning计算机通过数据自动总结规律无需人工编写每条规则深度学习Deep Learning使用多层深层神经网络进行学习的机器学习方法神经网络Neural Network模仿人脑神经元连接结构的数学计算模型模型Model训练完成后用于推理的参数集合是学到的知识的数学表示训练Training用大量数据反复调整模型参数使其输出趋向正确答案的过程推理Inference用已训练好的模型处理新输入、给出输出的过程即用模型参数/权重Parameters/Weights模型内部通过训练调整的数值其数量级决定模型大小如7B70亿参数大语言模型LLM基于Transformer架构、用海量文本数据训练的超大规模语言模型AIGCAI Generated Content由AI生成的内容包括文字、图像、音频、视频等传统机器学习与深度学习的本质区别传统机器学习如支持向量机SVM、随机森林、逻辑回归、K近邻的工作流程是人类先设计特征Feature Engineering再由模型学习这些特征与标签之间的映射关系。它像背公式解题——人类负责总结规律机器套用规律。深度学习如CNN、Transformer、ResNet则通过多层神经网络自动从原始数据中提取从低层到高层的特征无需人工设计特征。它像通过大量刷题悟出解题规律——机器直接面对原始数据自己归纳多层次的抽象规律。2、人工智能的发展历程与时代背景三大驱动力当代AI浪潮的崛起由三要素共同支撑——算法Transformer等突破性架构、算力GPU/TPU大规模并行计算能力的跃升、数据互联网积累的海量文本、图像、视频。三者相辅相成缺乏任何一个都无法支撑现今的大模型能力。3、AI技术的硬件基础算力设备与硬件环境CPU与GPU串行计算 vs 并行计算CPUCentral Processing Unit中央处理单元是计算机的通用处理器设计目标是以最快的单核速度处理复杂的逻辑指令序列。其特点是核心数少通常几十个、主频高3~5 GHz、擅长有大量条件跳转和分支逻辑的串行计算任务。GPUGraphics Processing Unit图形处理单元最初为图形渲染设计拥有成千上万个相对简单的计算核心擅长同时执行大量同类型的简单运算——即大规模并行计算。为什么AI训练必须依赖GPU深度学习的数学本质是海量矩阵乘法Matrix Multiplication。一个包含700亿参数的大语言模型在一次前向传播中需要完成数以亿计的乘加运算。关键在于这些运算在结构上高度均一每次都是把某一组数字乘以另一组数字再全部加起来不存在复杂的逻辑判断或条件跳转。GPU 的人海战术架构与这类任务完美匹配10000个核心同时各自完成一次乘法效率远超4个核心依次串行完成10000次乘法。这正是为什么一台配备8张H800的训练服务器能将原本需要数十年的训练任务压缩到数周。常见误区澄清❌ GPU只能处理图像CPU才能处理文字 —错误。文本在计算机内同样是矩阵词向量GPU同样高效处理。GPU名中含Graphics仅是历史起源现代GPU已是通用并行计算设备。❌ CPU主频4GHz比GPU的1.7GHz快所以AI训练用CPU更好 —错误。主频衡量的是单核速度而AI训练的瓶颈是并发算力总量不是单核速度。❌ 服务器CPU连续高负载运行会烧毁 —错误。服务器级CPU的设计标准即为7×24小时高负载运行耐久性不是瓶颈。其他重要算力设备设备全称特点TPUTensor Processing Unit谷歌专为深度学习定制的芯片矩阵运算效率极高NPUNeural Processing Unit手机/嵌入式端AI芯片如华为麒麟、苹果A系列中的神经引擎FPGAField Programmable Gate Array可编程逻辑阵列可为特定AI推理任务定制硬件电路4、人工智能的能力边界弱人工智能Narrow AI指在特定领域或任务上能力突出甚至超越人类但无法将能力迁移到其他领域的AI系统。当前所有商业化AIChatGPT、AlphaGo、自动驾驶系统、AI绘画工具等均属于弱AI。通用人工智能Artificial General IntelligenceAGI指具备与人类相当的通用认知能力、能够自主跨领域学习和推理的AI。AGI目前仍是理论目标尚未实现。当前大模型的能力边界认知重要大模型的优势大模型的局限常见幻觉来源自然语言理解、生成与翻译知识截止日期之后的实时信息代码编写与调试精确数值计算大数据集统计需借助代码解释器逻辑推理与任务规划持续记忆每次对话上下文相对独立知识综合与创意生成物理世界感知与真实行动多模态理解图/文/音/视频对罕见、专业或最新事件的准确描述5、各行业学习AI的必要性AI对各行业的渗透已从可选工具升级为核心竞争力组成部分可从三个层次理解其影响效率层AI使重复性工作文案撰写、数据处理、代码生成效率提升从事相关工作的人若不掌握AI工具将面临竞争力下滑创新层AI突破人类能力上限实现原本不可能的任务如AlphaFold预测蛋白质折叠、药物分子生成战略层AI正在重塑行业规则先行者构建起数据、模型与工作流壁垒——不懂AI的从业者将越来越难以参与到规则制定中
人工智能的定义与基础(理论篇)
发布时间:2026/6/7 22:15:43
1、基本概念与核心名词人工智能Artificial IntelligenceAI是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的交叉科学。其核心目标是让机器能够执行通常需要人类智能才能完成的任务如感知听、看、读、推理、学习、决策与创造。AI领域内部形成了层层递进的技术体系理解各概念之间的包含关系是入门的第一步核心名词速览名词英文本质定义机器学习Machine Learning计算机通过数据自动总结规律无需人工编写每条规则深度学习Deep Learning使用多层深层神经网络进行学习的机器学习方法神经网络Neural Network模仿人脑神经元连接结构的数学计算模型模型Model训练完成后用于推理的参数集合是学到的知识的数学表示训练Training用大量数据反复调整模型参数使其输出趋向正确答案的过程推理Inference用已训练好的模型处理新输入、给出输出的过程即用模型参数/权重Parameters/Weights模型内部通过训练调整的数值其数量级决定模型大小如7B70亿参数大语言模型LLM基于Transformer架构、用海量文本数据训练的超大规模语言模型AIGCAI Generated Content由AI生成的内容包括文字、图像、音频、视频等传统机器学习与深度学习的本质区别传统机器学习如支持向量机SVM、随机森林、逻辑回归、K近邻的工作流程是人类先设计特征Feature Engineering再由模型学习这些特征与标签之间的映射关系。它像背公式解题——人类负责总结规律机器套用规律。深度学习如CNN、Transformer、ResNet则通过多层神经网络自动从原始数据中提取从低层到高层的特征无需人工设计特征。它像通过大量刷题悟出解题规律——机器直接面对原始数据自己归纳多层次的抽象规律。2、人工智能的发展历程与时代背景三大驱动力当代AI浪潮的崛起由三要素共同支撑——算法Transformer等突破性架构、算力GPU/TPU大规模并行计算能力的跃升、数据互联网积累的海量文本、图像、视频。三者相辅相成缺乏任何一个都无法支撑现今的大模型能力。3、AI技术的硬件基础算力设备与硬件环境CPU与GPU串行计算 vs 并行计算CPUCentral Processing Unit中央处理单元是计算机的通用处理器设计目标是以最快的单核速度处理复杂的逻辑指令序列。其特点是核心数少通常几十个、主频高3~5 GHz、擅长有大量条件跳转和分支逻辑的串行计算任务。GPUGraphics Processing Unit图形处理单元最初为图形渲染设计拥有成千上万个相对简单的计算核心擅长同时执行大量同类型的简单运算——即大规模并行计算。为什么AI训练必须依赖GPU深度学习的数学本质是海量矩阵乘法Matrix Multiplication。一个包含700亿参数的大语言模型在一次前向传播中需要完成数以亿计的乘加运算。关键在于这些运算在结构上高度均一每次都是把某一组数字乘以另一组数字再全部加起来不存在复杂的逻辑判断或条件跳转。GPU 的人海战术架构与这类任务完美匹配10000个核心同时各自完成一次乘法效率远超4个核心依次串行完成10000次乘法。这正是为什么一台配备8张H800的训练服务器能将原本需要数十年的训练任务压缩到数周。常见误区澄清❌ GPU只能处理图像CPU才能处理文字 —错误。文本在计算机内同样是矩阵词向量GPU同样高效处理。GPU名中含Graphics仅是历史起源现代GPU已是通用并行计算设备。❌ CPU主频4GHz比GPU的1.7GHz快所以AI训练用CPU更好 —错误。主频衡量的是单核速度而AI训练的瓶颈是并发算力总量不是单核速度。❌ 服务器CPU连续高负载运行会烧毁 —错误。服务器级CPU的设计标准即为7×24小时高负载运行耐久性不是瓶颈。其他重要算力设备设备全称特点TPUTensor Processing Unit谷歌专为深度学习定制的芯片矩阵运算效率极高NPUNeural Processing Unit手机/嵌入式端AI芯片如华为麒麟、苹果A系列中的神经引擎FPGAField Programmable Gate Array可编程逻辑阵列可为特定AI推理任务定制硬件电路4、人工智能的能力边界弱人工智能Narrow AI指在特定领域或任务上能力突出甚至超越人类但无法将能力迁移到其他领域的AI系统。当前所有商业化AIChatGPT、AlphaGo、自动驾驶系统、AI绘画工具等均属于弱AI。通用人工智能Artificial General IntelligenceAGI指具备与人类相当的通用认知能力、能够自主跨领域学习和推理的AI。AGI目前仍是理论目标尚未实现。当前大模型的能力边界认知重要大模型的优势大模型的局限常见幻觉来源自然语言理解、生成与翻译知识截止日期之后的实时信息代码编写与调试精确数值计算大数据集统计需借助代码解释器逻辑推理与任务规划持续记忆每次对话上下文相对独立知识综合与创意生成物理世界感知与真实行动多模态理解图/文/音/视频对罕见、专业或最新事件的准确描述5、各行业学习AI的必要性AI对各行业的渗透已从可选工具升级为核心竞争力组成部分可从三个层次理解其影响效率层AI使重复性工作文案撰写、数据处理、代码生成效率提升从事相关工作的人若不掌握AI工具将面临竞争力下滑创新层AI突破人类能力上限实现原本不可能的任务如AlphaFold预测蛋白质折叠、药物分子生成战略层AI正在重塑行业规则先行者构建起数据、模型与工作流壁垒——不懂AI的从业者将越来越难以参与到规则制定中