Pytorch基础：张量相关的乘法(torch.mul、torch.mv、torch.matmul、torch.mm、torch.bmm、torch.dot、torch.tensordot、*、@)

发布时间：2026/5/22 18:18:42

相关阅读Pytorch基础https://blog.csdn.net/weixin_45791458/category_12457644.html?spm1001.2014.3001.5482Pytorch中含有很多种张量乘法本文旨在帮助理解它们的不同。下面将分小节进行详细阐述包括torch.mul、torch.matmul、torch.mm、torch.bmm、torch.dot、torch.tensordot、*、。torch.multorch.mul函数用于执行两个张量的逐元素乘法又称哈德玛积返回张量的元素是两个张量对应位置元素相乘如果两个张量的阶数维度数不一样或维度的大小不一样会首先进行广播(broadcast)再进行乘法运算。下面是一个简单的例子展示了使用torch.mul函数计算哈德玛积的过程。# 例1 import torch A torch.arange(12).reshape(3, 4) B torch.arange(12).reshape(3, 4) # 两个矩阵形状相同 print(A, A.shape) print(B, B.shape) print(torch.mul(A, B), torch.mul(A, B).shape) # 输出 tensor([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) torch.Size([3, 4]) tensor([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) torch.Size([3, 4]) tensor([[ 0, 1, 4, 9], [ 16, 25, 36, 49], [ 64, 81, 100, 121]]) torch.Size([3, 4])下面的例2展示了两个张量的阶数一样但维度的大小不一样会首先进行广播随后计算哈德玛积的过程。# 例2 import torch A torch.arange(3).reshape(3, 1) # 最后一维的大小为1需要广播 B torch.arange(12).reshape(3, 4) # 最后一维的大小为4 print(A, A.shape) print(B, B.shape) print(torch.mul(A, B), torch.mul(A, B).shape) # 输出 tensor([[0], [1], [2]]) torch.Size([3, 1]) tensor([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) torch.Size([3, 4]) tensor([[ 0, 0, 0, 0], [ 4, 5, 6, 7], [16, 18, 20, 22]]) torch.Size([3, 4])下面的例3展示了两个张量的阶数不一样也会首先进行广播随后计算哈德玛积。# 例3 import torch A torch.arange(4).reshape(4) # 最后一维的大小为4但是一阶张量需要广播 B torch.arange(12).reshape(3, 4) # 最后一维的大小为4 print(A, A.shape) print(B, B.shape) print(torch.mul(A, B), torch.mul(A, B).shape) # 输出 tensor([0, 1, 2, 3]) torch.Size([4]) tensor([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) torch.Size([3, 4]) tensor([[ 0, 1, 4, 9], [ 0, 5, 12, 21], [ 0, 9, 20, 33]]) torch.Size([3, 4])下面的例4展示了两个张量在计算哈德玛积前同时进行了阶数和维度两个方向的广播。# 例4 import torch A torch.tensor([2]) # 需要广播成与B张量形状相同 B torch.arange(12).reshape(3, 4) print(A, A.shape) print(B, B.shape) print(torch.mul(A, B), torch.mul(A, B).shape) # 输出 tensor([2]) torch.Size([1]) tensor([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) torch.Size([3, 4]) tensor([[ 0, 2, 4, 6], [ 8, 10, 12, 14], [16, 18, 20, 22]]) torch.Size([3, 4])torch.mvtorch.mv函数用于执行一个二阶张量矩阵和一阶张量向量的乘法这要求矩阵的最后一维的长度和向量的长度相等这个函数不支持广播。矩阵和向量的乘法会导致矩阵降维成向量下面是一个简单的例子。# 例5 import torch A torch.arange(8).reshape(2, 4) # 最后一维的大小为4 B torch.arange(4).reshape(4) # 倒数第二维的大小为4 print(A, A.shape) print(B, B.shape) print(torch.mv(A, B), torch.mv(A, B).shape) # 输出 tensor([[0, 1, 2, 3], [4, 5, 6, 7]]) torch.Size([2, 4]) tensor([0, 1, 2, 3]) torch.Size([4]) tensor([14, 38]) torch.Size([2]) #输出降维torch.matmultorch.matmul函数可以用于执行两个张量最后两维的矩阵乘注意它也可以进行张量与向量一阶张量的乘法与向量之间的点积这里我们不讨论具体见Pytorch文档这对两个张量最后两维的大小有一定要求即左张量最后一维的大小等于右张量倒数第二维的大小如果两个张量的阶数不一样或维度的大小不一样除最后两维外会首先进行广播再进行矩阵乘法运算。下面是一个简单的例子展示了使用torch.matmul函数计算两个张量最后两维的矩阵乘的过程。# 例6 import torch A torch.arange(8).reshape(2, 4) # 最后一维的大小为4 B torch.arange(12).reshape(4, 3) # 倒数第二维的大小为4 print(A, A.shape) print(B, B.shape) print(torch.matmul(A, B), torch.matmul(A, B).shape) # 输出 tensor([[0, 1, 2, 3], [4, 5, 6, 7]]) torch.Size([2, 4]) tensor([[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8], [ 9, 10, 11]]) torch.Size([4, 3]) tensor([[ 42, 48, 54], [114, 136, 158]]) torch.Size([2, 3])下面的例6展示了两个张量的阶数一样但维度的大小不一样会首先进行广播随后计算两个张量最后两维的矩阵乘。# 例7 import torch A torch.arange(12).reshape(1, 3, 4) # 第一维的大小为1需要广播 B torch.arange(24).reshape(2, 4, 3) # 第一维的大小为2 print(A, A.shape) print(B, B.shape) print(torch.matmul(A, B), torch.matmul(A, B).shape) # 输出 tensor([[[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]]) torch.Size([1, 3, 4]) tensor([[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8], [ 9, 10, 11]], [[12, 13, 14], [15, 16, 17], [18, 19, 20], [21, 22, 23]]]) torch.Size([2, 4, 3]) tensor([[[ 42, 48, 54], [114, 136, 158], [186, 224, 262]], [[114, 120, 126], [378, 400, 422], [642, 680, 718]]]) torch.Size([2, 3, 3])下面的例8展示了两个张量的阶数不一样也会首先进行广播随后计算两个张量最后两维的矩阵乘。# 例8 import torch A torch.arange(12).reshape(3, 4) # 二阶张量需要广播 B torch.arange(24).reshape(2, 4, 3) # 第一维的大小为2 print(A, A.shape) print(B, B.shape) print(torch.matmul(A, B), torch.matmul(A, B).shape) # 输出 tensor([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) torch.Size([3, 4]) tensor([[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8], [ 9, 10, 11]], [[12, 13, 14], [15, 16, 17], [18, 19, 20], [21, 22, 23]]]) torch.Size([2, 4, 3]) tensor([[[ 42, 48, 54], [114, 136, 158], [186, 224, 262]], [[114, 120, 126], [378, 400, 422], [642, 680, 718]]]) torch.Size([2, 3, 3])下面的例9展示了两个张量在计算矩阵乘之前同时进行了阶数和维度两个方向的广播。# 例9 import torch A torch.arange(12).reshape(1, 3, 4) # 需要广播成除后两维外与B张量形状相同 B torch.arange(48).reshape(2, 2, 4, 3) print(A, A.shape) print(B, B.shape) print(torch.matmul(A, B), torch.matmul(A, B).shape) # 输出 tensor([[[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]]) torch.Size([1, 3, 4]) tensor([[[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8], [ 9, 10, 11]], [[12, 13, 14], [15, 16, 17], [18, 19, 20], [21, 22, 23]]], [[[24, 25, 26], [27, 28, 29], [30, 31, 32], [33, 34, 35]], [[36, 37, 38], [39, 40, 41], [42, 43, 44], [45, 46, 47]]]]) torch.Size([2, 2, 4, 3]) tensor([[[[ 42, 48, 54], [ 114, 136, 158], [ 186, 224, 262]], [[ 114, 120, 126], [ 378, 400, 422], [ 642, 680, 718]]], [[[ 186, 192, 198], [ 642, 664, 686], [1098, 1136, 1174]], [[ 258, 264, 270], [ 906, 928, 950], [1554, 1592, 1630]]]]) torch.Size([2, 2, 3, 3])torch.mmtorch.mm函数也是用于执行矩阵乘的但是它只能对两个二阶张量即矩阵使用因此不支持广播。下面是一个简单的例子展示了使用torch.mm函数计算两个二阶张量的矩阵乘的过程。# 例10 import torch A torch.arange(8).reshape(2, 4) # 最后一维的大小为4 B torch.arange(12).reshape(4, 3) # 倒数第二维的大小为4 print(A, A.shape) print(B, B.shape) print(torch.mm(A, B), torch.mm(A, B).shape)torch.bmmtorch.bmm函数与torch.mm函数类似但它不仅可以对计算两个二阶张量的矩阵乘也可以对两个三阶张量使用其中第一维是batch被称为维度它同样也不支持广播因此如果是两个三阶张量要求第一维大小相同。下面是一个简单的例子展示了使用torch.bmm函数计算两个三阶张量的矩阵乘的过程。# 例11 import torch A torch.arange(24).reshape(2, 3, 4) # 第一维的大小为2 B torch.arange(24).reshape(2, 4, 3) # 第一维的大小为2 print(A, A.shape) print(B, B.shape) print(torch.bmm(A, B), torch.bmm(A, B).shape) 输出 tensor([[[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]], [[12, 13, 14, 15], [16, 17, 18, 19], [20, 21, 22, 23]]]) torch.Size([2, 3, 4]) tensor([[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8], [ 9, 10, 11]], [[12, 13, 14], [15, 16, 17], [18, 19, 20], [21, 22, 23]]]) torch.Size([2, 4, 3]) tensor([[[ 42, 48, 54], [ 114, 136, 158], [ 186, 224, 262]], [[ 906, 960, 1014], [1170, 1240, 1310], [1434, 1520, 1606]]]) torch.Size([2, 3, 3])torch.dottorch.dot函数用于计算两个向量一阶张量的点积根据点积的定义点积结果应该是一个标量在Pytorch中也是如此。下面是一个简单的例子展示了使用torch.dot函数计算两个向量的点积的过程结果的形状显示其为一个标量零阶张量。torch.dot函数不支持广播因此这两个向量包含的元素数量必须相同。# 例12 import torch A torch.arange(4).reshape(4) # 一阶张量 B torch.arange(4).reshape(4) # 一阶张量 print(A, A.shape) print(B, B.shape) print(torch.dot(A, B), torch.dot(A, B).shape) 输出 tensor([0, 1, 2, 3]) torch.Size([4]) tensor([0, 1, 2, 3]) torch.Size([4]) tensor(14) torch.Size([]) # 结果为标量torch.tensordottorch.tensordot函数用于计算两个张量的矩阵点积阶数必须大于一在这里矩阵的点积是由向量点积的定义延伸而来。下面是一个简单的例子展示了使用torch.tensordot函数计算两个张量的点积的过程。torch.tensordot函数支持广播可以进行阶数和维度两个方向的广播。# 例13 import torch A torch.arange(4).reshape(2, 2) # 二阶张量 B torch.arange(4).reshape(2, 2) # 二阶张量 print(A, A.shape) print(B, B.shape) print(torch.tensordot(A, B), torch.tensordot(A, B).shape) 输出 tensor([[0, 1], [2, 3]]) torch.Size([2, 2]) tensor([[0, 1], [2, 3]]) torch.Size([2, 2]) tensor(14) torch.Size([]) # 结果为标量 A torch.arange(4).reshape(2, 2) # 二阶张量 B torch.arange(2).reshape(1, 2) # 第一维的大小为1需要广播 print(A, A.shape) print(B, B.shape) print(torch.tensordot(A, B), torch.tensordot(A, B).shape) 输出 tensor([[0, 1], [2, 3]]) torch.Size([2, 2]) tensor([[0, 1]]) torch.Size([1, 2]) tensor(4) torch.Size([]) # 结果为标量 A torch.arange(8).reshape(2, 2, 2) # 三阶张量 B torch.arange(4).reshape(2, 2) # 二阶张量需要广播 print(A, A.shape) print(B, B.shape) print(torch.tensordot(A, B), torch.tensordot(A, B).shape) 输出 tensor([[[0, 1], [2, 3]], [[4, 5], [6, 7]]]) torch.Size([2, 2, 2]) tensor([[0, 1], [2, 3]]) torch.Size([2, 2]) tensor([14, 38]) torch.Size([2]) # 结果为一阶张量特别要注意最后一个例子即使张量的阶数大于二结果依旧是计算最后两维的张量点积分所以结果不是一个标量。*乘号直接使用乘号与使用torch.mul函数是类似的下面是一个简单的例子展示了直接使用乘号计算哈德玛积的过程它也拥有广播特性在此不重复演示。# 例14 import torch A torch.arange(12).reshape(3, 4) B torch.arange(12).reshape(3, 4) # 两个矩阵形状相同 print(A, A.shape) print(B, B.shape) print(A * B, (A * B).shape) # 输出 tensor([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) torch.Size([3, 4]) tensor([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) torch.Size([3, 4]) tensor([[ 0, 1, 4, 9], [ 16, 25, 36, 49], [ 64, 81, 100, 121]]) torch.Size([3, 4])是矩阵乘运算符与使用torch.matmul函数是类似的下面是一个简单的例子展示了直接使用计算矩阵乘的过程它也拥有广播特性在此不重复演示。# 例15 import torch A torch.arange(8).reshape(2, 4) # 最后一维的大小为4 B torch.arange(12).reshape(4, 3) # 倒数第二维的大小为4 print(A, A.shape) print(B, B.shape) print((A B), (A B).shape)

还在手动调参？Perplexity案例法检索自动化决策树上线：3周内将检索准确率从61%拉升至89.4%

更多请点击： https://intelliparadigm.com 第一章：Perplexity案例法检索的原理与演进脉络 Perplexity案例法检索并非传统关键词匹配驱动的搜索范式，而是一种以语言模型困惑度（Perplexity）为量化锚点、融合上下文感知与…

2026/5/22 18:18:42 阅读更多

【网络】TCP/IP协议深度解析：从连接建立到数据传输

【网络】TCP/IP协议深度解析：从连接建立到数据传输前言 TCP/IP协议栈是互联网的基础，几乎所有的网络应用都建立在TCP/IP之上。深入理解TCP/IP协议的工作原理，对于网络编程、网络故障排查、系统性能优化都是必不可少的知识。作为AI程序员&…

2026/5/22 18:18:21 阅读更多

Nodejs开发者三步搞定Taotoken接入并实现异步聊天对话功能

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度 Nodejs开发者三步搞定Taotoken接入并实现异步聊天对话功能对于Node.js开发者而言，将大模型能力集成到应用中的第一步&…

2026/5/22 18:18:01 阅读更多

深耕技术底座，自然形成正向飞轮：Java 生态 AI 平台

在企业AI智能化转型的热潮中，多数技术厂商都在追逐风口、布局市场、发力获客。而 JBoltAI 从创立之初就走了一条完全不同的路：我们是典型的研发驱动型团队，几乎没有销售拓客体系，从未主动对外开发客户。但一路走来，我们…

2026/5/22 22:36:16 阅读更多

工业AI落地核心逻辑：深耕业务、夯实底座，方得长远

在消费互联网时代，靠一个爆款功能就能快速圈用户、做规模、赢流量，但这套逻辑放在工业 AI 领域完全行不通。做工业 AI，从来不是追求短期热度和表面噱头，慢打磨、深扎根、筑牢底座，才是长久生存和持续落地的唯一路径&am…

2026/5/22 22:36:16 阅读更多

【Sora 2企业API商用落地白皮书】：已验证的8类行业适配模板（金融/医疗/制造/教育）+ SLA保障协议范本

更多请点击： https://intelliparadigm.com 第一章：Sora 2企业API商用落地全景概览 Sora 2企业API标志着生成式视频技术从实验室走向规模化生产环境的关键跃迁。其核心能力不再局限于单帧图像合成或短时序剪辑，而是支持长达两分钟、1080p分辨…

2026/5/22 22:35:56 阅读更多

提示词失效？运动逻辑崩塌？长视频生成失败全归因分析，深度解读Sora 2 v2.3.1时空建模底层约束

更多请点击： https://kaifayun.com 第一章：Sora 2长视频生成的核心挑战与认知重构传统视频生成模型在时序一致性、空间连贯性与语义可控性三个维度上面临根本性瓶颈。Sora 2并非简单延长生成时长，而是重新定义了“视频”作为时空联合表征的…

2026/5/22 22:35:56 阅读更多

轻量级糖尿病风险预测器：基于逻辑回归的临床可解释建模

1. 项目概述：这不是一个“玩具模型”，而是一次面向真实临床辅助场景的轻量级建模实践 “Build your own Diabetes predictor in 5 mins!”——这个标题里藏着三个极易被忽略但极其关键的信息点： “your own” 、 “Diabetes predictor” …

2026/5/22 22:35:56 阅读更多

AI工程师必备：可验证、可执行、可落地的AI资讯简报

1. 这是一份真正“能用”的AI资讯简报，不是信息噪音收集器 “ This AI newsletter is all you need #40 ”——看到这个标题，你大概率会下意识划走：又一个AI资讯邮件？每天几十封，点开三秒就关掉，标题党、…

2026/5/22 22:35:15 阅读更多

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

5月21日，华泰柏瑞中韩半导体ETF（513310.SH）延续强势表现，当日收盘价报5.625元，涨幅达4.52%，盘中交投异常活跃，换手率109.80%，量比为1.32，市场资金交易热情高涨。然而&…

2026/5/22 0:00:46 阅读更多

11. 架构：前端工程化与状态管理实战

写在前面：如果说后端 MVT 引擎是 GIS 系统的“心脏”，那么前端就是它的“大脑”和“面孔”。在现代 WebGIS 开发中，如何优雅地管理复杂的图层状态、如何处理海量瓦片的渲染逻辑，是决定项目成败的关键。今天，我们将深入 light-mvt-server 的前端核心，看看如何利用 Vite …

2026/5/22 0:01:27 阅读更多

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟【免费下载链接】taojinbi 淘宝淘金币自动执行脚本，包含蚂蚁森林收取能量，芭芭农场全任务，解放你的双手项目地址: https://gitcode.com/gh_mi…

2026/5/22 0:02:07 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/22 17:05:13 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/22 16:54:23 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/22 14:41:35 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/22 11:03:47 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/22 3:58:33 阅读更多

相关文章

还在手动调参？Perplexity案例法检索自动化决策树上线：3周内将检索准确率从61%拉升至89.4%

【网络】TCP/IP协议深度解析：从连接建立到数据传输

Nodejs开发者三步搞定Taotoken接入并实现异步聊天对话功能

深耕技术底座，自然形成正向飞轮：Java 生态 AI 平台

工业AI落地核心逻辑：深耕业务、夯实底座，方得长远

【Sora 2企业API商用落地白皮书】：已验证的8类行业适配模板（金融/医疗/制造/教育）+ SLA保障协议范本

提示词失效？运动逻辑崩塌？长视频生成失败全归因分析，深度解读Sora 2 v2.3.1时空建模底层约束

轻量级糖尿病风险预测器：基于逻辑回归的临床可解释建模

AI工程师必备：可验证、可执行、可落地的AI资讯简报

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

11. 架构：前端工程化与状态管理实战

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)