[ 对比学习篇 ] 经典网络模型 —— Contrastive Learning

发布时间：2026/6/16 14:32:10

AuthorHorizon John✨编程技巧篇各种操作小结神经网络篇经典网络模型算法篇再忙也别忘了 LeetCode[ 对比学习篇 ] 经典网络模型 —— Contrastive Learning 01. InstDisc 结构框图详解效果 02. InvaSpread 结构框图详解效果 03. CPC 结构框图详解效果 04. CMC 结构框图详解 05. MoCov1 结构框图详解效果 06. SimCLRv1 结构框图详解效果 07. Mocov2 结构框图详解效果 08. SimCLRv2 结构框图详解效果 09. SWaV 结构框图详解效果 10. BYOL 结构框图详解效果 11. SimSiam 结构框图详解效果 12. Mocov3 结构框图详解效果 13. DINO 结构框图详解效果 14. CLIP 结构框图详解效果 01. InstDisc Paper: Unsupervised Feature Learning via Non-Parametric Instance Discrimination[CVPR 2018]️ GitHub: lemniscate.pytorch 结构框图Figure 1. The pipeline 详解每个图片看成一个类别利用memory bank来存储图像经神经网络编码后的特征128维正样本该图像本身经过数据增强后的图像负样本数据集中其他的图像从 memory bank 中随机抽取4096个样本超参数设定temperatureτ 0.07NCE with m 4, 096 to balance performance and computing costtrained for 200 epochs using SGD with momentumbatch size 256learning rate is initialized to 0.03, scaled down with coefficient 0.1 every 40 epochs after the first 120 epochs 效果 02. InvaSpread Paper: Unsupervised Embedding Learning via Invariant and Spreading Instance Feature[CVPR 2019]️ GitHub: Unsupervised_Embedding_Learning 结构框图Figure 1. The framework 详解没有使用额外的数据结构去存储大量的样本信息正负样本都来自于同一个minibatch使用同一个编码器进行端到端的学习正样本该图像本身经过数据增强后的图像2负样本其他图像经过数据增强后的图像(batch size-1) × 2未能取得很好结果原因batch size 太小导致负样本数量较小效果 03. CPC Paper: Representation Learning with Contrastive Predictive Coding[None 2018]️ GitHub: None 结构框图Figure 1. Model overview 详解可以应用于音频、图片、强化学习将输入当成序列利用前面的输入通过 RNN 或 LSTM 等网络输出来进行预测正样本预测结果负样本随机样本通过 genc得到的结果效果 04. CMC Paper: Contrastive Multiview Coding[ECCV 2020]️ GitHub: CMC 结构框图Figure 1. Model overview 详解增大不同视角之间的互信息视觉、听觉、触觉数据集NYU RGBD包含原始图像、深度信息、SwAV ace normal、分割图像正样本同一图像的不同视角负样本其他图像缺点不同视角下使用的编码器不一样计算成本过高作者后来又提出了不同网络得到的特征也应该尽可能相似利用蒸馏网络teacher net student net 05. MoCov1 Paper: Momentum Contrast for Unsupervised Visual Representation Learning[CVPR 2020]️ GitHub: moco 结构框图Figure 1. Model overviewFigure 2. Conceptual comparison of three contrastive loss mechanisms 详解InstDisc 的改进提出了队列queue来解决 memory bank 中的大字典的问题提出了动量编码器来解决字典中特征不一致的问题利用动态字典对队列中的特征进行存储每一次更新得到的 k 都会取代最开始的 k 值动量编码器yt m·yt-1 (1-m)·xt使输出不完全依赖于当前的输入还会收到上一个输出的影响0 ≤ m ≤ 1 实现缓慢的更新每一次新的到的 k 值使字典中的特征尽可能的保持一致正负样本都位于队列当中确保正负样本都是由同一个编码器提取得到的效果 06. SimCLRv1 Paper: A Simple Framework for Contrastive Learning of Visual Representations[ICML 2020]️ GitHub: simclr 结构框图Figure 1. The framework 详解增大数据增强的数量编码后的特征再经过一个g(·) 函数MLP层再求 loss 值实现更好的训练特征编码器设置了更大的 batchsize训练时间更久效果数据增强策略及效果 07. Mocov2 Paper: Improved Baselines with Momentum Contrastive Learning[None 2020]️ GitHub: None 结构框图Figure 1. A batching perspective of two optimization mechanisms for contrastive learning 详解借鉴 SimCLRv1 的策略添加了MLP层使用了数据增强训练时使用 cos learning rate schedule训练更多epochs 效果 08. SimCLRv2 Paper: Big Self-Supervised Models are Strong Semi-Supervised Learners[NeurIPS 2020]️ GitHub: simclr 结构框图Figure 1. The framework 详解使用更大的骨干网络模型增加 MLP层实验测试两层最佳使用动量编码器参考 MoCo 效果 09. SWaV Paper: Unsupervised Learning of Visual Features by Contrasting Cluster Assignments[NeurIPS 2020]️ GitHub: swav 结构框图Figure 1. Model overview 详解生成多个视角利用一个视角得到的特征去预测另一个视角的特征与聚类工作相结合利用聚类中心3000个进行预测cz1预测 Q2 cz2预测 Q1c 为聚类中心z1和 z2为提取的特征编码采用聚类中心可以降低采样的负样本数量从而减少计算成本解决正样本也纳入到负样本中导致的样本不均衡的问题提出Muti-crop的数据增强策略多尺度的剪裁原始图像作为数据增强效果 10. BYOL Paper: Bootstrap Your Own Latent A New Approach to Self-Supervised Learning[NeurIPS 2020] Blog: Understanding Self-Supervised and Contrastive Learning with “Bootstrap Your Own Latent” (BYOL)️ GitHub: byol 结构框图Figure 1. BYOL’s architecture 详解fθ和 fξ的网络结构一样模型参数更新不同fξ采用动量编码器更新gθ和 gξ是类似 SimCLR 的MLP层与 fθ和 fξ的更新策略一样在模型最后输出部分 zθ再经过一个 MLP层得到 qθ(zθ)利用 qθ(zθ) 预测 z’ξ计算 loss 模型测试阶段使用 yθ作为输出效果 11. SimSiam Paper: Exploring Simple Siamese Representation Learning[CVPR 2021]️ GitHub: simsiam 结构框图Figure 1. SimSiam architectureFigure 2. Comparison on Siamese architectures 详解较 BYOL 没有使用动量编码器进行参数更新总结性工作效果Comparisons on ImageNet linear classificationTransfer Learning 12. Mocov3 Paper: An Empirical Study of Training Self-Supervised Vision Transformers[ICCV 2021, Oral]️ GitHub: moco-v3 结构框图Figure 1. Algorithm 详解结合 MoCov2 和 SimSiam 骨干网络替换成了 ViT 效果 13. DINO Paper: Emerging Properties in Self-Supervised Vision Transformers[ICCV 2021]️ GitHub: dino 结构框图Figure 1. Model overviewFigure 1. Algorithm 详解融合 ViT 模型使用 student gθs得到的结果 P1去预测 teacher gθt得到的结果 P2 效果Self-attention from a Vision Transformer with 8 × 8 patches trained with no supervision参考对比学习论文综述【论文精读】 14. CLIP Paper: Learning Transferable Visual Models From Natural Language Supervision[None 2021]️ GitHub: CLIP 结构框图Figure 1. Summary of the approachNumpy-like pseudocode 详解模型训练采用了一个非常大的数据集400 million 图片文字对imagetextCLIP 预训练模型可以在不需要任何数据集训练的情况下和一个有监督学习的模型达成平手甚至还会更高ImageNetResNet正样本对角线元素IiTi(1 ≤ i ≤ N);负样本除对角线元素外的其他元素效果CLIP is much more efficient at zero-shot transfer than our image caption baselineLinear probe performance of CLIP models in comparison with state-of-the-art computer vision models

CMS选型指南：6款产品科学筛选方法典型误区规避

在多款 CMS 系统中挑选适配自身业务的产品，是建站与内容运营的关键环节。本文结合标准化筛选流程、实测方法，教大家从 6 款候选 CMS 里选出最优方案，同时梳理行业高频误区，帮大家少走弯路。一、先梳理刚性需求，满足不了…

2026/6/16 14:31:50 阅读更多

110kV输电线路设计实战指南：从路径选择到杆塔基础全解析

1. 项目概述：从零开始理解110kV输电线路设计干了十几年电力工程，从10kV配网干到500kV超高压，回头看看，110kV这个电压等级的设计，可以说是电力系统里承上启下的“中坚力量”。它不像10kV那样深入城市毛细血管&#xff0…

2026/6/16 14:31:09 阅读更多

掌握数字内容自主权：m4s-converter实现B站缓存视频永久保存的技术实践

掌握数字内容自主权：m4s-converter实现B站缓存视频永久保存的技术实践【免费下载链接】m4s-converter 一个跨平台小工具，将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 在数字内容快速…

2026/6/16 14:31:09 阅读更多

PostgreSQL高可用管理平台哪个好？为什么越来越多企业开始关注CLup？

最近在规划公司的 PostgreSQL 高可用架构时，我向多个AI工具提出了一个问题： PostgreSQL高可用管理平台哪个好？ 让我意外的是，除了常见的 Patroni、repmgr、Pgpool-II 之外，AI开始频繁提到一个名字： CLup。…

2026/6/16 15:52:31 阅读更多

【首发】Claude Code v2.1.178 发布：解锁细粒度参数级防火墙，支持多级目录 Skill 覆盖，彻底根治 VS Code 输入法卡死！

Anthropic 在 2026 年 6 月 15 日正式推送了 Claude Code 的 v2.1.178 版本。如果说上个版本是通过强控默认模型锁死了合规的边界，那么 v2.1.178 则是直接将安全审计推进到了“参数级（Parameter-level）细粒度防火墙”的全新高度。此外&#x…

2026/6/16 15:51:50 阅读更多

Chrome OS虚拟机实操指南：Web优先架构与离线能力深度解析

1. 项目概述：一次真实的Chrome OS虚拟机体验复盘我最近花了一整个周末，在VirtualBox里搭了个Chrome OS的早期测试镜像，不是现在大家在Chromebook上用的稳定版，而是2010年前后开源社区流传的Chromium OS原始构建版本——就是当年…

2026/6/16 15:51:30 阅读更多

Apache服务器本质：模块化HTTP服务编排平台

1. 什么是Apache服务器？——从“网页能打开”说起很多人第一次听说Apache，是在搭建个人博客、公司官网或者测试一个PHP页面时。你下载完XAMPP、WAMP或直接在Linux上敲下sudo apt install apache2，回车之后，浏览器里输入http://loc…

2026/6/16 15:51:09 阅读更多

在A100服务器上跑dm_control库，遇到‘Cannot initialize a headless EGL display’的完整解决流程

在A100服务器无头环境下解决dm_control库EGL显示初始化问题的完整指南当你兴奋地在崭新的NVIDIA A100服务器上部署强化学习环境，准备大展拳脚时，突然遭遇"Cannot initialize a headless EGL display"的报错——这种挫败感我深有体会。作为长期…

2026/6/16 15:49:28 阅读更多

MPC8315E FCM模块NAND Flash ECC机制与编程实战详解

1. 项目概述与核心价值在嵌入式系统，尤其是那些运行在复杂电磁环境或对数据完整性有严苛要求的工业控制、通信设备中，存储器的可靠性直接决定了系统的稳定性。NAND Flash以其高密度、低成本的优势成为主流存储介质，但其物理特性决定了它天生…

2026/6/16 15:47:26 阅读更多

《LangChain 系列》Human-in-the-loop：什么时候必须让人工介入？

前面几章我们已经把 Agent、Tool、LangGraph 都讲完了。现在要补上最关键的一环：人工介入。没有 HITL 的 Agent，很像没有刹车的自动驾驶。它能跑，也可能跑得很快，但真正上线会让人害怕。企业里最危险的不是模型回答错一句话&a…

2026/6/16 0:01:15 阅读更多

3步彻底移除Windows Defender：终极Windows Defender Remover使用指南

3步彻底移除Windows Defender：终极Windows Defender Remover使用指南【免费下载链接】windows-defender-remover A tool which is uses to remove Windows Defender in Windows 8.x, Windows 10 (every version) and Windows 11. 项目地址: https://gitcode.com/…

2026/6/16 0:01:15 阅读更多

永春堂商业模式积分系统介绍：从理念到实践的转变

永春堂商业模式系统小程序开发方案：合规化健康零售服务平台技术实现指南本方案依托永春堂品牌大健康产品（如营养补充剂、草本洗护、五谷杂粮等普通食品/日化品类） 找演示：看专栏⬆️ 一、系统定位：去层级化、重产品…

2026/6/16 0:02:16 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/16 0:26:20 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/16 0:26:19 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/16 0:26:18 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/16 10:45:34 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/16 10:18:11 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/16 10:18:16 阅读更多

相关文章