基于OpenAI Clip模型的自动图像分类

发布时间：2026/6/6 0:35:04

基于OpenAI Clip模型的自动图像分类一环境安装pip install githttps://github.com/openai/CLIP.gitpip install torch torchvision pip install githttps://github.com/openai/CLIP.git pip install pillow matplotlib二基本使用import clip import torchfromPIL import Image import numpyasnpclassCLIPImageClassifier:def__init__(self,model_nameViT-B/32,deviceNone): 初始化CLIP分类器 Args:model_name:CLIP模型名称可选ViT-B/32,ViT-B/16,ViT-L/14device:运行设备cuda或cpuifdeviceisNone:self.devicecudaiftorch.cuda.is_available()elsecpuelse:self.devicedeviceprint(f使用设备: {self.device})print(f加载模型: {model_name})# 加载CLIP模型和预处理函数self.model,self.preprocessclip.load(model_name,deviceself.device)self.model.eval()defclassify_image(self,image_path,class_names,top_k5): 对单张图像进行分类 Args:image_path:图像路径 class_names:类别名称列表 top_k:返回top-k预测结果 Returns:包含预测结果的字典列表# 加载并预处理图像try:imageImage.open(image_path).convert(RGB)except Exceptionase:print(f无法加载图像: {e})returnNoneimage_inputself.preprocess(image).unsqueeze(0).to(self.device)# 处理文本类别text_inputstorch.cat([clip.tokenize(fa photo of {c})forcinclass_names]).to(self.device)# 推理withtorch.no_grad():image_featuresself.model.encode_image(image_input)text_featuresself.model.encode_text(text_inputs)# 计算相似度image_featuresimage_features/image_features.norm(dim-1,keepdimTrue)text_featurestext_features/text_features.norm(dim-1,keepdimTrue)similarity(100.0*image_features text_features.T).softmax(dim-1)# 获取top-k结果probssimilarity.cpu().numpy()[0]top_indicesnp.argsort(probs)[::-1][:top_k]results[]foridxintop_indices:results.append({class:class_names[idx],probability:float(probs[idx])})returnresultsdefclassify_batch(self,image_paths,class_names,top_k5): 批量分类多张图像 results[]forimage_pathinimage_paths:resultself.classify_image(image_path,class_names,top_k)ifresult:results.append({image_path:image_path,predictions:result})returnresults# 使用示例if__name____main__:# 初始化分类器classifierCLIPImageClassifier(model_nameViT-B/32)# 定义类别可以是任何你想要的类别class_names[cat,dog,bird,car,airplane,beach,mountain,forest,city,ocean,apple,banana,orange,person,bicycle]# 单张图像分类image_pathtest_image.jpg# 替换为你的图像路径resultsclassifier.classify_image(image_path,class_names,top_k3)ifresults:print(\n分类结果:)fori,resultinenumerate(results,1):print(f{i}. {result[class]}: {result[probability]:.2%})

【Sora 2超低比特率生存指南】：从128kbps到4K@60fps的7步重构法，NVIDIA工程师紧急封存的3项未公开API调用链

更多请点击： https://kaifayun.com 第一章：Sora 2比特率优化的底层范式迁移传统视频生成模型普遍依赖高码率连续帧重建，而 Sora 2 的比特率优化并非简单压缩，而是将时空表征从“像素流”重构为“语义-运动双通道稀疏编码”。这一…

2026/6/6 0:35:04 阅读更多

Jenkins API 驱动的多环境自动化部署实战：从手动点击到命令行一键发版

通过 Jenkins REST API 实现命令行一键触发构建，覆盖前端/后端/多 Jenkins 实例的统一部署管理方案。适用于 DevOps 工程师和运维团队。关键词：Jenkins API / 自动化部署 / CI/CD / 命令行部署 / 多环境管理 / REST API 一、为什么要用 API 驱动部署痛点每次发版要打开浏…

2026/6/6 0:33:03 阅读更多

YOLOv11涨点改进| TGRS 2026 顶刊| 注意力改进篇| 引入MSEA多尺度边缘感知注意力，助力红外小目标检测、遥感目标检测、工业缺陷检测、图像去雨雾任务高效涨点

一、本文介绍 🔥本文给大家介绍使用MSEA多尺度边缘感知注意力改进YOLOv11网络模型，通过增强网络对目标边缘和轮廓信息的感知能力，通过多尺度上下文建模与边缘感知注意力机制，使模型在特征提取阶段同时关注目标内部语义信息和边界细节信息。MSEA利用多尺度空洞卷积获取不同…

2026/6/6 0:32:02 阅读更多

Windows + Trae 安装使用 CodeGraph 完整指南

前言 CodeGraph 是一个代码知识图谱工具，能让 AI 真正理解你的项目结构。本文将详细介绍在 Windows 环境下，为 Trae IDE 配置 CodeGraph 的完整过程。适用场景：大型项目、复杂代码库、需要 AI 深度理解代码的业务场景（如拼团系…

2026/6/6 1:48:51 阅读更多

虚拟机VMware配置网络，与主机网络互通，可上网

步骤检查Linux虚拟机的网络连接模式，确保它是NAT模式。（由于只在本机进行连接，所以没有选择桥接模式。当然，桥接模式的配置会有所不同，在此不做深入分析） 在VMware workstation里，点击菜单栏上…

2026/6/6 1:48:31 阅读更多

centos7的yum源配置

备份现有yum源首先，建议备份现有的 yum 源配置，以防出现问题可以恢复。 sudo mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bak下载阿里云yum源配置文件使用 wget 命令从阿里云下载新的 yum 源配置文件。 wget -O /etc/yu…

2026/6/6 1:48:10 阅读更多

实战演练，基于快马平台jdk17环境快速搭建restful api微服务

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请使用jdk17创建一个实战性的用户管理api服务，采用spring boot框架，实现用户的增删改查功能，数据存储使用内存数据库h2，api设计符合…

2026/6/6 1:47:10 阅读更多

3天掌握芋道源码企业级框架：从零搭建到实战开发的完整指南

3天掌握芋道源码企业级框架：从零搭建到实战开发的完整指南【免费下载链接】ruoyi-spring-boot-all 芋道源码(无遮羞布版) 项目地址: https://gitcode.com/gh_mirrors/ru/ruoyi-spring-boot-all 你是否正在寻找一款真正开源、功能完整的企业级Java开发框架&a…

2026/6/6 1:46:30 阅读更多

新手入门电气控制：基于快马平台理解闭式星三角启动的电路与时序

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请生成一个面向初学者的闭式星三角启动原理教学演示程序，要求包含以下核心功能：1、展示清晰的原理图分解视图，将主电路、控制电路分层显示&…

2026/6/6 1:46:30 阅读更多

Windows下免安装凸轮轮廓生成工具：支持多种从动件与运动规律的本地化计算与DXF导出

本文还有配套的精品资源，点击获取简介：专为机械设计场景打造的便携式凸轮设计辅助工具，运行在Windows平台，无需安装、不写注册表、不联网，双击主程序即可启动。提供直动/摆动两类从动件类型（尖顶、滚子…

2026/6/6 0:00:44 阅读更多

DeepPCB数据集：3步构建高精度PCB缺陷检测AI系统

DeepPCB数据集：3步构建高精度PCB缺陷检测AI系统【免费下载链接】DeepPCB A PCB defect dataset. 项目地址: https://gitcode.com/gh_mirrors/de/DeepPCB 还在为PCB（印刷电路板）缺陷检测项目找不到高质量数据集而烦恼吗？面…

2026/6/6 0:01:04 阅读更多

Aimmy完全指南：5分钟掌握免费AI瞄准辅助工具，提升游戏操作体验

Aimmy完全指南：5分钟掌握免费AI瞄准辅助工具，提升游戏操作体验【免费下载链接】Aimmy Universal Second Eye for Gamers with Impairments (Universal AI Aim Aligner (AI Aimbot) - ONNX/YOLOv8 - C#) 项目地址: https://gitcode.com/gh_mirrors/ai/…

2026/6/6 0:04:06 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/5 9:28:46 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/5 7:30:31 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/5 9:28:45 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/5 9:28:45 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/5 9:28:42 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/5 9:28:45 阅读更多

相关文章

【Sora 2超低比特率生存指南】：从128kbps到4K@60fps的7步重构法，NVIDIA工程师紧急封存的3项未公开API调用链

Jenkins API 驱动的多环境自动化部署实战：从手动点击到命令行一键发版

YOLOv11涨点改进| TGRS 2026 顶刊| 注意力改进篇| 引入MSEA多尺度边缘感知注意力，助力红外小目标检测、遥感目标检测、工业缺陷检测、图像去雨雾任务高效涨点

Windows + Trae 安装使用 CodeGraph 完整指南

虚拟机VMware配置网络，与主机网络互通，可上网

centos7的yum源配置

实战演练，基于快马平台jdk17环境快速搭建restful api微服务

3天掌握芋道源码企业级框架：从零搭建到实战开发的完整指南

新手入门电气控制：基于快马平台理解闭式星三角启动的电路与时序

Windows下免安装凸轮轮廓生成工具：支持多种从动件与运动规律的本地化计算与DXF导出

DeepPCB数据集：3步构建高精度PCB缺陷检测AI系统

Aimmy完全指南：5分钟掌握免费AI瞄准辅助工具，提升游戏操作体验

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因