掌握Ollama命令，轻松管理AI模型

发布时间：2026/6/27 19:55:38

常用命令行代码在下面解释在上面运行指定模型最常用可加--temperature、--num-ctx等参数ollama run llama3.1:8b查看本地所有已下载模型ollama list从仓库下载模型到本地替换模型名和标签ollama pull qwen2:7b启动 Ollama 后台 API 服务默认监听 localhost:11434ollama serve查看当前在内存中运行的模型进程ollama ps停止正在运行的指定模型释放显存ollama stop llama3.1查看模型基本信息大小、格式、许可证等ollama show llama3.1查看模型的具体参数如温度、上下文长度ollama show llama3.1 --parameters查看模型的内置系统提示词System Promptollama show llama3.1 --system复制/重命名一个本地模型ollama cp llama3.1 my-model永久删除本地模型文件ollama rm llama3.1使用自定义 Modelfile 创建一个新模型ollama create my-model -f Modelfile将本地模型推送至仓库需先登录ollama push username/my-model登录 Ollama 官方或私有注册中心ollama login退出登录ollama logout查看全部命令帮助ollama help查看某个子命令如 run的详细帮助ollama help run查看当前 Ollama 版本号ollama --version输出服务运行日志用于调试ollama logs校验模型文件完整性ollama validate llama3.1二、常用环境变量启动ollama serve前设置按频率排序服务监听地址默认 127.0.0.1:11434改为 0.0.0.0 允许局域网访问export OLLAMA_HOST0.0.0.0:11434模型空闲保留时间默认 5m设为 -1 永久驻留export OLLAMA_KEEP_ALIVE10m模型下载存放目录默认 ~/.ollama/modelsexport OLLAMA_MODELS/path/to/models最大并发请求数默认 1高配 GPU 可调大export OLLAMA_NUM_PARALLEL2全局默认上下文窗口大小覆盖模型默认值export OLLAMA_CONTEXT_LENGTH8192开启调试日志0 关闭1 开启export OLLAMA_DEBUG1为显卡预留显存单位字节示例 512 MBexport OLLAMA_GPU_OVERHEAD536870912单 GPU 最多同时加载的模型数量默认自动export OLLAMA_MAX_LOADED_MODELS2开启 Flash Attention 加速1 开0 关export OLLAMA_FLASH_ATTENTION1强制模型分散到所有可用 GPU1 开启export OLLAMA_SCHED_SPREAD1

3分钟掌握网易云音乐NCM解密：免费开源工具完整使用指南

3分钟掌握网易云音乐NCM解密：免费开源工具完整使用指南【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经为网易云音乐下载的NCM加密文件无法在其他播放器播放而烦恼？ncmdump作为一款完全免费的开源解…

2026/6/27 19:54:58 阅读更多

vue页面的详细说明-peot.edit.html

结合前面讲解的 Vue 基本结构，以你提供的这个诗人信息管理代码为例，编写一份面向初学者的详细说明文档。如果vue相关知识遗忘了，可以看视频复习。 https://www.bilibili.com/video/BV1m84y1w7Tb?spm_id_from333.788.videopod.episodes&…

2026/6/27 19:54:58 阅读更多

Android位置隔离技术：FakeLocation的架构哲学与实践策略

Android位置隔离技术：FakeLocation的架构哲学与实践策略【免费下载链接】FakeLocation Xposed module to mock locations per app. 项目地址: https://gitcode.com/gh_mirrors/fak/FakeLocation 在移动应用生态中，位置权限已成为隐私保护与功能体…

2026/6/27 19:53:15 阅读更多

为什么有些家用电梯用了10年很少坏，有些3年就开始频繁故障？

一、一个真实的案例：13万买的电梯，两年故障不断2021年，一位业主花了13.6万元安装了一台家用别墅电梯。2022年10月到2023年6月，短短8个月里，电梯频繁出现系统故障，困人、异响、停止运行等问题反复发生。期间…

2026/6/27 21:26:53 阅读更多

OmniOperator核心组件揭秘：数据加载与计算优化的底层实现

OmniOperator核心组件揭秘：数据加载与计算优化的底层实现【免费下载链接】OmniOperator OmniOperator operator acceleration is implemented using native code (C/C) to optimize big data SQL operators. 项目地址: https://gitcode.com/openeuler/OmniOperat…

2026/6/27 21:25:31 阅读更多

【CDA干货】做了3年数据分析才明白：取数只是入门，会博弈才值钱，学会这5个策略，让数据分析师从取数机变成业务军师

你不是在取数，你是在下一盘棋。一、开场：让人血压升高的职场场景先问你一个问题，以下场景你经历过几个？业务方甩来一句 “帮我取个数，很急”，你问他要看什么，他说 “你先取出来我看看再说”老板…

2026/6/27 21:24:08 阅读更多

Fable 5 解禁、Sonnet 5 内测、国会 Deadline——模型炸了一地，你的企业接得住吗？

今天 AI 圈是连环炸。 Fable 5 部分解禁了。有用户甩出实机录屏，Claude 手机 App 和 Claude Code v2.1.190 里，Fable 5 赫然出现在模型选择器中。Anthropic 的代码还埋了一句"您已用完本周包含的 Fable 5 使用额度"——注意"包含"这…

2026/6/27 21:23:27 阅读更多

为什么选择OmniStateStore？5大优势让Flink状态管理更高效

为什么选择OmniStateStore？5大优势让Flink状态管理更高效【免费下载链接】OmniStateStore OmniStateStore is an open-source and high-performance state storage engine for Flink. 项目地址: https://gitcode.com/openeuler/OmniStateStore 前往项目官网…

2026/6/27 21:23:27 阅读更多

[特殊字符] 避坑实录：淘宝TOP API接入最常见的6个错误（签名/权限/限流/授权）（附Python源码）

🔧 避坑实录：淘宝TOP API接入最常见的6个错误（签名/权限/限流/授权）（附Python源码）淘宝TOP API对接时 90%的失败集中在6个点，下面逐个给出现象→原因→解决→可运行自检代码，直接跑就…

2026/6/27 21:23:07 阅读更多

千问AI眼镜：阿里AI战略急先锋，能否在激烈竞争中突围？

千问眼镜：销量第一背后的挑战不久前，不少第三方统计机构给千问背书，甚至给出全国销量第一的统计结果。这个第一的含金量有多高？暂且先打个问号。但这些榜单至少说明，千问眼镜延续了阿里AI战略整体偏激进的风格&#xf…

2026/6/27 0:01:13 阅读更多

Tomcat中X-Frame-Options配置实战：防御点击劫持的四种方法与最佳实践

1. 项目概述：为什么X-Frame-Options是Web安全的“防盗门”？最近在排查一个老项目的安全审计报告时，又被提到了“点击劫持”风险，矛头直指缺失的X-Frame-Options响应头。这已经不是第一次了，很多开发团队，尤…

2026/6/27 0:01:34 阅读更多

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrie…

2026/6/27 0:04:02 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/27 1:16:50 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/27 1:16:49 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/27 1:16:48 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/27 12:47:04 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/27 13:25:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/27 13:25:16 阅读更多

相关文章