ceph简介及部署安装

发布时间：2026/5/27 18:45:24

Ceph 分布式存储简介Ceph 简介Ceph 是一款开源、分布式、软件定义存储。Ceph 具备极高的可用性、扩展性和易用性用于存储海量数据。Ceph 存储可部署在通用服务器上这些服务器的CPU可以是x86架构也可以是ARM架构。Ceph 支持在同一集群内既有x86主机又有ARM 主机。软件定义 software-defined storage SDSCeph访问方式-简介Ceph提供以下访问Ceph集群的方法Ceph原生API(librados)Ceph块设备(RBD、librbd)也称为 RADOS块设备(RBD)镜像Ceph对象网关(RADOSGW、librgw)Ceph文件系统(CephFS、libcephfs)Ceph存储后端组件-简介监控器(MON)维护集群状态映射。它们可帮助其他守护进程互相协调。对象存储设备(OSD)存储数据并处理数据复制、恢复和重新平衡。管理器(MGR)通过基于浏览器的仪表板和RESTAPI跟踪运行时指标并公开集群信息。元数据服务器(MDS)存储CephFS使用的元数据而非对象存储或块存储以便客户端能够高效运行 POSIX命令。Ceph 分布式存储部署过程Ceph 集群环境说明部署方法cephadm操作系统Centos Stream 8最小化安装硬件配置2 cpu、4G memory、1个系统盘3个20G scsi数据盘准备虚拟机模板基于 CentOS-Stream-8-template 模板克隆出 ceph-template# 1 配置主机名解析[rootlocalhost ~]# cat /etc/hosts EOF###### ceph ######192.168.108.10 client.zhu.cloud client192.168.108.11 ceph1.zhu.cloud ceph1192.168.108.12 ceph2.zhu.cloud ceph2192.168.108.13 ceph3.zhu.cloud ceph3 EOF# 2 关闭 SELinux[rootlocalhost ~]# sed -ri s/^SELINUX.*/SELINUXdisabled/g/etc/selinux/config# 3 关闭防火墙[rootlocalhost ~]# systemctl disable firewalld --now# 4 配置yum仓库[rootlocalhost ~]# cat EOF /etc/yum.repos.d/ceph.repo[Ceph]nameCephbaseurlhttps://mirrors.aliyun.com/centos-vault/8-stream/storage/x86_64/cephpacificenabled1gpgcheck0EOF# 5 安装基础软件包[rootlocalhost ~]# dnf install -y bash-completion vim lrzsz unzip rsync sshpass tar# 6 配置时间同步[rootlocalhost ~]# dnf install -y chrony[rootlocalhost ~]# systemctl enable chronyd --now# 7 安装 cephadm[rootlocalhost ~]# dnf install -y cephadm[rootlocalhost ~]# cephadm --helpusage: cephadm[-h][--image IMAGE][--docker][--data-dir DATA_DIR][--log-dir LOG_DIR][--logrotate-dir LOGROTATE_DIR][--sysctl-dir SYSCTL_DIR][--unit-dir UNIT_DIR][--verbose][--timeout TIMEOUT][--retry RETRY][--env ENV][--no-container-init]{version,pull,inspect-image,ls,list-networks,adopt,rm-daemon,rmcluster,run,shell,enter,ceph-volume,zap-osds,unit,logs,bootstrap,deploy,checkhost,prepare-host,add-repo,rm-repo,install,registry-login,gatherfacts,exporter,host-maintenance,disk-rescan}... Bootstrap Ceph daemons with systemd and containers. positional arguments:{version,pull,inspect-image,ls,list-networks,adopt,rm-daemon,rmcluster,run,shell,enter,ceph-volume,zap-osds,unit,logs,bootstrap,deploy,checkhost,prepare-host,add-repo,rm-repo,install,registry-login,gatherfacts,exporter,host-maintenance,disk-rescan}sub-command version get ceph version from container pull pull the default container image inspect-image inspectlocalcontainer imagelslist daemon instances on thishost......# 安装 cephadm 的时候会自动安装官方推荐的容器引擎 podman[rootlocalhost ~]# rpm -q podmanpodman-4.9.4-0.1.module_el89713d3df00d.x86_64# 8 提前下载镜像[rootlocalhost ~]#podmanpull quay.io/ceph/ceph:v16podmanpull quay.io/ceph/ceph-grafana:8.3.5podmanpull quay.io/prometheus/node-exporter:v1.3.1podmanpull quay.io/prometheus/alertmanager:v0.23.0podmanpull quay.io/prometheus/prometheus:v2.33.4# 准备配置主机脚本[rootlocalhost ~]# cat /usr/local/bin/sethost EOF#/bin/bashhostnamectl set-hostname ceph$1.zhu.cloud nmcli connection modify ens160 ipv4.method manual ipv4.addresses192.168.108.1$1/24 ipv4.gateway192.168.108.2 ipv4.dns192.168.108.2 init0EOF##添加可执行权限[rootlocalhost ~]# chmod x /usr/local/bin/sethost关机虚拟机并打快照准备集群节点克隆出其他虚拟机并配置主机名和IP地址。##之前模板配置好脚本直接运行脚本配置#ceph1到ceph3按以下修改[rootlocalhost ~]# sethost 1 #ceph1用1Ceph 集群初始化[rootceph1 ~]# cephadm bootstrap --mon-ip 192.168.108.11 --allow-fqdn-hostname --initial-dashboard-user admin --initial-dashboard-password xxxxx --dashboard-password-noupdate##初始化时会输出内容网站用户名密码会显示在输出内容里面–mon-ip 192.168.108.11指定 monitor ip。–allow-fqdn-hostname指定允许使用长名称。当主机名是长名称时初始化时必须使用该参数。–initial-dashboard-user admin指定 Web UI 登录的管理员账户。–initial-dashboard-password 指定 Web UI 登录的管理员账户对应密码。–dashboard-password-noupdate指定不要更新 Web UI 登录密码。随后登陆网站添加节点添加节点过程Ceph采用共享秘钥进行身份验证使用命令“ceph cephadm get-pub-key” 获取到主机接入集群时所需的ssh 公钥。获取到公钥后使用该公钥实现对节点的免密ssh管理。使用命令“ceph orch host add” 添加主机。# 为了配置方便我们在ceph1上安装ceph客户端工具 ceph-common[rootceph1 ~]# dnf install -y ceph-common# 获取集群公钥[rootceph1 ~]# ceph cephadm get-pub-key ~/ceph.pub# 推送公钥到其他节点[rootceph1 ~]# ssh-copy-id -f -i ~/ceph.pub rootceph2.zhu.cloud[rootceph1 ~]# ssh-copy-id -f -i ~/ceph.pub rootceph3.zhu.cloud# 添加节点[rootceph1 ~]# ceph orch host add ceph2.zhu.cloudAddedhostceph2.zhu.cloudwith addr192.168.108.12[rootceph1 ~]# ceph orch host add ceph3.zhu.cloudAddedhostceph3.zhu.cloudwith addr192.168.108.13[rootceph1 ~]# ceph orch host lsHOST ADDR LABELS STATUS ceph1.zhu.cloud192.168.108.11 _admin ceph2.zhu.cloud192.168.108.12 ceph3.zhu.cloud192.168.108.133hostsincluster# 等待自动部署服务到其他节点部署完成后效果如下[rootceph1 ~]# ceph orch lsNAME PORTS RUNNING REFRESHED AGE PLACEMENT alertmanager ?:9093,90941/1 8m ago 9m count:1 crash3/3 8m ago 9m * grafana ?:30001/1 8m ago 9m count:1 mgr2/2 8m ago 9m count:2 mon3/5 8m ago 9m count:5 node-exporter ?:91003/3 8m ago 9m * prometheus ?:90951/1 8m ago 9m count:1# crash 3/3个# mgr 2/2个# mon 3/5个# node-exporter 3/3个部署 mon 和 mgr# 禁用 mon 和 mgr 服务的自动扩展功能[rootceph1 ~]# ceph orch apply mon --unmanagedtrue[rootceph1 ~]# ceph orch apply mgr --unmanagedtrue[rootceph1 ~]# ceph orch lsNAME PORTS RUNNING REFRESHED AGE PLACEMENT alertmanager ?:9093,90941/1 56s ago 12m count:1 crash3/3 57s ago 12m * grafana ?:30001/1 56s ago 12m count:1 mgr2/2 57s ago 3sunmanagedmon3/5 57s ago 8sunmanagednode-exporter ?:91003/3 57s ago 12m * prometheus ?:90951/1 56s ago 12m count:1# mon 和 mgr 的 PLACEMENT 状态为 unmanaged# 配置主机标签ceph2 和 ceph3 添加标签“ _admin”[rootceph1 ~]# ceph orch host label add ceph2.zhu.cloud _adminAdded label _admin tohostceph2.zhu.cloud[rootceph1 ~]# ceph orch host label add ceph3.zhu.cloud _adminAdded label _admin tohostceph3.zhu.cloud[rootceph1 ~]# ceph orch host lsHOST ADDR LABELS STATUS ceph1.zhu.cloud192.168.108.11 _admin ceph2.zhu.cloud192.168.108.12 _admin ceph3.zhu.cloud192.168.108.13 _admin3hostsincluster# 将 mon 和 mgr 组件部署到具有_admin标签的节点上[rootceph1 ~]# ceph orch apply mon --placementlabel:_adminScheduled mon update...[rootceph1 ~]# ceph orch apply mgr --placementlabel:_adminScheduled mgr update...#观察现象[rootceph1 ~]# ceph orch ls | egrep mon|mgrmgr3/3 2m ago 14s label:_admin mon3/3 2m ago 28s label:_admin部署 OSD# 将所有主机上闲置的硬盘添加为 OSD[rootceph1 ~]# ceph orch apply osd --all-available-devicesScheduled osd.all-available-devices update...验证查看集群中部署的服务[rootceph1 ~]# ceph orch lsNAME PORTS RUNNING REFRESHED AGE PLACEMENT alertmanager ?:9093,90941/1 42s ago 2h count:1 crash3/3 42s ago 2h * grafana ?:30001/1 42s ago 2h count:1 mgr3/3 42s ago 2h label:_admin mon3/3 42s ago 2h label:_admin node-exporter ?:91003/3 42s ago 2h * osd.all-available-devices942s ago 2h * prometheus ?:90951/1 42s ago 2h count:1查看集群状态[rootceph1 ~17:08:27]# ceph -scluster: id: bdee4f9e-5996-11f1-8dce-000c294cc7b5 health: HEALTH_OK##okservices: mon:3daemons, quorum ceph1.zhu.cloud,ceph2,ceph3(age 52m)mgr: ceph1.zhu.cloud.fvwqgp(active, since 52m), standbys: ceph3.nytnqr, ceph2.noelbi osd:9osds:9up(since 52m),9in(since 2h)data: pools:1pools,1pgs objects:0objects,0B usage:2.6GiB used,177GiB /180GiB avail pgs:1activeclean#HEALTH_OK表示健康状态良好#HEALTH_WARN表示集群存在告警需进行排查处理后可转为HEALTH_OK#HEALTH_ERR表示集群存在比较严重的错误需要立即处理查看集群 osd 结构[rootceph1 ~17:10:48]# ceph osd treeID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF-10.17537root default-30.05846hostceph10hdd0.01949osd.0 up1.000001.000003hdd0.01949osd.3 up1.000001.000006hdd0.01949osd.6 up1.000001.00000-70.05846hostceph22hdd0.01949osd.2 up1.000001.000005hdd0.01949osd.5 up1.000001.000008hdd0.01949osd.8 up1.000001.00000-50.05846hostceph31hdd0.01949osd.1 up1.000001.000004hdd0.01949osd.4 up1.000001.000007hdd0.01949osd.7 up1.000001.00000查看集群组件集群中运行的主要组件mgrceph 管理程序monitorceph 监视器osdceph 对象存储进程rgwceph 对象存储网关其他组件crash崩溃数据收集模块prometheus监控组件grafana监控数据展示dashboardalertmanagerprometheus告警组件node_exporterprometheus节点数据收集组件

2026知网AIGC检测升级！AI写论文怎么降？免费技巧+工具帮你把AI率降到0

最近知网的AIGC检测规则更新力度非常大，别再以为“换几个同义词、调整下语序就能蒙混过关”了——新版系统早就不局限于字词层面的匹配，而是深挖内容的逻辑结构、表达习惯这类深层特征。还在沿用“中译英再译回中文”“删掉连接词凑字数”的老方法&#…

2026/5/27 18:45:24 阅读更多

告别第三方软件：利用DDNS与端口映射打造专属远程桌面方案

1. 为什么你需要自建远程桌面方案？ 每次打开第三方远程控制软件，是不是总遇到卡顿、收费弹窗或者隐私担忧？我曾经也深受其害。去年疫情期间在家办公，用某知名远程软件连接公司电脑，关键时刻突然提示"免费用户时长…

2026/5/27 18:44:35 阅读更多

番茄小说下载器：5分钟搭建个人数字图书馆，永久保存你的阅读时光

番茄小说下载器：5分钟搭建个人数字图书馆，永久保存你的阅读时光【免费下载链接】fanqienovel-downloader 下载番茄小说项目地址: https://gitcode.com/gh_mirrors/fa/fanqienovel-downloader 你是否曾在深夜追更时，突然发现心爱的小…

2026/5/27 18:43:13 阅读更多

CEGAN：潜在空间对抗解决图像翻译模式崩溃与多样性缺失

1. 项目概述：当图像翻译遇上“模式崩溃”与“多样性缺失”在计算机视觉领域，图像翻译任务——比如将一张草图变成照片、将黑白图像上色、或者把白天的街景转换成夜景——一直是研究的热点。早期，我们依赖于复杂的、手工设计的特征和规则&…

2026/5/27 20:33:21 阅读更多

Obsidian插件汉化终极指南：3步轻松打造全中文笔记环境

Obsidian插件汉化终极指南：3步轻松打造全中文笔记环境【免费下载链接】obsidian-i18n 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-i18n 还在为Obsidian插件的英文界面而烦恼吗？想象一下，打开你最喜爱的笔记工具&#xf…

2026/5/27 20:33:21 阅读更多

清华大学thuthesis论文模板：5步快速掌握专业论文排版

清华大学thuthesis论文模板：5步快速掌握专业论文排版【免费下载链接】thuthesis LaTeX Thesis Template for Tsinghua University 项目地址: https://gitcode.com/gh_mirrors/th/thuthesis 清华大学thuthesis LaTeX论文模板是清华大学官方发布的学位论文排版…

2026/5/27 20:33:21 阅读更多

量子支持向量机在工业控制系统异常检测中的实践与验证

1. 项目概述：当量子计算遇上关键基础设施安全在工业控制系统（ICS）的世界里，安全工程师们正面临着一个日益棘手的困境。水处理厂、发电站、石油化工厂这些维系现代社会运转的关键基础设施，其核心——监控与数据采集系统…

2026/5/27 20:32:39 阅读更多

企业级AI决策中枢构建全路径（从POC到GDPR合规落地）：ChatGPT决策辅助工具工业级部署白皮书

更多请点击： https://codechina.net 第一章：企业级AI决策中枢构建全路径（从POC到GDPR合规落地）：ChatGPT决策辅助工具工业级部署白皮书构建企业级AI决策中枢绝非仅调用API即可完成，而是涵盖需求对齐、沙盒…

2026/5/27 20:31:57 阅读更多

深入解析NVMe管理工具nvme-cli：从源码架构到高级应用

深入解析NVMe管理工具nvme-cli：从源码架构到高级应用【免费下载链接】nvme-cli NVMe management command line interface. 项目地址: https://gitcode.com/gh_mirrors/nv/nvme-cli 在当今数据密集型计算环境中，NVMe（Non-Volatile Mem…

2026/5/27 20:31:57 阅读更多

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？ 在嵌入式GUI开发中，贝塞尔曲线是实现流畅动画和优雅界面的核心工具。但许多开发者在使用LVGL绘制曲线时，总会遇到令人头疼的锯齿和毛刺问题。这背后隐藏着嵌入式设备特有的…

2026/5/27 0:00:16 阅读更多

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

自动化验证码识别实战：Burpsuite与ddddocr的高效联动方案验证码机制作为现代Web应用的基础安全防线，其对抗自动化攻击的能力直接影响系统安全性。但在安全测试领域，验证码往往成为效率瓶颈——传统手工识别方式让渗透测试人员每天浪费数小时在…

2026/5/27 0:00:36 阅读更多

中国AI岗位暴涨12倍，13种你没听过的AI岗位

2026年，中国AI岗位数量同比增长12倍，AI科学家月薪高达13.7万，高性能计算工程师出现“7个岗位抢1个人”的荒诞场面。与此同时，数据录入、基础财务分析、一线客服等岗位大幅下降。全球范围内，AI/ML岗位招聘量同比增长88%…

2026/5/27 0:03:59 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/27 3:04:04 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/27 2:28:22 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/27 20:16:23 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章

2026知网AIGC检测升级！AI写论文怎么降？免费技巧+工具帮你把AI率降到0

告别第三方软件：利用DDNS与端口映射打造专属远程桌面方案

番茄小说下载器：5分钟搭建个人数字图书馆，永久保存你的阅读时光

CEGAN：潜在空间对抗解决图像翻译模式崩溃与多样性缺失

Obsidian插件汉化终极指南：3步轻松打造全中文笔记环境

清华大学thuthesis论文模板：5步快速掌握专业论文排版

量子支持向量机在工业控制系统异常检测中的实践与验证

企业级AI决策中枢构建全路径（从POC到GDPR合规落地）：ChatGPT决策辅助工具工业级部署白皮书

深入解析NVMe管理工具nvme-cli：从源码架构到高级应用

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

中国AI岗位暴涨12倍，13种你没听过的AI岗位

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

附录 B：术语表

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥