3篇6章4节:累积分布函数(CDF)图在 ggdist 的可视化演示 在医学研究中,直方图和概率密度函数(PDF)常被用来展示数据分布形态,但临床决策更常需要回答 “低于某阈值的患者占多少” 这类累积性问题。累积分布函数(CDF)正是解决这类问题的核心工具,它直观呈现数据从小到大的累积概率,在达标率、百分位数、风险分层等场景中具有不可替代的价值。传统绘图方法难以同时呈现分布细节与不确定性,而基于通过 ggdist 的函数就可可高效绘制信息丰富的 CDF 图,为医学数据的分布化、不确定性可视化提供了新的技术路径。一、认识累积分布函数和概率密度函数很多人第一次接触医学统计时,最熟悉的图就是直方图。比如我们统计100名患者的血糖值、血压值、肿瘤大小,画出来后会发现:有些区间人特别多,有些区间人特别少。直方图其实是在回答一个问题:“数据主要集中在哪里?”这时候如果再加上一条钟形曲线,我们就得到了经典的正态分布图,也叫概率密度函数(PDF)。# 模拟100名患者收缩压数据 set.seed(123) sbp - rnorm(100, mean = 135, sd = 15) # 绘制直方图并叠加正态分布PDF hist(sbp, breaks = 10, probability = TRUE, main = "Histogram with Normal PDF"