基于支持向量回归（SVR）的糖尿病病情进展预测

发布时间：2026/5/27 11:54:02

1.作者介绍黄书涛男西安工程大学电子信息学院2025级研究生研究方向机器视觉与人工智能电子邮件15003636820163.com胥乾信西安工程大学电子信息学院2025级研究生张宏伟人工智能课题组研究方向机器视觉与人工智能电子邮件2692797728qq.com关于理论方面的知识介绍2.1 研究背景与任务定义糖尿病是一种常见的慢性代谢性疾病病情进展受年龄、体质指数、血压、血清指标、生活习惯和用药情况等多种因素影响。对于临床辅助分析而言如果能够根据患者的基础指标预测未来病情进展趋势就可以为风险评估和治疗方案制定提供参考。本实验研究的是糖尿病病情进展预测问题预测目标是患者一年后的病情进展定量指标。由于目标变量是连续数值因此该问题属于回归预测任务而不是分类任务。注意本实验不是判断是否患糖尿病而是预测一年后的病情进展数值。2.2 支持向量回归SVR基本思想支持向量回归Support Vector RegressionSVR是支持向量机在回归任务中的应用。普通回归模型通常尽可能减小所有样本预测值与真实值之间的误差而SVR允许预测值在一定范围内波动。SVR通过设置误差容忍区间来构建回归模型只要样本预测误差位于允许范围内就不对该样本进行惩罚只有超出容忍区间的样本才会参与损失计算。这种思想可以提高模型对噪声数据的适应能力。图1 支持向量回归误差容忍区间示意图2.3 核函数与关键参数核函数用于决定SVR模型的拟合方式。通过核函数SVR可以把原始特征空间中的问题映射到更高维空间从而处理非线性关系。本实验主要比较三种核函数线性核、多项式核和径向基核。图2 三种核函数SVR建模流程2.4 模型评价指标为了比较三种核函数SVR模型的预测效果本实验采用决定系数R²、均方误差MSE和平均绝对误差MAE三个指标进行评价。• 决定系数R²用于衡量模型对目标变量变化的解释能力越接近1表示拟合效果越好。• 均方误差MSE预测误差平方的平均值对较大误差更敏感数值越小越好。• 平均绝对误差MAE预测值与真实值绝对误差的平均值数值越小表示平均偏差越小。3 . 关于实验过程的介绍完整实验代码测试结果3.1 实验环境与依赖包本实验使用Python语言完成模型构建和结果可视化。主要依赖库包括scikit-learn、matplotlib、numpy和pandas。其中scikit-learn用于加载数据集、划分数据、标准化处理、建立SVR模型和计算评价指标matplotlib用于绘制预测结果图。• Python建议使用3.8及以上版本。• scikit-learn用于机器学习建模与评价。• matplotlib用于绘制模型预测曲线。• numpy/pandas用于数值计算和结果整理。安装命令如下pip install numpy pandas matplotlib scikit-learn3.2 数据集介绍与预处理本实验使用Scikit-learn内置的load_diabetes()糖尿病回归数据集。该数据集包含442个样本每个样本包含10个特征包括年龄、性别、体质指数、平均血压以及6项血清指标。目标变量为患者一年后的糖尿病病情进展定量指标。数据集中的特征已经经过缩放处理但为了保持SVR建模流程的规范性并与目标值标准化处理保持一致实验中仍使用StandardScaler对训练集和测试集进行统一标准化。图3 糖尿病病情进展值分布图4 体质指数与病情进展值关系图5 特征与病情进展值相关性热力图3.3 实验流程本实验的总体流程包括首先读取糖尿病数据集然后将数据划分为训练集和测试集接着对特征值和目标值进行标准化处理之后分别建立线性核、多项式核和径向基核SVR模型最后进行测试集预测并计算评价指标。• 第一步导入相关模块。• 第二步读取糖尿病数据集并划分训练集、测试集。• 第三步对训练数据和测试数据进行标准化处理。• 第四步使用三种不同核函数的SVR模型进行训练和预测。• 第五步对模型进行性能评估并比较三种核函数的效果。3.4 完整实验代码下面给出完整实验代码。代码在原有SVR糖尿病预测流程基础上加入了中文兼容设置并修复了预测值反标准化时一维数组无法直接inverse_transform的问题。################################# 第一步导入相关模块fromsklearn.datasetsimportload_diabetes# 导入糖尿病数据集importmatplotlib.pyplotasplt# 可视化绘图fromsklearn.model_selectionimporttrain_test_split# 导入数据集划分模块fromsklearn.preprocessingimportStandardScaler# 导入数据标准化模块fromsklearn.svmimportSVR# 导入支持向量机回归模型SVRfromsklearn.metricsimportr2_score,mean_absolute_error,mean_squared_error# 模型评估使用R-squared、MSE、MAE指标评估# 中文兼容设置防止图表中文显示为方框plt.rcParams[font.sans-serif][SimHei]plt.rcParams[axes.unicode_minus]False################################# 第二步读取糖尿病数据集并进行分割diabetesload_diabetes()print(diabetes.DESCR)# 打印数据集说明xdiabetes.data# 特征数据包括年龄、性别、BMI、血压和血清指标等ydiabetes.target# 目标值表示一年后糖尿病病情进展定量指标x_train,x_test,y_train,y_testtrain_test_split(x,y,test_size0.25,random_state33)# test_size0.25表示25%的样本作为测试集# random_state33用于固定随机种子保证每次运行结果一致################################# 第三步对训练数据和测试数据进行标准化处理ss_xStandardScaler()ss_yStandardScaler()# 分别初始化特征值和目标值的标准化器x_trainss_x.fit_transform(x_train)# 对训练集特征进行标准化fit_transform会计算均值和标准差x_testss_x.transform(x_test)# 对测试集特征进行标准化只能使用训练集的均值和标准差避免数据泄露y_trainss_y.fit_transform(y_train.reshape(-1,1))y_testss_y.transform(y_test.reshape(-1,1))# 目标值也是数值型数据所以也进行标准化# reshape(-1, 1)用于把一维数组转换为二维数组################################# 第四步使用三种不同核函数配置的SVR模型进行训练和预测# 1. 使用线性核函数配置的支持向量机进行回归训练并预测linear_svrSVR(kernellinear)# kernellinear表示使用线性核函数linear_svr.fit(x_train,y_train.ravel())# fit用于模型训练ravel用于把二维目标值转换为一维linear_svr_predictlinear_svr.predict(x_test)# 使用测试集进行预测l1,plt.plot(y_test,colorb,linewidth2)l2,plt.plot(linear_svr_predict,colorr,linewidth2)plt.legend([l1,l2],[真实值,线性核SVR预测值],loc2)plt.title(线性核SVR预测结果对比)plt.xlabel(测试集样本序号)plt.ylabel(标准化后的病情进展值)plt.show()# 2. 使用多项式核函数配置的支持向量机进行回归训练并预测poly_svrSVR(kernelpoly)# kernelpoly表示使用多项式核函数poly_svr.fit(x_train,y_train.ravel())poly_svr_predictpoly_svr.predict(x_test)l1,plt.plot(y_test,colorb,linewidth2)l2,plt.plot(poly_svr_predict,colorr,linewidth2)plt.legend([l1,l2],[真实值,多项式核SVR预测值],loc2)plt.title(多项式核SVR预测结果对比)plt.xlabel(测试集样本序号)plt.ylabel(标准化后的病情进展值)plt.show()# 3. 使用径向基核函数配置的支持向量机进行回归训练并预测rbf_svrSVR(kernelrbf)# kernelrbf表示使用径向基核函数适合处理非线性关系rbf_svr.fit(x_train,y_train.ravel())rbf_svr_predictrbf_svr.predict(x_test)l1,plt.plot(y_test,colorb,linewidth2)l2,plt.plot(rbf_svr_predict,colorr,linewidth2)plt.legend([l1,l2],[真实值,径向基核SVR预测值],loc2)plt.title(径向基核SVR预测结果对比)plt.xlabel(测试集样本序号)plt.ylabel(标准化后的病情进展值)plt.show()################################# 第五步对三种核函数配置下的SVR模型进行性能评估# y_test是二维数组可以直接进行反标准化# 三个predict结果是一维数组需要reshape(-1, 1)后再进行反标准化y_test_originalss_y.inverse_transform(y_test)linear_svr_predict_originalss_y.inverse_transform(linear_svr_predict.reshape(-1,1))poly_svr_predict_originalss_y.inverse_transform(poly_svr_predict.reshape(-1,1))rbf_svr_predict_originalss_y.inverse_transform(rbf_svr_predict.reshape(-1,1))# 1. 线性核函数配置的SVRprint(线性核SVR默认评分,linear_svr.score(x_test,y_test))print(线性核SVR的R-squared值,r2_score(y_test,linear_svr_predict))print(线性核SVR的均方误差MSE,mean_squared_error(y_test_original,linear_svr_predict_original))print(线性核SVR的平均绝对误差MAE,mean_absolute_error(y_test_original,linear_svr_predict_original))# 2. 多项式核函数配置的SVRprint(\n多项式核SVR默认评分,poly_svr.score(x_test,y_test))print(多项式核SVR的R-squared值,r2_score(y_test,poly_svr_predict))print(多项式核SVR的均方误差MSE,mean_squared_error(y_test_original,poly_svr_predict_original))print(多项式核SVR的平均绝对误差MAE,mean_absolute_error(y_test_original,poly_svr_predict_original))# 3. 径向基核函数配置的SVRprint(\n径向基核SVR默认评分,rbf_svr.score(x_test,y_test))print(径向基核SVR的R-squared值,r2_score(y_test,rbf_svr_predict))print(径向基核SVR的均方误差MSE,mean_squared_error(y_test_original,rbf_svr_predict_original))print(径向基核SVR的平均绝对误差MAE,mean_absolute_error(y_test_original,rbf_svr_predict_original))3.5 测试结果实验分别训练线性核、多项式核和径向基核三种SVR模型。测试结果表明三种模型都能够在一定程度上拟合糖尿病病情进展趋势但不同核函数的预测能力存在差异。图6 三种核函数预测结果对比图7 支持向量回归模型评价指标表表1 三种核函数SVR模型测试结果从表1可以看出径向基核SVR的R²最高同时MSE和MAE最低因此在本次实验中径向基核模型综合表现较好。这说明糖尿病病情进展与输入特征之间可能存在一定非线性关系非线性核函数能够更好地学习这种关系。4 . 参考连接[1] Scikit-learn. load_diabetes — Load and return the diabetes dataset (regression). https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_diabetes.html[2] Scikit-learn. SVR — Epsilon-Support Vector Regression. https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVR.html[3] Scikit-learn. StandardScaler. https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html[4] Scikit-learn. Regression metrics: r2_score, mean_squared_error, mean_absolute_error. https://scikit-learn.org/stable/modules/model_evaluation.html[5] Bradley Efron, Trevor Hastie, Iain Johnstone, Robert Tibshirani. Least Angle Regression. Annals of Statistics, 2004. https://web.stanford.edu/~hastie/Papers/LARS/LeastAngle_2002.pdf[6] CSDN参考案例基于支持向量回归SVR的糖尿病病情进展预测。https://blog.csdn.net/m0_37758063/article/details/124086219

CANape新手避坑指南：从新建工程到连接ECU，手把手解决‘通道不匹配’和‘DAQ消失’问题

CANape实战避坑手册：从零搭建标定环境到稳定连接ECU的7个关键技巧第一次打开CANape时，那个布满英文按钮的界面就像面对一台陌生仪器的操作面板——每个按钮似乎都藏着未知的风险。作为汽车电子工程师的"数字手术刀"，CANape的威力与…

2026/5/27 11:53:42 阅读更多

如何用DSView开源多功能仪器软件快速进行电子信号分析

如何用DSView开源多功能仪器软件快速进行电子信号分析【免费下载链接】DSView An open source multi-function instrument for everyone 项目地址: https://gitcode.com/gh_mirrors/ds/DSView DSView是一款基于sigrok项目的开源多功能仪器软件，它能让你的电…

2026/5/27 11:53:42 阅读更多

如何用TrafficMonitor插件三步打造个性化系统监控信息中心

如何用TrafficMonitor插件三步打造个性化系统监控信息中心【免费下载链接】TrafficMonitorPlugins 用于TrafficMonitor的插件项目地址: https://gitcode.com/gh_mirrors/tr/TrafficMonitorPlugins 你是不是经常在任务栏和桌面之间来回切换，只为查看几个简单…

2026/5/27 11:53:19 阅读更多

FileUtil 文件管理篇：mkdir、copyFile、rename、unlink 一次搞定

文章目录前言所有案例方法总览创建目录删除目录复制文件：copyFile vs copyFileSync重命名：rename 即是移动moveFile：跨路径移动删除文件：unlink vs unlinkSync文件属性查询：stat / access / isFile / isDirectory目录大…

2026/5/27 19:04:38 阅读更多

从命令行到集群：解锁Kettle三大核心工具(pan/kitchen/carte)的自动化与调度实战

1. 认识Kettle三大核心工具：从本地调试到生产部署第一次接触Kettle时，很多人会被它的图形界面Spoon吸引，但真正要走向生产环境，命令行工具才是关键。想象一下这样的场景：你花了两周时间在本地开发了一个复杂的数据清洗…

2026/5/27 19:04:38 阅读更多

JFA模型：基于深度强化学习的藏棋九AI设计与实现

1. 项目概述：当AI遇见藏棋九藏棋九，这个听起来有些陌生的名字，其实是一项拥有数百年历史、被列为国家级非物质文化遗产的棋类游戏。它在一块14x14的棋盘上进行，规则独特，融合了布局的宏观谋划与战斗阶段的微观厮杀&…

2026/5/27 19:04:12 阅读更多

Brew 包管理工具高效开发场景实战

目录 ① macOS 开发环境一键初始化方案 ② 多版本编程语言并行管理策略 ③ 开源开发工具链快速部署流程 ④ 团队标准化环境配置同步机制 ⑤ 自动化脚本中的依赖安装集成 ⑥ 旧版本软件回退与兼容性处理 ⑦ 自定义公式编写与私有源搭建 ⑧ 系统清理与冗余依赖卸载方法 …

2026/5/27 19:03:24 阅读更多

3分钟学会自动化strm文件生成：告别手动创建，拥抱智能流媒体管理

3分钟学会自动化strm文件生成：告别手动创建，拥抱智能流媒体管理【免费下载链接】alist-strm 项目地址: https://gitcode.com/gh_mirrors/al/alist-strm 你是否厌倦了为每一部影片手动创建strm文件？是否曾因媒体库路径变更导致所有链…

2026/5/27 19:03:02 阅读更多

ChatGPT品牌故事创作速成指南，2小时内产出可商用故事脚本（附17个行业模板库）

更多请点击： https://intelliparadigm.com 第一章：ChatGPT品牌故事创作的本质与价值边界 ChatGPT品牌故事创作并非简单的产品功能罗列或营销话术堆砌，而是一种以技术可信性为基底、以人类认知共情为路径的叙事实践。其本质在于将大语言模型的…

2026/5/27 19:01:31 阅读更多

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？ 在嵌入式GUI开发中，贝塞尔曲线是实现流畅动画和优雅界面的核心工具。但许多开发者在使用LVGL绘制曲线时，总会遇到令人头疼的锯齿和毛刺问题。这背后隐藏着嵌入式设备特有的…

2026/5/27 0:00:16 阅读更多

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

自动化验证码识别实战：Burpsuite与ddddocr的高效联动方案验证码机制作为现代Web应用的基础安全防线，其对抗自动化攻击的能力直接影响系统安全性。但在安全测试领域，验证码往往成为效率瓶颈——传统手工识别方式让渗透测试人员每天浪费数小时在…

2026/5/27 0:00:36 阅读更多

中国AI岗位暴涨12倍，13种你没听过的AI岗位

2026年，中国AI岗位数量同比增长12倍，AI科学家月薪高达13.7万，高性能计算工程师出现“7个岗位抢1个人”的荒诞场面。与此同时，数据录入、基础财务分析、一线客服等岗位大幅下降。全球范围内，AI/ML岗位招聘量同比增长88%…

2026/5/27 0:03:59 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/27 3:04:04 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/27 2:28:22 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/26 19:57:06 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章