Python实战：用熵权法自动计算指标权重（附完整代码）

发布时间：2026/6/2 12:02:28

Python实战用熵权法自动计算指标权重附完整代码当我们需要对多个指标进行综合评价时如何确定每个指标的权重往往是个令人头疼的问题。传统的专家打分法主观性强而层次分析法又需要构建复杂的判断矩阵。今天我要分享的是一个基于数据本身特性的客观赋权方法——熵权法以及如何用Python实现它。1. 熵权法原理与优势熵权法的核心思想来源于信息论中的熵概念。简单来说熵是衡量系统混乱程度的指标。在评价体系中如果一个指标的数据差异越大说明它包含的信息量越多对评价结果的影响也就越大因此应该赋予更高的权重。熵权法的三大优势客观性完全基于数据本身特性计算权重避免人为干扰自动化计算过程可程序化实现适合批量处理适应性适用于大多数多指标评价场景注意熵权法特别适合那些缺乏先验知识或专家经验的评价场景但当某个指标在所有样本中取值几乎相同时该指标的权重会趋近于零。2. 数据准备与预处理在开始编码前我们需要准备合适的数据。假设我们正在评估5家供应商的绩效考虑以下4个指标交货准时率(%)产品质量合格率(%)价格竞争力(分数)售后服务评分(1-5分)import numpy as np # 示例数据5家供应商在4个指标上的表现 data np.array([ [95, 98, 85, 4.5], # 供应商A [90, 95, 90, 4.0], # 供应商B [85, 90, 92, 3.8], # 供应商C [88, 92, 88, 4.2], # 供应商D [92, 96, 86, 4.3] # 供应商E ])2.1 数据标准化处理由于各指标量纲不同我们需要先进行标准化。这里采用极差标准化方法def normalize_data(data): # 对于正向指标越大越好 max_vals np.max(data, axis0) min_vals np.min(data, axis0) normalized (data - min_vals) / (max_vals - min_vals) # 处理可能存在的NaN当某指标所有值相同时 normalized np.nan_to_num(normalized, nan0.5) return normalized normalized_data normalize_data(data) print(标准化后的数据:\n, normalized_data)3. 熵权法核心实现现在我们来编写熵权法的主要计算函数。整个过程分为四个步骤计算指标比重计算信息熵计算差异系数确定权重def entropy_weight(data): # 计算指标比重 proportion data / np.sum(data, axis0) # 计算信息熵加上微小值避免log(0) entropy -np.sum(proportion * np.log(proportion 1e-10), axis0) / np.log(len(data)) # 计算差异系数 diversity 1 - entropy # 计算权重 weights diversity / np.sum(diversity) return weights weights entropy_weight(normalized_data) print(各指标权重:, weights)3.1 代码优化与调试技巧在实际应用中你可能会遇到以下问题及解决方案问题1某些指标在所有样本中取值完全相同解决方案在标准化步骤中增加NaN处理如代码中的nan0.5问题2计算结果不稳定解决方案增加微小值(1e-10)避免数值计算问题问题3需要处理负向指标越小越好解决方案在标准化步骤前对数据进行转换def handle_negative_indicators(data, negative_colsNone): if negative_cols is None: return data # 对负向指标取倒数 data[:, negative_cols] 1 / (data[:, negative_cols] 1e-10) return data4. 结果分析与应用计算完成后我们可以得到各指标的权重。以供应商评估为例指标权重交货准时率0.28产品质量0.25价格竞争力0.32售后服务0.15这个权重分布表明在我们的供应商样本中价格竞争力差异最大因此权重最高售后服务评分在各供应商间差异较小权重最低4.1 综合评分计算有了权重后我们可以计算每家供应商的综合得分def calculate_scores(data, weights): normalized normalize_data(data) scores np.dot(normalized, weights) return scores supplier_scores calculate_scores(data, weights) print(供应商综合得分:, supplier_scores)4.2 结果可视化为了更直观地展示结果我们可以使用matplotlib绘制雷达图import matplotlib.pyplot as plt def plot_radar_chart(categories, values, title): N len(categories) angles np.linspace(0, 2 * np.pi, N, endpointFalse).tolist() values values[:1] angles angles[:1] fig, ax plt.subplots(figsize(6, 6), subplot_kwdict(polarTrue)) ax.fill(angles, values, colorred, alpha0.25) ax.plot(angles, values, colorred, markero) ax.set_xticks(angles[:-1]) ax.set_xticklabels(categories) ax.set_title(title, y1.1) plt.show() # 绘制权重分布雷达图 categories [Delivery, Quality, Price, Service] plot_radar_chart(categories, weights, Indicator Weights Distribution)5. 高级应用与扩展5.1 结合主观权重虽然熵权法是客观赋权方法但我们可以将其与主观赋权法结合得到更全面的评价结果。常见的方法是使用乘法合成def combined_weights(objective_weights, subjective_weights, alpha0.5): alpha: 主观权重占比 return alpha * subjective_weights (1 - alpha) * objective_weights # 示例主观权重 subjective_weights np.array([0.3, 0.3, 0.2, 0.2]) final_weights combined_weights(weights, subjective_weights, alpha0.3)5.2 处理缺失数据实际数据中常有缺失值我们需要适当处理def handle_missing_data(data, strategymean): if strategy mean: col_means np.nanmean(data, axis0) return np.where(np.isnan(data), col_means, data) elif strategy median: col_medians np.nanmedian(data, axis0) return np.where(np.isnan(data), col_medians, data) else: raise ValueError(Unknown strategy)5.3 批量处理多个数据集当需要处理多个相似数据集时我们可以将整个流程封装成类class EntropyWeightCalculator: def __init__(self, negative_colsNone): self.negative_cols negative_cols self.weights None def fit(self, data): processed_data handle_negative_indicators(data, self.negative_cols) normalized_data normalize_data(processed_data) self.weights entropy_weight(normalized_data) return self def transform(self, data): processed_data handle_negative_indicators(data, self.negative_cols) normalized_data normalize_data(processed_data) return calculate_scores(normalized_data, self.weights) def fit_transform(self, data): return self.fit(data).transform(data) # 使用示例 ewc EntropyWeightCalculator() scores ewc.fit_transform(data)在实际项目中我发现封装成类的方式特别适合需要反复应用相同权重计算逻辑的场景比如每月一次的供应商评估。通过保存训练好的权重可以确保评价标准的一致性。

WaveTools：三招让《鸣潮》告别卡顿，性能提升50%的终极解决方案

WaveTools：三招让《鸣潮》告别卡顿，性能提升50%的终极解决方案【免费下载链接】WaveTools 🧰鸣潮工具箱项目地址: https://gitcode.com/gh_mirrors/wa/WaveTools 还在为《鸣潮》的卡顿和掉帧而烦恼吗？明明配置不差&#…

2026/6/1 20:41:21 阅读更多

Qwen2.5-0.5B Instruct在软件测试中的自动化应用

Qwen2.5-0.5B Instruct在软件测试中的自动化应用 1. 引言软件测试是确保产品质量的关键环节，但传统测试方法往往耗时费力。开发人员需要编写大量测试用例，执行重复的测试流程，还要分析复杂的测试结果。这个过程不仅枯燥，还容易…

2026/6/2 3:15:25 阅读更多

实战指南：在隔离网络中部署Rust开发环境的完整解决方案

实战指南：在隔离网络中部署Rust开发环境的完整解决方案【免费下载链接】rustup The Rust toolchain installer 项目地址: https://gitcode.com/gh_mirrors/ru/rustup Rustup是Rust编程语言的官方工具链安装器，它允许你在稳定版、测试版和夜间版编…

2026/6/1 14:06:43 阅读更多

告别复制粘贴：Ampy工具实现ESP MicroPython文件高效管理

1. 项目概述与核心价值如果你正在玩ESP8266或者ESP32，并且已经刷入了MicroPython固件，那么恭喜你，你已经跨入了嵌入式Python开发的大门。不过，紧接着一个很实际的问题就来了：写好的.py脚本，怎么传到板子上去…

2026/6/2 12:02:16 阅读更多

大模型应用开发学习路线：告别“调参侠”，收藏这份高薪秘籍！

本文介绍了如何从技术选型、应用开发到模型调试和上线，掌握AI大模型全链路能力。文章提供了一套完整的学习路线，包括大模型基础认知、核心技术模块、开发基础能力、应用场景开发、项目落地流程和面试求职冲刺等6大模块，帮助读者快速入门并提升…

2026/6/2 12:01:15 阅读更多

我的选题灵感，90%来自读者评论区

做自媒体最怕什么？不是写稿，是“不知道写什么”。每天早上打开文档，脑子里一片空白。后来我发现，最好的选题其实一直藏在我的眼皮底下——读者评论区。以前我看评论区只看“有没有人夸我”。后来一个朋友点醒我：读者问…

2026/6/2 12:01:15 阅读更多

Azure学术流量豁免指南：申请、配置与成本优化实战

1. 项目概述：学术云成本优化的关键一步在高校实验室或者研究机构里搞过云计算的朋友，估计都对“出站流量费”这个名词又爱又恨。爱的是，云服务商提供的海量计算资源和全球网络，让我们的研究项目可以轻松跨越地域限制&#xff0c…

2026/6/2 12:00:54 阅读更多

3大实战技巧：如何用OnmyojiAutoScript解放双手，让阴阳师自动帮你刷御魂？

3大实战技巧：如何用OnmyojiAutoScript解放双手，让阴阳师自动帮你刷御魂？ 【免费下载链接】OnmyojiAutoScript Onmyoji Auto Script | 阴阳师脚本项目地址: https://gitcode.com/gh_mirrors/on/OnmyojiAutoScript 如果你也是阴阳师玩家…

2026/6/2 12:00:34 阅读更多

终极指南：如何快速解决城通网盘限速问题，实现高速下载

终极指南：如何快速解决城通网盘限速问题，实现高速下载【免费下载链接】ctfileGet 获取城通网盘一次性直连地址项目地址: https://gitcode.com/gh_mirrors/ct/ctfileGet 你是否曾经为城通网盘那令人崩溃的下载速度而苦恼？面对50KB/s的…

2026/6/2 12:00:14 阅读更多

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地摘要 Tool Calling 是大模型系统从“会回答”走向“会执行”的关键能力。很多文章只停留在 @Tool 注解和 Hello World 级别示例，但一旦进入生产环境，问题很快从“怎么调用”升级为“怎么控延迟、怎么控风…

2026/6/2 0:01:22 阅读更多

解耦安防碎片化：基于 Docker 与边缘计算的 AI 视频中台架构设计（支持 GB28181/RTSP 与源码交付）

在智能视频分析（IVA）与产业物联网（IoT）大行其道的今天，政企级安防项目的落地依然面临着严重的碎片化挑战。对于系统集成商和独立软件开发商（ISV）而言，传统的流媒体研发存在两大核心痛…

2026/6/2 0:03:04 阅读更多

解耦品牌壁垒：基于 Docker 与边缘计算的高并发视频中台架构（支持 GB28181/RTSP 统一接入与源码交付）

在泛安防与产业物联网（IoT）工程落地中，系统集成商与技术团队往往深陷于底层流媒体对接的碎片化泥潭。一方面，前端摄像机、IPC、NVR 品牌林立（如海康、大华、宇视等），其 GB28181 国标协议的信令交…

2026/6/2 0:03:04 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/2 3:04:55 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/2 3:51:01 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/2 1:12:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/2 5:03:37 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/2 0:27:25 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/2 2:18:01 阅读更多

相关文章