熵权法
方法概述
熵权法是一种基于信息熵的客观赋权方法。它根据各指标数据的变异程度,利用信息熵计算指标的权重。指标的变异程度越大(熵值越小),提供的信息量越多,权重越大;反之权重越小。熵权法完全依赖数据本身,避免了主观判断的偏差,适用于多指标综合评价问题。
熵权法的核心思想是:
- 对原始数据进行标准化处理,消除量纲影响。
- 计算各指标下各样本值的比重,构建比重矩阵。
- 通过信息熵公式计算各指标的熵值,进而得到差异系数。
- 将差异系数归一化,即得指标权重。
该方法广泛应用于绩效评价、风险评估、方案优选等领域。
计算步骤
1. 构建原始数据矩阵
设有 \(n\) 个评价对象,\(m\) 个评价指标,原始数据矩阵为:
\[ X = \begin{bmatrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n1} & x_{n2} & \cdots & x_{nm} \end{bmatrix} \]
2. 数据标准化
根据指标的不同类型(极大型、极小型、中间型、区间型),采用相应的方法进行标准化,得到标准化矩阵 \(Z = (z_{ij})_{n \times m}\)。标准化方法有多种,常用的是极差标准化(Min-Max)。
(1)极大型指标(越大越好)
\[ z_{ij} = \frac{x_{ij} - \min(x_j)}{\max(x_j) - \min(x_j)} \]
(2)极小型指标(越小越好)
\[ z_{ij} = \frac{\max(x_j) - x_{ij}}{\max(x_j) - \min(x_j)} \]
(3)中间型指标(越接近某个固定值越好)
设最优值为 \(a\),则:
\[ z_{ij} = \begin{cases} 1 - \frac{|x_{ij} - a|}{\max(|x_j - a|)}, & \text{若分母非零} \\ 1, & \text{若所有值均等于最优值} \end{cases} \]
(4)区间型指标(落在某个区间内最好)
设最佳区间为 \([a,b]\),则:
\[ z_{ij} = \begin{cases} 1 - \frac{a - x_{ij}}{\max(a - \min(x_j), \max(x_j) - b)}, & x_{ij} < a \\ 1, & a \leq x_{ij} \leq b \\ 1 - \frac{x_{ij} - b}{\max(a - \min(x_j), \max(x_j) - b)}, & x_{ij} > b \end{cases} \]
其他标准化方法(适用于已正向化数据):
- Z-score标准化:\(z_{ij} = \frac{x_{ij} - \mu_j}{\sigma_j}\),然后线性变换到非负区间。
- 比重法:\(z_{ij} = \frac{x_{ij}}{\sum_{i=1}^n x_{ij}}\)。
- 向量归一化:\(z_{ij} = \frac{x_{ij}}{\sqrt{\sum_{i=1}^n x_{ij}^2}}\)。
3. 非负平移(可选)
若标准化后出现零值,为满足熵值计算中 \(\ln\) 的要求,可整体平移一个很小的正数(如 \(10^{-10}\))或约定 \(0 \ln 0 = 0\)。
4. 计算比重矩阵
计算第 \(j\) 项指标下第 \(i\) 个对象的值占该指标总值的比重:
\[ p_{ij} = \frac{z_{ij}}{\sum_{i=1}^{n} z_{ij}}, \quad j = 1,2,\ldots,m \]
此时每列之和为1。
5. 计算第 \(j\) 项指标的熵值
\[ E_j = -\frac{1}{\ln n} \sum_{i=1}^{n} p_{ij} \ln(p_{ij}), \quad j = 1,2,\ldots,m \]
其中规定 \(p_{ij}=0\) 时,\(p_{ij}\ln p_{ij}=0\)。
6. 计算差异系数
差异系数(也称信息效用值)表示该指标的信息量:
\[ g_j = 1 - E_j \]
7. 计算权重
将差异系数归一化即得各指标权重:
\[ w_j = \frac{g_j}{\sum_{j=1}^{m} g_j} \]
8. 计算综合得分(可选)
若需对各对象综合评价,可计算加权得分:
\[ F_i = \sum_{j=1}^{m} w_j z_{ij} \]
案例分析
案例背景:某企业需对四个供应商(A、B、C、D)进行评价,选取三个指标:产品质量(极大型)、价格(极小型)、交货准时率(极大型)。原始数据如下:
| 供应商 | 产品质量 | 价格 | 交货准时率 |
|---|---|---|---|
| A | 85 | 200 | 0.95 |
| B | 90 | 180 | 0.90 |
| C | 75 | 210 | 0.85 |
| D | 80 | 190 | 0.92 |
计算过程
1. 数据标准化(极差法)
- 产品质量(极大型):\(\max=90,\min=75\)
- A: \((85-75)/(90-75)=10/15=0.6667\)
- B: \((90-75)/15=1.0000\)
- C: \((75-75)/15=0.0000\)
- D: \((80-75)/15=0.3333\)
- 价格(极小型):\(\max=210,\min=180\)
- A: \((210-200)/(210-180)=10/30=0.3333\)
- B: \((210-180)/30=1.0000\)
- C: \((210-210)/30=0.0000\)
- D: \((210-190)/30=0.6667\)
- 交货准时率(极大型):\(\max=0.95,\min=0.85\)
- A: \((0.95-0.85)/0.10=1.0000\)
- B: \((0.90-0.85)/0.10=0.5000\)
- C: \((0.85-0.85)/0.10=0.0000\)
- D: \((0.92-0.85)/0.10=0.7000\)
标准化矩阵 \(Z\):
\[ Z = \begin{bmatrix} 0.6667 & 0.3333 & 1.0000 \\ 1.0000 & 1.0000 & 0.5000 \\ 0.0000 & 0.0000 & 0.0000 \\ 0.3333 & 0.6667 & 0.7000 \end{bmatrix} \]
2. 计算比重
以第一列(产品质量)为例,和 \(=0.6667+1.0000+0+0.3333=2.0000\):
- \(p_{11}=0.6667/2=0.3333\)
- \(p_{21}=1/2=0.5000\)
- \(p_{31}=0/2=0\)
- \(p_{41}=0.3333/2=0.1667\)
同理可得比重矩阵(略)。
3. 计算熵值
\(n=4\),\(\ln4=1.3863\)。以第一列为例: \[ \sum p\ln p = 0.3333\ln0.3333 + 0.5\ln0.5 + 0 + 0.1667\ln0.1667 \] \[ =0.3333\times(-1.0986)+0.5\times(-0.6931)+0.1667\times(-1.7918) = -0.3662-0.3466-0.2986 = -1.0114 \] \[ E_1 = -\frac{1}{1.3863}\times(-1.0114) = 0.7295 \]
类似计算得:
- \(E_2=0.7272\)
- \(E_3=0.7272\)
4. 差异系数
- \(g_1=1-0.7295=0.2705\)
- \(g_2=1-0.7272=0.2728\)
- \(g_3=1-0.7272=0.2728\)
5. 权重
总和 \(=0.2705+0.2728+0.2728=0.8161\)
- \(w_1=0.2705/0.8161=0.3315\)
- \(w_2=0.2728/0.8161=0.3343\)
- \(w_3=0.2728/0.8161=0.3342\)
6. 综合得分(可选)
- 供应商A:\(0.3315\times0.6667+0.3343\times0.3333+0.3342\times1=0.221+0.111+0.334=0.666\)
- 供应商B:\(0.3315\times1+0.3343\times1+0.3342\times0.5=0.332+0.334+0.167=0.833\)
- 供应商C:\(0.3315\times0+0.3343\times0+0.3342\times0=0\)
- 供应商D:\(0.3315\times0.3333+0.3343\times0.6667+0.3342\times0.7=0.111+0.223+0.234=0.568\)
结论:供应商B得分最高,供应商C最差。三个指标的权重接近,表明三个指标的变异程度相当。
常见问题
Q1: 熵权法的权重与指标的实际重要性有关吗?
A: 熵权法完全基于数据的变异程度,反映的是数据本身的信息量,而非指标的实际(主观)重要性。因此,若某指标数据变化很小,其权重会很低,即使该指标在理论上很重要。在实际应用中,常将熵权法与主观赋权法(如AHP)结合使用。
Q2: 如何处理标准化后出现的零值?
A: 极差标准化后可能出现零值,计算熵值时需处理 \(\ln(0)\)。通常有两种做法:1)整体平移一个很小的正数(如 \(10^{-10}\));2)规定 \(p\ln p = 0\) 当 \(p=0\)。两种方法对结果影响极小。
Q3: 如何选择标准化方法?
A: 极差法最常用,能将数据线性变换到 [0,1] 区间,且保留了原始数据的分布特征。Z-score 适用于数据呈正态分布的情况,但可能出现负值,需进一步变换。比重法和向量归一化适用于已正向化的数据。平台提供四种方法供用户选择。
Q4: 指标的正向化处理是否必要?
A: 熵权法要求所有指标对综合评价的贡献方向一致,因此必须先将逆指标(极小型)和适度指标转化为极大型。平台支持自动根据设置的指标类型进行正向化。
Q5: 支持多工作表批量分析吗?
A: 支持。平台允许上传包含多个工作表的Excel文件,每个工作表可对应不同的数据集(例如不同年份或不同专家组),系统会分别计算各表的权重和得分,便于对比。
平台功能
熵权法分析平台提供以下核心功能:
数据输入
- 支持CSV、Excel、TXT多种格式。
- Excel文件支持多工作表,自动识别工作表名称。
- 数据格式要求:第一列为样本名称,第一行为指标名称,数据区域为数值型。
参数设置
- 指标类型:为每个指标指定类型(极大型、极小型、中间型、区间型),并设置相应的参数(最优值、区间上下限)。
- 标准化方法:极差法、Z-score、比重法、向量归一化。
- 熵值小常数:用于处理零值的微小正数(默认 \(10^{-10}\))。
- 小数位数:控制输出精度(默认6位)。
- 显示中间结果:可选是否展示标准化矩阵、比重矩阵等中间步骤。
结果展示
- 详细分析报告:包含权重表、得分表、标准化矩阵、比重矩阵、熵值和差异系数。
- 可视化图表:权重分布柱状图、样本得分排名图。
- AI智能分析:基于DeepSeek API自动解读结果,提供决策建议(每日限3次)。
- 多格式导出:支持Excel和HTML报告下载。
工作表管理
- 多工作表自动识别,支持批量分析。
- 实时显示每个工作表的验证状态。
- 支持对比不同工作表的权重分布。
使用建议
准备阶段:明确评价对象和指标体系,确定各指标的类型(极大型、极小型、中间型、区间型)。
数据收集:
- 使用模板文件填写,每个工作表可代表不同的数据集。
- 确保数据完整,无缺失值。
参数设置:
- 正确设置每个指标的类型和参数(如区间型需提供最佳区间)。
- 选择合适的标准化方法(推荐极差法)。
- 根据需要选择是否显示中间结果。
结果解读:
- 首先检查熵值:熵值越接近1,权重越小;熵值越小,权重越大。
- 分析权重分布,识别关键指标。
- 结合得分排名,做出综合评价。
- 若需结合主观权重,可进行组合赋权。
迭代优化:
- 若结果与预期不符,可检查数据或指标类型设置。
- 尝试不同的标准化方法,对比权重稳定性。
平台界面

平台界面包含:数据上传区、参数设置区、多工作表预览、分析结果展示和AI分析模块
参考文献:
- 信息熵及其在综合评价中的应用[J]. 系统工程理论与实践,2002.
- 基于熵权法的多指标决策方法研究[J]. 控制与决策,2005.
- 熵权法在权重确定中的应用与改进[J]. 统计与决策,2010.