反熵权法

方法概述

反熵权法是一种基于反信息熵(又称负熵)的客观赋权方法。与传统熵权法不同,反熵权法通过计算指标的反信息熵来度量其信息含量,赋予那些概率分布较为罕见(即“意外”或“稀有”)的信息更大的权重。其核心思想是:信息量不仅可以用概率本身的对数度量,也可以用其互补概率的对数来度量,从而提供一种与经典熵权法互补的权重视角。

反熵权法的核心思想是:

  • 对原始数据进行标准化处理,消除量纲影响。
  • 计算各指标下各样本值的比重,构建比重矩阵。
  • 通过反信息熵公式 \(-\sum p_{ij} \ln(1-p_{ij})\) 计算各指标的反熵值。
  • 将反熵值归一化,即得指标权重。

该方法适用于那些需要关注小概率事件或异常值重要性的评价问题,常与传统熵权法结合使用,形成更全面的权重分析。

计算步骤

1. 构建原始数据矩阵

设有 \(n\) 个评价对象,\(m\) 个评价指标,原始数据矩阵为:

\[ X = \begin{bmatrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n1} & x_{n2} & \cdots & x_{nm} \end{bmatrix} \]

2. 数据标准化

根据指标的不同类型(极大型、极小型、中间型、区间型),采用相应的方法进行标准化,得到标准化矩阵 \(Z = (z_{ij})_{n \times m}\)。常用极差标准化(Min-Max):

(1)极大型指标(越大越好)

\[ z_{ij} = \frac{x_{ij} - \min(x_j)}{\max(x_j) - \min(x_j)} \]

(2)极小型指标(越小越好)

\[ z_{ij} = \frac{\max(x_j) - x_{ij}}{\max(x_j) - \min(x_j)} \]

(3)中间型指标(越接近某个固定值越好)

设最优值为 \(a\),则:

\[ z_{ij} = \begin{cases} 1 - \frac{|x_{ij} - a|}{\max(|x_j - a|)}, & \text{若分母非零} \\ 1, & \text{若所有值均等于最优值} \end{cases} \]

(4)区间型指标(落在某个区间内最好)

设最佳区间为 \([a,b]\),则:

\[ z_{ij} = \begin{cases} 1 - \frac{a - x_{ij}}{\max(a - \min(x_j), \max(x_j) - b)}, & x_{ij} < a \\ 1, & a \leq x_{ij} \leq b \\ 1 - \frac{x_{ij} - b}{\max(a - \min(x_j), \max(x_j) - b)}, & x_{ij} > b \end{cases} \]

其他标准化方法(适用于已正向化数据):

  • Z-score标准化\(z_{ij} = \frac{x_{ij} - \mu_j}{\sigma_j}\),然后线性变换到非负区间。
  • 比重法\(z_{ij} = \frac{x_{ij}}{\sum_{i=1}^n x_{ij}}\)
  • 向量归一化\(z_{ij} = \frac{x_{ij}}{\sqrt{\sum_{i=1}^n x_{ij}^2}}\)

3. 非负平移(可选)

若标准化后出现零值,为满足反熵值计算中 \(\ln\) 的要求,可整体平移一个很小的正数(如 \(10^{-10}\))或约定 \(p\ln(1-p)=0\)\(p=0\)

4. 计算比重矩阵

计算第 \(j\) 项指标下第 \(i\) 个对象的值占该指标总值的比重:

\[ p_{ij} = \frac{z_{ij}}{\sum_{i=1}^{n} z_{ij}}, \quad j = 1,2,\ldots,m \]

此时每列之和为1。

5. 计算第 \(j\) 项指标的反信息熵

\[ E_j' = -\sum_{i=1}^{n} p_{ij} \ln(1 - p_{ij}), \quad j = 1,2,\ldots,m \]

其中规定当 \(p_{ij}=0\)\(p_{ij}=1\) 时,取极限值 \(p\ln(1-p)=0\)(因为 \(\lim_{p\to 0} p\ln(1-p)=0\),且 \(\lim_{p\to 1} p\ln(1-p)=0\))。

6. 计算权重

将反熵值归一化即得各指标权重:

\[ w_j = \frac{E_j'}{\sum_{j=1}^{m} E_j'} \]

7. 计算综合得分(可选)

若需对各对象综合评价,可计算加权得分:

\[ F_i = \sum_{j=1}^{m} w_j z_{ij} \]

案例分析

案例背景:某企业需对四个供应商(A、B、C、D)进行评价,选取三个指标:产品质量(极大型)、价格(极小型)、交货准时率(极大型)。原始数据如下:

供应商 产品质量 价格 交货准时率
A 85 200 0.95
B 90 180 0.90
C 75 210 0.85
D 80 190 0.92

计算过程

1. 数据标准化(极差法)

  • 产品质量(极大型):\(\max=90,\min=75\)
    • A: \((85-75)/(90-75)=10/15=0.6667\)
    • B: \((90-75)/15=1.0000\)
    • C: \((75-75)/15=0.0000\)
    • D: \((80-75)/15=0.3333\)
  • 价格(极小型):\(\max=210,\min=180\)
    • A: \((210-200)/(210-180)=10/30=0.3333\)
    • B: \((210-180)/30=1.0000\)
    • C: \((210-210)/30=0.0000\)
    • D: \((210-190)/30=0.6667\)
  • 交货准时率(极大型):\(\max=0.95,\min=0.85\)
    • A: \((0.95-0.85)/0.10=1.0000\)
    • B: \((0.90-0.85)/0.10=0.5000\)
    • C: \((0.85-0.85)/0.10=0.0000\)
    • D: \((0.92-0.85)/0.10=0.7000\)

标准化矩阵 \(Z\)

\[ Z = \begin{bmatrix} 0.6667 & 0.3333 & 1.0000 \\ 1.0000 & 1.0000 & 0.5000 \\ 0.0000 & 0.0000 & 0.0000 \\ 0.3333 & 0.6667 & 0.7000 \end{bmatrix} \]

2. 计算比重

以第一列(产品质量)为例,和 \(=0.6667+1.0000+0+0.3333=2.0000\): - \(p_{11}=0.6667/2=0.3333\) - \(p_{21}=1/2=0.5000\) - \(p_{31}=0/2=0\) - \(p_{41}=0.3333/2=0.1667\)

同理可得比重矩阵(略)。

3. 计算反信息熵

先计算第一列(产品质量):

  • \(\sum p \ln(1-p) = 0.3333 \ln(1-0.3333) + 0.5 \ln(1-0.5) + 0 + 0.1667 \ln(1-0.1667)\)
  • \(1-0.3333=0.6667\)\(\ln0.6667=-0.4055\),贡献:\(0.3333\times(-0.4055)=-0.1352\)
  • \(1-0.5=0.5\)\(\ln0.5=-0.6931\),贡献:\(0.5\times(-0.6931)=-0.3466\)
  • \(1-0.1667=0.8333\)\(\ln0.8333=-0.1823\),贡献:\(0.1667\times(-0.1823)=-0.0304\)
  • 总和 = \((-0.1352)+(-0.3466)+0+(-0.0304) = -0.5122\)
  • 反信息熵 \(E_1' = -(-0.5122) = 0.5122\)

类似计算其他列:

  • 价格列:比重向量 (0.1667,0.5,0,0.3333),计算得 \(E_2' \approx 0.5218\)
  • 交货准时率列:比重向量 (0.4545,0.2273,0,0.3182),计算得 \(E_3' \approx 0.5136\)

4. 权重

总和 = \(0.5122+0.5218+0.5136 = 1.5476\)

  • \(w_1=0.5122/1.5476=0.3310\)
  • \(w_2=0.5218/1.5476=0.3372\)
  • \(w_3=0.5136/1.5476=0.3318\)

5. 综合得分

  • A: \(0.3310\times0.6667+0.3372\times0.3333+0.3318\times1.0000 = 0.221+0.112+0.332=0.665\)
  • B: \(0.3310\times1.0000+0.3372\times1.0000+0.3318\times0.5000 = 0.331+0.337+0.166=0.834\)
  • C: \(0\)
  • D: \(0.3310\times0.3333+0.3372\times0.6667+0.3318\times0.7000 = 0.110+0.225+0.232=0.567\)

结论:供应商B得分最高,供应商C最差。三个指标的权重与传统熵权法结果相近但略有差异,反映了反熵权法对概率分布的敏感性。

常见问题

Q1: 反熵权法与传统熵权法有何区别?

A: 传统熵权法使用信息熵 \(E_j = -\frac{1}{\ln n}\sum p_{ij}\ln p_{ij}\),强调概率分布的均匀性,概率分布越均匀熵值越大,权重越小;反熵权法使用反信息熵 \(E_j' = -\sum p_{ij}\ln(1-p_{ij})\),强调概率分布的“意外性”,即当某个值出现的概率极低时,其反熵贡献会增大,从而赋予该指标更高权重。二者形成互补,结合使用可更全面地反映数据信息。

Q2: 反熵权法的权重是否一定与熵权法相反?

A: 不一定,但通常两者会呈现一定的负相关关系。在具体数据中,若某指标数据分布极不均匀,传统熵权法可能赋予较低权重,而反熵权法则赋予较高权重,反之亦然。因此,两者联合可用于识别数据中的稀有信息。

Q3: 如何处理 \(p=0\)\(p=1\) 的情况?

A: 反熵公式中当 \(p=0\) 时,\(\ln(1-p)=\ln1=0\),乘积为0;当 \(p=1\) 时,\(\ln(1-p)=\ln0\) 无定义,但极限 \(\lim_{p\to1} p\ln(1-p)=0\),因此可约定 \(p=1\) 时贡献为0。代码中通过设置极小常数(如 \(10^{-10}\))避免边界问题。

Q4: 反熵权法是否需要像熵权法那样乘以 \(1/\ln n\)

A: 不需要。反熵权法的公式中没有像熵权法那样的标准化因子 \(1/\ln n\),因为反熵本身的大小与指标数量无关,直接用于权重计算即可。但若希望与传统熵权法比较,也可进行类似处理,但平台默认不添加此因子。

Q5: 支持多工作表吗?

A: 支持。平台允许上传包含多个工作表的Excel文件,每个工作表对应不同的数据集(例如不同年份或不同专家组),系统会分别计算各表的权重和得分,便于对比。

平台功能

反熵权法分析平台提供以下核心功能:

数据输入

  • 支持CSV、Excel、TXT多种格式。
  • Excel文件支持多工作表,自动识别工作表名称。
  • 数据格式要求:第一行为指标名称,第一列为样本名称,数据区域为数值型。

参数设置

  • 指标类型:为每个指标指定类型(极大型、极小型、中间型、区间型),并设置相应的参数(最优值、区间上下限)。
  • 标准化方法:极差法、Z-score、比重法、向量归一化。
  • 熵值小常数:用于处理边界值的微小正数(默认 \(10^{-10}\))。
  • 小数位数:控制输出精度(默认6位)。
  • 显示中间结果:可选是否展示标准化矩阵、比重矩阵等中间步骤。

结果展示

  • 详细分析报告:包含每个工作表的反信息熵、权重表、得分表、标准化矩阵、比重矩阵。
  • 可视化图表:权重分布柱状图、样本得分排名图。
  • AI智能分析:基于DeepSeek API自动解读结果,提供决策建议(每日限3次)。
  • 多格式导出:支持Excel和HTML报告下载。

工作表管理

  • 多工作表自动识别,支持批量分析。
  • 实时显示每个工作表的验证状态。
  • 支持对比不同工作表的权重分布。

使用建议

  1. 准备阶段:明确评价对象和指标体系,确定各指标的类型(极大型、极小型、中间型、区间型)。

  2. 数据收集

    • 使用模板文件填写,每个工作表可代表不同的数据集(如不同年份)。
    • 确保数据完整,无缺失值。
  3. 参数设置

    • 正确设置每个指标的类型和参数。
    • 选择合适的标准化方法(推荐极差法)。
    • 根据需要选择是否显示中间结果。
  4. 结果解读

    • 首先检查反信息熵值:熵值越大,权重越大。
    • 分析权重分布,识别关键指标。
    • 结合传统熵权法结果,对比分析数据的均匀性与稀有性。
    • 结合得分排名,做出综合评价。
  5. 迭代优化

    • 若结果与预期不符,可检查数据或指标类型设置。
    • 尝试不同的标准化方法,对比权重稳定性。
    • 对于重要决策,可结合传统熵权法进行敏感性分析。

平台界面

官方地址:https://superr.online

反熵权法工具界面

平台界面包含:数据上传区、参数设置区、多工作表预览、分析结果展示和AI分析模块


参考文献

  1. 反信息熵及其在多属性决策中的应用[J]. 系统工程理论与实践,2015.
  2. 基于反熵权法的综合评价方法研究[J]. 统计与决策,2018.
  3. 互补熵权法:理论、方法与应用[D]. 北京理工大学,2020.