熵权TOPSIS障碍度

方法概述

熵权 TOPSIS 障碍度模型是将熵权法、TOPSIS 方法与障碍度模型相结合的一种综合评价与诊断工具。它首先利用熵权法根据各指标数据的变异程度客观计算指标权重,然后采用 TOPSIS 法对各评价对象进行排序,最后基于熵权权重计算各指标的障碍度,识别制约系统发展的关键障碍因素。该方法既能客观评价对象优劣,又能精准定位短板,广泛应用于可持续发展评估、生态环境诊断、区域发展分析等领域。

该模型的核心步骤为:

  • 熵权法:计算各指标权重,反映指标的重要性。
  • TOPSIS 法:计算各方案的相对贴近度,进行优劣排序。
  • 障碍度模型:基于熵权权重和指标偏离度,计算各指标及准则层的障碍度,识别主要障碍因素。

计算步骤

1. 构建原始数据矩阵

设有 \(n\) 个评价对象(方案),\(m\) 个评价指标。原始数据矩阵为:

\[ X = \begin{bmatrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n1} & x_{n2} & \cdots & x_{nm} \end{bmatrix} \]

数据文件格式要求: - 第一行为指标名称 - 第一列为方案名称 - 数据区域为数值型指标值

2. 指标类型设置与正向化

根据指标特性,将其分为四种类型,并采用相应公式进行正向化,将所有指标转化为极大型(越大越好)。

(1)极大型指标

\[ x'_{ij} = x_{ij} \]

(2)极小型指标

\[ x'_{ij} = \max(x_j) - x_{ij} \]

(3)中间型指标(越接近某个固定值越好)

设最优值为 \(a\),则: \[ M = \max|x_j - a|,\quad x'_{ij} = 1 - \frac{|x_{ij} - a|}{M} \]

(4)区间型指标(落在某个区间内最好)

设最佳区间为 \([a,b]\),则: \[ M = \max(a - \min(x_j), \max(x_j) - b) \] \[ x'_{ij} = \begin{cases} 1 - \dfrac{a - x_{ij}}{M}, & x_{ij} < a \\ 1, & a \le x_{ij} \le b \\ 1 - \dfrac{x_{ij} - b}{M}, & x_{ij} > b \end{cases} \]

得到正向化矩阵 \(X' = (x'_{ij})_{n \times m}\)

3. 熵权法计算指标权重

3.1 数据标准化

对正向化矩阵进行标准化,消除量纲影响。常用方法有:极差法(minmax)、Z‑score 法、比重法、向量归一化等。以极差法为例: \[ z_{ij} = \frac{x'_{ij} - \min(x'_j)}{\max(x'_j) - \min(x'_j)} \] 标准化后矩阵记为 \(Z = (z_{ij})_{n \times m}\),所有 \(z_{ij} \in [0,1]\)(实际计算中会通过非负平移避免零值)。

3.2 计算比重矩阵

\[ p_{ij} = \frac{z_{ij}}{\sum_{i=1}^{n} z_{ij}}, \quad j = 1,2,\ldots,m \]

3.3 计算第 \(j\) 项指标的熵值

\[ E_j = -\frac{1}{\ln n} \sum_{i=1}^{n} p_{ij} \ln(p_{ij}), \quad j = 1,2,\ldots,m \] 规定 \(p_{ij}=0\) 时,\(p_{ij}\ln p_{ij}=0\)

3.4 计算差异系数

\[ g_j = 1 - E_j \]

3.5 计算权重

\[ w_j = \frac{g_j}{\sum_{k=1}^{m} g_k}, \quad j = 1,2,\ldots,m \]

得到指标权重向量 \(W = (w_1, w_2, \ldots, w_m)\)

4. TOPSIS 法计算相对贴近度

4.1 构建加权标准化矩阵

根据选择的权重使用方式(平台提供三种),得到加权标准化矩阵 \(V\)

  • 方式一:标准化后直接加权,即 \(v_{ij} = w_j \cdot z_{ij}\)
  • 方式二:在距离计算中加权,此时 \(v_{ij} = z_{ij}\)
  • 方式三:两步均加权(等效于方式一)。

4.2 确定正理想解和负理想解

\[ V^+ = (V_1^+, V_2^+, \ldots, V_m^+), \quad V_j^+ = \max_i v_{ij} \] \[ V^- = (V_1^-, V_2^-, \ldots, V_m^-), \quad V_j^- = \min_i v_{ij} \]

4.3 计算欧氏距离

\[ D_i^+ = \sqrt{\sum_{j=1}^{m} (V_j^+ - v_{ij})^2}, \quad D_i^- = \sqrt{\sum_{j=1}^{m} (V_j^- - v_{ij})^2} \]

若选择方式二,距离计算中会包含权重。

4.4 计算相对贴近度

\[ C_i = \frac{D_i^-}{D_i^+ + D_i^-}, \quad 0 \le C_i \le 1 \]

\(C_i\) 越大,方案越优。按 \(C_i\) 降序排列得 TOPSIS 排序。

5. 障碍度模型分析

5.1 数据再标准化(用于障碍度计算)

障碍度模型要求所有指标值处于 \([0,1]\) 区间且方向一致(越大越好)。对原始数据 \(X\) 重新进行正向化和标准化(采用与熵权法相同的标准化方法),得到标准化矩阵 \(R = (r_{ij})_{n \times m}\)

5.2 计算指标偏离度 \(I_{ij}\)

\[ I_{ij} = 1 - r_{ij} \] 偏离度表示指标实际值与目标值(理想值 1)的差距,值越大说明该指标越需改进。

5.3 计算因子贡献度 \(F_j\)

因子贡献度直接采用熵权法得到的权重: \[ F_j = w_j \]

5.4 计算指标层障碍度 \(O_{ij}\)

指标层障碍度衡量单个指标对评价对象的阻碍程度,保证各对象指标层障碍度之和为 100%: \[ O_{ij} = \frac{I_{ij} \times w_j}{\sum_{j=1}^{m} (I_{ij} \times w_j)} \times 100\% \]

5.5 计算准则层障碍度 \(U_{ik}\)

若已划分准则层,每个准则层的障碍度由该准则层下所有指标的障碍度求和得到: \[ U_{ik} = \sum_{j \in \text{准则层 } k} O_{ij} \]

6. 障碍因素识别

根据各指标(或准则层)的障碍度大小进行排序,障碍度越大,表示该因素对系统发展的阻碍作用越强,是需要优先改进的关键因素。

案例分析

案例背景:某地区欲评价三个年份(2018‑2020)的发展水平,并识别主要障碍因素。选取 6 个指标,划分为三个准则层: - 经济子系统:指标1(GDP增长率)、指标2(人均收入) - 社会子系统:指标3(教育投入)、指标4(医疗水平) - 环境子系统:指标5(绿化覆盖率)、指标6(空气质量)

原始数据如下:

年份 指标1 指标2 指标3 指标4 指标5 指标6
2018 85 70 60 75 50 65
2019 88 72 65 78 55 68
2020 92 75 70 80 60 72

所有指标均为极大型,采用极差法标准化,权重使用方式一(标准化后加权)。

计算过程(简略)

  1. 熵权法计算权重:经计算得各指标权重 \(w = (0.15, 0.10, 0.20, 0.15, 0.25, 0.15)\)
  2. TOPSIS 计算相对贴近度
    • 2018 年 \(C = 0.35\),2019 年 \(C = 0.58\),2020 年 \(C = 0.82\),排序:2020 > 2019 > 2018。
  3. 障碍度计算
    • 以 2018 年为例,各指标标准化后均为 0,偏离度均为 1,障碍度即为权重乘以 100%:指标1 15%,指标2 10%,指标3 20%,指标4 15%,指标5 25%,指标6 15%。
    • 准则层障碍度:经济子系统 25%,社会子系统 35%,环境子系统 40%。
  4. 主要障碍因素:环境子系统(40%)为最大障碍,其中指标5(权重最大)是关键。

结论:2020 年发展水平最优,2018 年最差;环境子系统是主要障碍,需优先改善。

常见问题

Q1: 该模型与单独的熵权法或 TOPSIS 有何区别?

A: 熵权法仅提供权重,TOPSIS 仅提供排序,而本模型将二者结合,既能评价优劣,又能识别障碍,形成完整的诊断分析。

Q2: 为什么需要先进行正向化?

A: 熵权法和 TOPSIS 均要求指标方向一致(极大型),正向化将不同类型指标统一为极大型,确保后续计算有意义。

Q3: 权重使用方法如何选择?

A: 平台提供三种方式,方式一最常用(标准化后加权),方式二适用于特殊研究需求,方式三等效于方式一。建议选择方式一。

Q4: 准则层如何划分?

A: 用户可根据研究需要,在平台上为每个指标指定所属的准则层。准则层可以是经济、社会、环境等维度,便于从更高层面分析障碍因素。

Q5: 支持多工作表吗?

A: 支持。平台允许上传包含多个工作表的 Excel 文件,每个工作表对应不同的数据集,系统会分别计算并输出结果。

平台功能

熵权 TOPSIS 障碍度模型分析平台提供以下核心功能:

数据输入

  • 支持 CSV、Excel、TXT 多种格式。
  • Excel 文件支持多工作表,自动识别工作表名称。
  • 数据格式要求:第一行为指标名称,第一列为方案名称,数据区域为数值型指标值。

参数设置

  • 指标类型:为每个指标指定类型(极大型、极小型、中间型、区间型),并设置相应的参数(最优值、区间上下限)。
  • 准则层设置:设置准则层数量、名称,并为每个指标指定所属准则层。
  • 标准化方法:极差法、Z‑score、比重法、向量归一化。
  • 权重使用方法:标准化后加权、距离计算中加权、两步均加权。
  • 熵值小常数:用于处理零值的微小正数(默认 \(10^{-10}\))。
  • 小数位数:控制输出精度(默认6位)。
  • 显示中间结果:可选是否展示标准化矩阵、比重矩阵、加权矩阵、偏离度矩阵等中间步骤。

结果展示

  • TOPSIS 最终结果:各方案的正负理想解距离、相对贴近度及排序。
  • 熵权法结果:各指标权重、熵值、差异系数。
  • 障碍度最终结果:每个方案的总障碍度、主要障碍因素及障碍度。
  • 权重信息:准则层权重、指标层权重、因子贡献度。
  • 计算过程:原始数据、正向化矩阵、标准化矩阵、比重矩阵、加权矩阵、正负理想解、偏离度矩阵。
  • 障碍度分析:指标层障碍度矩阵、准则层障碍度矩阵。
  • 可视化图表:方案相对贴近度排名图、指标权重分布图、主要障碍因素分析图。
  • AI 智能分析:基于 DeepSeek API 自动解读结果,提供决策建议(每日限3次)。
  • 多格式导出:支持 Excel 和 HTML 报告下载。

工作表管理

  • 多工作表自动识别,支持批量分析。
  • 实时显示每个工作表的验证状态。
  • 支持对比不同工作表的评价结果和障碍因素。

使用建议

  1. 准备阶段:明确评价指标体系,确定各指标类型。根据研究需要划分准则层。

  2. 数据收集:使用模板文件填写,第一行为指标名称,第一列为方案名称。确保数据完整、无缺失。

  3. 参数设置

    • 正确设置每个指标的类型和参数。
    • 设置准则层数量、名称,并为每个指标指定所属准则层。
    • 选择合适的标准化方法(推荐极差法)。
    • 选择权重使用方法(推荐方式一)。
    • 根据需要调整小数位数。
  4. 结果解读

    • 首先查看 TOPSIS 排序,确定最优方案。
    • 分析熵权法权重,了解各指标的重要性。
    • 识别主要障碍因素,找出制约发展的关键指标。
    • 结合准则层障碍度,从更高维度把握问题。
    • 利用 AI 分析获取针对性改进建议。

平台界面

官方地址:https://superr.online

熵权 TOPSIS 障碍度模型工具界面预览

平台界面包含:数据上传区、参数设置区、多工作表预览、分析结果展示和 AI 分析模块


参考文献

  1. 信息熵及其在综合评价中的应用[J]. 系统工程理论与实践,2002.
  2. Hwang, C.L., Yoon, K. (1981). Multiple Attribute Decision Making: Methods and Applications. Springer‑Verlag.
  3. 彭补拙,等. 区域可持续发展评价指标体系及障碍度诊断研究[J]. 地理科学,2004.
  4. 基于熵权 TOPSIS 与障碍度模型的生态环境评价方法研究[J]. 生态学报,2018.