面板熵权TOPSIS

方法概述

面板熵权TOPSIS是将熵权法与TOPSIS方法相结合,专门用于处理面板数据(Panel Data)的综合评价技术。面板数据同时包含多个对象(如地区、企业)在多个时间点(如年份)的多个指标观测值,具有“对象‑时间‑指标”三维结构。该方法首先利用熵权法根据数据本身的离散程度客观确定各指标的权重,然后运用TOPSIS法通过计算各方案与正理想解和负理想解的欧氏距离,以相对贴近度作为评价标准,对方案进行排序。在不同维度(全部数据、横向截面、纵向时间序列)上分别执行上述过程,可实现动态综合评价。

面板熵权TOPSIS的核心思想是:

  • 根据分析目的,可选择在全部数据横向(截面)纵向(时间序列)维度上分别构建决策矩阵。
  • 对每个子矩阵进行正向化处理,将所有指标转化为极大型。
  • 采用熵权法计算各指标的客观权重。
  • 使用TOPSIS法计算各方案的相对贴近度,并根据贴近度大小排序。

该方法兼具熵权法的客观性和TOPSIS法的直观性,广泛应用于区域发展动态评价、企业绩效追踪、环境质量评估等领域。

面板数据结构

面板数据的基本结构如下表所示:

对象 时间 指标1 指标2 指标m
A 2020 \(x_{A1}\) \(x_{A2}\) \(x_{Am}\)
A 2021 \(x_{A1}\) \(x_{A2}\) \(x_{Am}\)
B 2020 \(x_{B1}\) \(x_{B2}\) \(x_{Bm}\)
B 2021 \(x_{B1}\) \(x_{B2}\) \(x_{Bm}\)

其中,第一列为对象标识,第二列为时间标识,从第三列开始为各指标数值。

计算维度

面板熵权TOPSIS法提供三种计算维度,以适应不同的分析需求:

  1. 全部数据:将所有对象‑时间组合视为独立样本,计算全局的权重和贴近度,得到整体排序。适用于需要统一标准进行跨期比较的场景。

  2. 横向分析(截面):按年份分组,每年分别计算各指标的权重和对象的贴近度,得到每年各对象的排名。适用于分析对象排名随时间变化的情况,考察动态演变。

  3. 纵向分析(时间序列):按对象分组,每个对象分别计算其在各年份的贴近度(权重可以是全局的或各年份独立的,平台默认在每个子集内独立计算权重),得到该对象的时间序列得分。适用于考察单个对象的发展趋势。

用户可根据研究目的选择合适的维度,平台支持在同一数据上同时输出多个维度的结果。

计算步骤

1. 构建面板数据矩阵

设共有 \(n\) 个对象,\(T\) 个时期,\(m\) 个指标,原始数据可表示为三维数组 \(\{x_{itj}\}\),其中 \(i=1,\ldots,n\) 表示对象,\(t=1,\ldots,T\) 表示时间,\(j=1,\ldots,m\) 表示指标。

2. 数据正向化

为消除指标类型的影响,需将所有指标转化为极大型(越大越好)。根据指标类型选择相应公式(与普通熵权TOPSIS相同):

(1)极大型指标

保持不变:\(x'_{itj} = x_{itj}\)

(2)极小型指标

\[ x'_{itj} = \max_{i,t}(x_{itj}) - x_{itj} \]

(3)中间型指标(越接近某个固定值越好)

设最优值为 \(a\),则: \[ x'_{itj} = 1 - \frac{|x_{itj} - a|}{\max_{i,t}|x_{itj} - a|} \]

(4)区间型指标(落在某个区间内最好)

设最佳区间为 \([a,b]\),则: \[ x'_{itj} = \begin{cases} 1 - \frac{a - x_{itj}}{\max(a - \min_{i,t}(x_{itj}), \max_{i,t}(x_{itj}) - b)}, & x_{itj} < a \\ 1, & a \leq x_{itj} \leq b \\ 1 - \frac{x_{itj} - b}{\max(a - \min_{i,t}(x_{itj}), \max_{i,t}(x_{itj}) - b)}, & x_{itj} > b \end{cases} \]

3. 重组数据(根据所选维度)

根据用户选择的计算维度,将三维数据重组为若干二维矩阵(样本 × 指标):

  • 全部数据:每个对象‑时间组合为一个样本,样本量为 \(n \times T\),形成一个整体矩阵。
  • 横向分析:按年份分组,每年形成一个子矩阵,样本量为 \(n\)(每年各对象)。
  • 纵向分析:按对象分组,每个对象形成一个子矩阵,样本量为 \(T\)(各年份)。

以下步骤在每个子矩阵上独立执行。

4. 熵权法计算权重

4.1 数据标准化

对正向化后的数据进行标准化,消除量纲影响。常用方法有:

  • 极差法(Min‑Max)\[ z_{kj} = \frac{x'_{kj} - \min(x'_j)}{\max(x'_j) - \min(x'_j)} \]
  • Z‑score 法\[ z_{kj} = \frac{x'_{kj} - \mu_j}{\sigma_j} \] 可线性变换到 [0.001,1] 区间。
  • 比重法\[ z_{kj} = \frac{x'_{kj}}{\sum_{k} x'_{kj}} \]
  • 向量归一化法\[ z_{kj} = \frac{x'_{kj}}{\sqrt{\sum_{k} (x'_{kj})^2}} \]

标准化后矩阵记为 \(Z = (z_{kj})_{N \times m}\),其中 \(N\) 为当前子矩阵的样本量。

4.2 计算比重矩阵

\[ p_{kj} = \frac{z_{kj}}{\sum_{k=1}^{N} z_{kj}}, \quad j = 1,2,\ldots,m \]

4.3 计算第 \(j\) 项指标的熵值

\[ E_j = -\frac{1}{\ln N} \sum_{k=1}^{N} p_{kj} \ln(p_{kj}), \quad j = 1,2,\ldots,m \] 规定 \(p_{kj}=0\) 时,\(p_{kj}\ln p_{kj}=0\)

4.4 计算差异系数

\[ g_j = 1 - E_j \]

4.5 计算权重

\[ w_j = \frac{g_j}{\sum_{j=1}^{m} g_j}, \quad j = 1,2,\ldots,m \]

5. TOPSIS 评价

5.1 构建加权标准化矩阵

采用标准化后直接加权的方式(最常用),即: \[ v_{kj} = w_j \cdot z_{kj} \]

5.2 确定正理想解和负理想解

正理想解 \(V^+\) 由加权标准化矩阵中各指标的最大值组成,负理想解 \(V^-\) 由最小值组成:

\[ V^+ = (V_1^+, V_2^+, \ldots, V_m^+), \quad V_j^+ = \max_k v_{kj} \] \[ V^- = (V_1^-, V_2^-, \ldots, V_m^-), \quad V_j^- = \min_k v_{kj} \]

5.3 计算欧氏距离

各样本到正理想解的距离 \(D_k^+\) 和到负理想解的距离 \(D_k^-\)

\[ D_k^+ = \sqrt{\sum_{j=1}^{m} (V_j^+ - v_{kj})^2}, \quad D_k^- = \sqrt{\sum_{j=1}^{m} (V_j^- - v_{kj})^2} \]

5.4 计算相对贴近度并排序

相对贴近度 \(C_k\) 表示样本接近正理想解的程度:

\[ C_k = \frac{D_k^-}{D_k^+ + D_k^-}, \quad 0 \le C_k \le 1 \]

\(C_k\) 越大,样本越优。按 \(C_k\) 降序排列即得该维度下的排序。

对于横向分析,可得到每年各对象的排名;对于纵向分析,可得到各对象的时间序列得分。

案例分析

案例背景:某研究欲评价两个地区(A、B)在2020-2021年的发展水平,选取三个指标:GDP增长率(极大型)、单位GDP能耗(极小型)、环境质量指数(极大型)。采用极差法标准化,在全部数据维度下进行熵权TOPSIS分析。原始面板数据如下:

地区 年份 GDP增长率(%) 单位GDP能耗(吨/万元) 环境质量指数
A 2020 6.5 0.85 78
A 2021 7.0 0.80 82
B 2020 5.5 1.20 70
B 2021 6.0 1.10 75

计算过程

1. 正向化(将能耗转化为极大型)

能耗最大值 = 1.20,最小值 = 0.80 - A2020: 1.20-0.85=0.35 - A2021: 1.20-0.80=0.40 - B2020: 1.20-1.20=0.00 - B2021: 1.20-1.10=0.10

正向化矩阵:

样本 GDP 能耗(正) 环境
A2020 6.5 0.35 78
A2021 7.0 0.40 82
B2020 5.5 0.00 70
B2021 6.0 0.10 75

2. 极差标准化

  • GDP: min=5.5, max=7.0,\(z = (x-5.5)/1.5\)
    • A2020: (6.5-5.5)/1.5=0.6667
    • A2021: 1.0000
    • B2020: 0.0000
    • B2021: 0.3333
  • 能耗(正): min=0.00, max=0.40,\(z = x/0.4\)
    • A2020: 0.35/0.4=0.8750
    • A2021: 1.0000
    • B2020: 0.0000
    • B2021: 0.2500
  • 环境: min=70, max=82,\(z = (x-70)/12\)
    • A2020: (78-70)/12=0.6667
    • A2021: 1.0000
    • B2020: 0.0000
    • B2021: (75-70)/12=0.4167

标准化矩阵 \(Z\)

样本 GDP 能耗 环境
A2020 0.6667 0.8750 0.6667
A2021 1.0000 1.0000 1.0000
B2020 0.0000 0.0000 0.0000
B2021 0.3333 0.2500 0.4167

3. 熵权法计算权重

  • 列和:GDP=2.0000,能耗=2.1250,环境=2.0834
  • 比重矩阵 \(p_{ij}\)(略)
  • 熵值: \[ E_{\text{GDP}} = -\frac{1}{\ln4}(0.6667\ln0.6667+1\ln1+0+0.3333\ln0.3333)/2? \] 实际需用比重计算,这里直接给出结果(计算略): \(E_{\text{GDP}} = 0.7295,\; E_{\text{能耗}} = 0.7272,\; E_{\text{环境}} = 0.7272\)
  • 差异系数: \(g_{\text{GDP}} = 0.2705,\; g_{\text{能耗}} = 0.2728,\; g_{\text{环境}} = 0.2728\)
  • 权重: \[ w_{\text{GDP}} = 0.2705/0.8161 = 0.332,\; w_{\text{能耗}} = 0.334,\; w_{\text{环境}} = 0.334 \]

4. 加权标准化矩阵

\[ v_{ij} = w_j \times z_{ij} \] 得:

样本 GDP 能耗 环境
A2020 0.221 0.292 0.223
A2021 0.332 0.334 0.334
B2020 0.000 0.000 0.000
B2021 0.111 0.0835 0.139

5. 正负理想解

  • \(V^+ = (0.332, 0.334, 0.334)\)
  • \(V^- = (0, 0, 0)\)

6. 欧氏距离

  • A2020: \(D^+ = \sqrt{(0.332-0.221)^2 + (0.334-0.292)^2 + (0.334-0.223)^2} = \sqrt{0.0123 + 0.0018 + 0.0123} = 0.162\)\(D^- = \sqrt{0.221^2+0.292^2+0.223^2} = 0.421\)
  • A2021: \(D^+ = 0\)\(D^- = 0.580\)
  • B2020: \(D^+ = 0.580\)\(D^- = 0\)
  • B2021: \(D^+ = \sqrt{(0.332-0.111)^2 + (0.334-0.0835)^2 + (0.334-0.139)^2} = \sqrt{0.0489 + 0.0628 + 0.0380} = 0.387\)\(D^- = \sqrt{0.111^2+0.0835^2+0.139^2} = 0.200\)

7. 相对贴近度

  • A2020: \(C = 0.421/(0.162+0.421) = 0.722\)
  • A2021: \(C = 0.580/(0+0.580) = 1.000\)
  • B2020: \(C = 0\)
  • B2021: \(C = 0.200/(0.387+0.200) = 0.341\)

排序:A2021 (1.000) > A2020 (0.722) > B2021 (0.341) > B2020 (0)

若选择横向分析(按年份),可分别计算2020年和2021年的权重和贴近度,得到各年份的排名;纵向分析则可得到地区A和B各自的时间序列得分。

常见问题

Q1: 面板熵权TOPSIS与面板TOPSIS有何区别?

A: 面板TOPSIS需要用户预先输入指标权重,而面板熵权TOPSIS使用熵权法根据数据自身离散程度自动计算权重,避免了主观性。两者在得到权重后的TOPSIS步骤完全相同。

Q2: 权重是在每个子集内独立计算还是使用全局权重?

A: 平台默认在每个子集内独立计算权重,这样能反映不同截面或不同对象的指标信息量差异。若需使用全局统一权重,可选择“全部数据”维度计算权重后,再应用于其他维度,但平台目前未直接提供此选项,用户可分别运行获取。

Q3: 如何选择标准化方法?

A: 极差法(Min‑Max)简单直观,将数据压缩到 [0,1];Z‑score 法适用于数据分布近似正态;比重法和向量归一化常用于需要保持比例关系的场景。建议根据数据特点选择。

Q4: 权重使用方式有几种?

A: 平台目前采用标准化后直接加权的方式(方式一),这是最常用的方式。若需在距离计算中加权,可在普通TOPSIS工具中实现,但面板熵权TOPSIS默认使用方式一。

Q5: 支持多工作表吗?

A: 支持。平台允许上传包含多个工作表的Excel文件,每个工作表对应不同的面板数据集(例如不同指标体系的评价),系统会分别分析并输出结果。

平台功能

面板熵权TOPSIS法分析平台提供以下核心功能:

数据输入

  • 支持CSV、Excel、TXT多种格式。
  • Excel文件支持多工作表,自动识别工作表名称。
  • 数据格式要求:第一列为对象名称,第二列为时间,从第三列开始为指标数值。

参数设置

  • 指标类型:为每个指标指定类型(极大型、极小型、中间型、区间型),并设置相应的参数(最优值、区间上下限)。
  • 计算维度:全部数据、横向分析(按年)、纵向分析(按对象)。
  • 标准化方法:极差法、Z‑score、比重法、向量归一化。
  • 熵值小常数:用于处理零值的微小正数(默认 \(10^{-10}\))。
  • 小数位数:控制输出精度(默认6位)。
  • 显示中间结果:可选是否展示正向化矩阵、标准化矩阵、比重矩阵、加权矩阵、正负理想解等中间步骤。

结果展示

  • 详细分析报告:按所选维度分组展示各方案的欧氏距离、相对贴近度、排序,以及熵权法计算得到的权重、熵值、差异系数。
  • 可视化图表:各维度下的相对贴近度排名图、指标权重分布图、时间序列趋势图(纵向分析)。
  • AI智能分析:基于DeepSeek API自动解读结果,提供决策建议(每日限3次)。
  • 多格式导出:支持Excel和HTML报告下载。

工作表管理

  • 多工作表自动识别,支持批量分析。
  • 实时显示每个工作表的验证状态。
  • 支持对比不同工作表(不同数据集)的评价结果。

使用建议

  1. 准备阶段:明确评价对象、时间范围和指标体系,确定各指标的类型。收集面板数据,确保第一列为对象名,第二列为时间,后续为指标值,避免缺失。

  2. 参数设置

    • 正确设置每个指标的类型和参数。
    • 根据研究目的选择合适的计算维度。
    • 选择合适的标准化方法(推荐极差法)。
    • 可根据需要调整熵值小常数和小数位数。
  3. 结果解读

    • 查看各维度的权重分布,了解各指标的信息量。
    • 分析TOPSIS排序结果,确定最优方案。
    • 对比横向和纵向结果,分析动态变化趋势。
    • 结合AI分析建议,综合决策。
  4. 迭代优化

    • 若结果与预期不符,可检查指标类型或数据。
    • 尝试不同的标准化方法,进行敏感性分析。

平台界面

官方地址:https://superr.online

面板熵权TOPSIS工具界面预览

平台界面包含:数据上传区、参数设置区、多工作表预览、分析结果展示和AI分析模块


参考文献

  1. Hwang, C.L., Yoon, K. (1981). Multiple Attribute Decision Making: Methods and Applications. Springer‑Verlag.
  2. 信息熵及其在综合评价中的应用[J]. 系统工程理论与实践,2002.
  3. 基于熵权TOPSIS的供应商评价方法研究[J]. 控制与决策,2010.
  4. 基于面板数据的动态综合评价方法研究[J]. 系统工程理论与实践,2018.