熵权法是一种多指标评价方法,它通过计算指标之间的互信息熵,得到每个指标的权重,然后将权重应用到指标数据上,计算每个指标的得分,最后将所有指标得分加权求和得到综合得分。
具体地,熵权法的步骤包括:确定评价指标、收集指标数据、计算每个指标的熵值和权重、利用权重计算每个指标的得分、将每个指标的得分加权求和得到综合得分。
熵权法对于指标之间存在关联或重叠的情况,能够更加准确地反映事物的全貌,获得相对合理的评价结果。
熵增是热力学中的一个概念,简单来说,熵增过程是一个自发的从有序向无序发展的过程。
在一个孤立系统中,如果没有外界因素的干预,系统的熵(混乱程度)会不断增加。例如,一个热的物体和一个冷的物体接触后,热会自动地从热的物体传递到冷的物体,直到它们的温度相等,这个过程中熵增加了。又如,一个房间如果不打扫,会变得越来越杂乱,这也是熵增的体现。
总的来说,熵增原理表明,在没有外部能量输入的情况下,事物会自然地趋向于更加混乱和无序的状态。
设 X = {x1,x2,...,xn} 是一个决策样本集合,对于任意的样本 x,设 A = {a1,a2,...,am} 是 x 在属性空间上的属性集,对于任意一个属性 ai,设 Xj 表示属性 ai 上第 j 个取值,j=1,2,...,s,s 是属性 ai 的取值个数。dij 表示当属性 ai 取值为 Xj 时,样本集合 D 中属于类别 k 的样本数,dij 是 D 中样本分类在 k 类时属性 ai 取值为 Xj 的个数。假设 Ck 是决策样本中第 k 类,k = 1,2,...,r,r 是类别个数。设 pk = |Ck|/n,n 是决策样本总数。
则属性 ai 的熵值计算公式为:
H(ai) = -∑(j=1~s) [dij/|D| * log2(dij/|D|)]
其中,|D| 表示样本集合 D 的大小。
属性 ai 的信息增益为:
G(ai) = H(D) - H(ai)
其中,H(D) 表示样本集合 D 的熵值。
属性 ai 的熵权为:
W(ai) = G(ai) / ∑(i=1~m) G(ai)
最终权重向量为:
W = (W(a1),W(a2),...,W(am))