基于粗糙集的高技术企业信用评价指标体系构建


  摘要:尝试将遗传约简算法应用于高技术企业信用评价指标体系构建。首先,建立高技术企业信用评价初始指标体系,并采用等频率法实现连续属性离散化;然后,运用遗传约简算法求解最小约简,从而剔除冗余指标,获得约简后的高技术企业信用评价指标体系。实证分析结果证明了遗传约简算法在高技术企业信用评价指标体系构建中的可行性和适用性。
  关键词:高技术企业;信用评价;指标体系;粗糙集;属性约简;遗传约简算法
  中图分类号:F27文献标志码:A文章编号:1673-291X(2010)25-0029-04
  
  引言
  高技术企业是研究开发为社会提供高科技含量的产品与服务、以迅速的技术进步为标志的特殊类型的现代企业,与传统企业相比,高技术企业在技术成果转化时的一个显著特点是具有更高的不确定性,即高风险、高收益,这种不确定性在一定程度上加剧了信息非对称性的影响,从而导致高技术企业面临融资障碍 [1]。对高技术企业信用状态进行科学评价,有助于降低合约双方的交易成本、减少信息非对称性、弱化信用风险,有助于拓宽高技术企业融资渠道,有助于提升其自主创新能力。
  粗糙集(Rough Set,RS) [2~3]是一种刻画不完整性和不确定性的数学工具,能有效分析和处理不精确、不一致、不完整等各种不完备信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,从而有效进行知识库的约简和规则的提取,已成功应用于机器学习、决策分析、过程控制、模式识别与数据挖掘等领域。知识(属性)约简问题是粗糙集理论的一个核心问题,是指在保持知识库分类能力不变的条件下,删除其中不相关或不重要的冗余知识 [3]。一般地,一个知识库中的知识约简不是唯一的,计算知识约简的复杂性是随着决策表的增大呈指数增长的,是一个典型的NP完全问题 [4]。现有的约简算法,主要是从粗糙集的核出发,采用启发式搜索的方法构造所含条件属性最少的约简,即最小约简 [5]。在启发式属性约简算法中,遗传约简算法突破了以往决策表属性约简大多是串行搜索的局限,利用遗传算法适合复杂优化问题的并行处理的特点,大大提高了决策表属性约简结果的准确性和算法的效率 [6]。有鉴于此,本文尝试将遗传约简算法应用于高技术企业信用评价指标体系构建。首先,建立高技术企业信用评价初始指标体系,并采用等频率法实现连续属性离散化;然后,运用遗传约简算法求解最小约简,从而剔除冗余指标,获得约简后的高技术企业信用评价指标体系。实证分析结果证明了遗传约简算法在高技术企业信用评价指标体系构建中的可行性和适用性。
  一、粗糙集基本概念 [7]
  定义1:一个信息系统S可表示为:S=(U,A,V,f),其中,U={x1,x2,…,xn}是对象的非空有限集合,称为论域A={a1,a2,…,am};是属性的非空有限集合,称为属性集;V表示属性的值域集,V=∪Va,Va是属性a∈A的值域;f:U×A→V表示从U×A 到V的信息映射,它为每个对象的每个属性赋予一个信息值,即?坌a∈A,x∈U,f(x,a)∈Va。当A=C∪D,C∩D=φ时,称S为决策表,C和D分别称为条件属性集和决策属性集。
  定义2:设P是定义在论域U上的一个等价关系簇,关系R∈P,如果IND(P\{R})=IND(P),则称关系R在P中是绝对不必要的(多余的);否则,称关系R在P中是绝对必要的。如果每个关系R∈P在P中都是绝对必要的,则称关系簇P是独立的;否则,称P是相互依赖的。
  定义3:设P和Q是定义在论域U上的两个等价关系簇,且Q?奂P,如果Q是独立的,且IND(Q)=IND(P),则称Q是P的一个约简。一般情况下,一个信息系统的约简不止一种,这些约简均维持了与原有条件属性相同的分类能力。
  二、实证分析
  1.初始指标体系及原始数据
  本文参照国家财政部统计评价司的企业绩效评价指标体系和中国工商银行企业资信评估指标体系,结合高技术企业特点,遵循指标选取的系统性、科学性、客观性、可比性及可操作性等原则,从偿债能力、营运能力、盈利能力及其他等四个方面构建高技术企业信用评价初始指标体系(见表1)。
  选取10家高技术上市公司组成实验样本集A={Ai|i=1,2,…,10},行业涉及医药制造业、航空航天器制造业、电子及通信设备制造业、电子计算机及办公设备制造业、医疗设备及仪器仪表制造业等。样本区间选定为2007年,财务数据来源于国泰安数据库,自主创新能力和发展前景由专家用语言值来描述。利用云理论,把语言值用相应的三个数字特征(Ex,En,D)来表征,即用一个云对象来表示,这样,Ex值就可作为语言值型指标的定量表示值(具体算法参见文献 [8])。高技术企业信用评价初始指标原始数据(见表2)。
  2.指标约简
  (1) 偿债能力指标约简范例
  步骤1:连续属性离散化。
  由于粗糙集理论只能对数据库中的离散属性进行处理,而绝大多数现实的数据库兼具离散属性和连续属性,所以,在运用属性约简算法之前,须先将连续属性离散成有限个语义符号[9]。本文采用等频率法对偿债能力指标数据进行离散,得出(如下页表3所示)的信息决策表。
  步骤2:求解最小约简。
  本文借助粗糙集分析软件ROSETTA,运用遗传约简算法求解最小约简。选定父代初始种群规模为70,交叉概率为0.8,变异概率为0.05,最大进化代数为100,得出6个最小约简:{I13,I15,I17}、{I11,I12,I17}、{I13,I16,I17}、{I12,I13,I17}、{I11,I14,I17}、{I13,I14,I17}。根据专家意见,不妨选取I11、I14、I17作为偿债能力指标。
  (2)其余指标约简结果
  重复(1)节步骤1和步骤2,同理可得其余指标的约简结果。营运能力指标约简后为I21、I24、I25,盈利能力指标约简后为I32、I35、I36,其他指标约简后为I41、I42。综合以上结果,即可获得约简后的高技术企业信用评价指标体系(见表4)。
  3.高技术企业信用评价
  为消除各指标的量纲和统一各指标的变化范围和方向,首先对指标值进行极值归一化处理(具体算法参见文献[10]);然后,采用根据指标所提供的信息量确定指标权重的客观赋权法——熵权法[11]计算各指标的熵值和权重,结果(见表5)。
  由线性加权法计算得出10家高技术上市公司的信用评价值结果(见表6)。
  由表6可知,10家高技术上市公司信用状态的优劣排序为:A10>A5>A7>A3>A6>A1>A2>A8>A9>A4
  结束语
  运用粗糙集遗传约简算法求解最小约简,从23个初始指标中剔除了12个冗余指标,获得约简后的高技术企业信用评价指标体系,从而在保持知识库分类能力不变的条件下,减少了后续综合评价的计算量。在运用属性约简算法之前,须进行连续属性离散化,现有的离散化方法包括等距离法、等频率法、最小信息熵法、层次聚类法、遗传算法及SOM网络法等,上述方法都会或多或少地损失部分信息,如何构造、选择合适的离散化方法值得进一步研究。本文主要从财务因素角度构建了高技术企业信用评价指标体系,建立包含信用记录、管理者素质等因素的、更为全面的高技术企业信用评价指标体系有待于今后进一步研究。

推荐访问:高技术 粗糙 企业信用 构建 评价指标