基于和结合的属性约简在设备诊断维护中的应用
基于RS和GA结合的属性约简在设备诊断维护中的应用袁楚明,胡广华,陈幼平,周祖德(华中科技大学机械学院国家数控系统工程技术研究中心,湖北武汉)AttributeReductionCombiningRS withGA inDiagnosis andMaintenanceYUANChu—ming.HUGuang—hua.CItENYou—ping,ZHOUZu—de(School ofMechanicalScience andEngineering.HuazhongUniversity ofSicence andTechnology,Wuhan,China)摘要:为了得到决策表的较优约简,将粗糙集的定性分析功能与遗传算法的全局最优解搜索功能有机结合,并用于诊断知识模型的约简求解。该法具有较强的自学习性能,且在实例应用中取得了满意的效果。关键词:粗糙集;遗传算法;属性约简;诊断学中图分类号:TP277文献标识码:A文章编号:1001—2257(2007)10—0043一02Abstract:In order to get better reduction,the algorithm combining the qualitative analysis in rough set with the global optimal solution search in genetic algorithm has been applied to acquire con— cise rule knowledge by reducing the fault symp— toms effectively.And it is better in self—taught.The experimentation results show its rationality、 and reliability.Key words:rough set;genetic algorithm;at— tribute reduction;diagnosis0引言数据挖掘n3的初始数据集合中存在着许多与故障状态相关程度不高的信息,而且其中不少是冗余信息。在大型复杂系统的故障诊断中,可以应用粗糙集(RS)理论从诊断规则中提取关键征兆条件,将冗余故障征兆和故障原因删除,大大提高系统潜在知识的清晰度,从而降低诊断成本[2j。约简是去掉多余的属性,是应用粗集理论的基础,然而已经证明收稿日期;2007—04一02《机械与电子))2007(10)最小约简的计算是NP完全问题[3]。为此,研究了利用遗传算法(GA)改进的属性约简在数字化制造、设备维护知识挖掘中的应用,利用遗传算法能克服局部最优,对领域知识作智能式搜索的特性.求出知识系统的最佳约简。1结合RS与GA的属性约简1.1基于粗糙集的属性约简方法粗糙集理论是根据已有的知识对给定问题的论域进行划分,在保持分类能力不变的前提下,通过知识约简,从而导出问题的决策或分类规则。根据粗糙集理论,称四元组S一(U,A,V,厂)是一个知识表达系统,其中,U是一个非空有限对象(元组)的集合,称为论域,U一(z。,z。,…,z。),z,为对象(元组);A是对象的属性集合,A不为空;V是属性值的集合,V—U(V。),a∈A,V。是属性a的值域;-厂是一个映射,厂:U×A—V,是信息函数,它为每个对象的每个属性赋予一个属性值,即V“∈A,z,∈U, f(x。,口)∈V。若A由条件属性集合C和决策属性集合D组成,且C,D满足CUD—A;CnD一0;则称s为决策系统(DS)。在DS中,【,中任一元素对应一条规则,其前件由C及其取值所决定,后件由D及其取值所决定。DS可表示为(U,CU{d)), d∈C。DS又称为决策表。称矩阵M(S)一[ci]m。为信息系统S的辨识矩阵,若Ci一{a∈A:Ⅱ(zf)≠“(zj)),i,JE[1州],n— lAl。辨识矩阵包含决策表中所有属性区分信息。当决策属性不同且条件属性也不完全相同时,元素值为互不相同的属性组合;当决策属性相同时,元素值为0;当决策属性不同而条件属性完全相同时,元素值为一1,则表明数据有误或条件属性不满足。·43·瓣对于给定的DS,S一(【厂,CU{d)),条件属性C的约简指C的一个非空子集BEC,满足JND(B,{d))一1ND(C,{d))且不存在B7cB,使得IND(B7,{d))=JND(C,(d))。约简意为在不丢失信息的前提下,以最简方式表示DS的结论属性对条件属性集合的依赖和关联。约简导致冗余属性被去除。记RED(C)为所有约简的集合。约简不是唯一的,而包含关系最少的约简为最小约简,其是应用中较感兴趣的约简。参考文献E43介绍了利用粗糙集理论的基于决策能力属性约简算法及应用实例,即将决策表中条件属性的相对决策能力作为启发函数来指导条件属性的约简过程。而该算法对于比较大型的知识表进行最优、最小的约简计算是很困难的,而且随着恩陛表的增大,计算约简的复杂程度将剧增,已证明求取对象的约简组合属于NP完全问题,难以用穷举法来实现。因此,本文的研究进一步用遗传基因算法来作为约简提炼,利用其能克服局部最优,对领域知识作智能式搜索的特性,快速实现全局最优解的挖掘方式来求出DS最佳约简。1.2基于遗传算法的属性约简为便于计算机进行处理,先引入差别矩阵的概念。差别矩阵是辨识矩阵的一种特殊表达方式,非常适合于利用计算机进行约简求解。定义(N+1)x’—ri'14i--一m的二维矩阵B为差别矩厶阵,N为条件属性个数,7Tl为决策表中对象的个数,第N十1个属性为决策属性。记6(i,(矗,,1))为B中相应于属性i和对象对(sc;,z。)的一个元素,满足:6(i,(志,”))一 f1V延{1,…,N),如果ai(sc女)≠ai(z。)【0ViE{1,…,N),如果ai(zI)一a:(z。) b(n+1,(志,扎))一 f0ViE{1,…,N),如果d,(z女)≠d。(z。)I1V i∈(1,…,N),如果d,(z^)一d,(z。)由B的定义,求决策表的约简即等价于求矩阵B的最小行标号子集R∈{1,…,N),使之满足:V(是,姐),了iER:6(i,(走,n))一lV6(N+1,(忌,咒))一1基于GA的约简求解算法可以分4步描述。 a.编码。以长度为N的位串作为染色体表示方案,其中,N为条件属性个数,位为1表示该位对·44·应的属性被选中,0表示未被选中。例如:设共有6个属性{“。,“。,…,a。),且设待选约简为(a。,“。州,),——+则对应染色体编码为u一。 b.遗传算子。根据本文所考虑问题的具体特点,3类遗传算子分别设计为:选择——轮盘赌选择策略;杂交——一点杂交算法;变异——随机改变个体中某位基因而产生新个体。 c.适应函数。适应函数是考察一个个体的辨识率和约简率的2项指标,定义为:F(u)一[a*可N--L了+(1-a)高]2如果Q<(m2--m)/2矿学+(1刊导]z如果G一(m2—77z)/2三。为u中l出现的个数,C;为u能够辨识的对象对个数,1>a>0为平衡二者权重的预设值。式中第l项表示一个个体约简率的大小,第2项表示该个体辨识率的大小,在不牺牲辨识率的前提下,约简率越大说明该个体越好。 d.算法流程。首先,将求解最优约简问题的解编码成二进制染色体,染色体中0、1组成的基因代表优化空间的一个解,0表示此条件属性在最优约简中可忽略,l表示此属性与约简相关。随即产生N个染色体,构成初始解群。然后,选取适应函数。适应函数的选取是GA的关键,它表示在适应函数约束下的智能搜索策略,适应函数按照c的定义。再进行遗传操作。以适应函数为目标函数,通过选择、交叉和变异,实现优化搜索。经过试验,交叉率、变异率一般分别取0.8~0.9和0.1~0.3。接着是收敛判据。当遗传操作一定迭代次数候,适应值没有明显改变,或达到事先给定的最优标准时,算法结束。最后,从约简中提取规则。将所得到约简的每一个对象重新匹配到父决策表中,若该规则对于决策表中所有可能取值可完全辨识,则该子规则成立。依次对约简集中的所有约简类推,新规则集即形成。2应用实例以某数控系统为例,在长期的维护中通过分析获取其可靠性数据,确定了26种故障征兆和28种故障类型和40多条诊断规则,构成的故障诊断决策知识表。以故障征兆构成决策表的条件属性集合,《机械与电.子}}2007(10)
上一篇:只有枯竭的思想没有枯竭的能源记中国科学院院
下一篇:没有了