Y857792密级:——分类号:V249单位代码:10699研究生学号:*********题目数据挖掘与数据融合相结合的信息西北工业大学硕士学位论文(学位研究生)处理技术研究作者王墙指导教师高社生专业技术职务教授学科(专业)导航、制导与控制2006年3月摘要摘要随着全球信息化的快速发展,数据挖掘与数据融合这两种作为处理海量数据、提取有用信启,的高新技术倍受瞩目。这两种技术处理数据的原理各不相同,但在功能上相互补充,整合这两种技术能更有效地解决工程中的实际问题。数据挖掘的首要问题是寻找数据来源,将来自不同样本的数据利用数据融合技术有效地加以综合,再进行数据挖掘。数据融合需要在已知的模型上进行,而数据挖掘技术则可自动地建立模型。将这两种技术进行深层次的结合与渗透,可协同完成复杂数据处理工作。本文对数据挖掘与数据融合这两种技术进行了理论研究与应用探讨,研究内容及成果如下:(1)针对数据融合系统难以获取先验信息,以及存在大量冗余数据的问题,提出了用粗糙集理论建立数据融合模型的方法。采用属性约简及规则约简的方法处理数据,剔除冗余信息,获取最简规则。根据粗糙集最简规则建立融合系统。通过粗糙集离散化算法将融合方法推广至连续域。仿真结果证明,该算法是切实可行的。(2)将模糊理论与神经网络技术相结合应用于数据融合。研究了基于模糊神经网络的融合系统原理,建立了基于模糊神经网络的融合系统,给出了神经网络学习算法。仿真结果验证了算法的可行性。(3)针对数据挖掘与数据融合技术在功能上互补的特点.研究了数据挖掘与数据融合的集成技术,完善了知识获取过程,提高了融合精度。并建立了一种新的集成系统,研究给出了该集成系统的原理以及工作过程。(4)针对粗糙集与模糊神经网络各自的优缺点,提出了一种粗糙集——模糊神经网络模型。研究TN用粗糙集技术获取模糊规则的方法,通过模糊神经网络对融合规则进行推广,克服了单独使用一种方法建立融合系统时存在的缺陷。(5)设计了一种基于粗糙集——模糊神经网络技术的数据挖掘与数据融合集成系统。研究给出了设计原理.提出了建立集成系统的具体步骤,以及该集成系统的算法流程图。研究了集成系统各部分的算法,构建了网络的拓扑结构,推导出了网络的学习公式。提出了一种基于糯糙集方法的初始隶属函数获取算法,仿真结果证明了该集成系统的可行性与有效性。关键词:粗糙集.模糊神经网络,数据挖掘,数据融合ABSTRACTAbstractWiththerapiddevelopmentofinformationglobalization,datamininganddatafusionreceivegreatattentionastwopromisingtechnologiestodeal、“thhugevolumeareofdata.AlthoughtheprinciplesofbomIntegratingbothtechnologiesdifferent.theycallcomplementeachothercanefficientlysolvepracticalengineeringproblem.Thetochiefproblemofdataminjngissearchdata.Thefusionsystemcouldefficientlyonsynthesizethedatafromdifferentsamples.Datafusionisappliedwhiledataminingtechnologyhighlycoupledtheycartvirtualmode],automaticallyestablishthemodel.Therefore,Onceaccomplishcomplicateddataanalysiswillbehelpfultoautomaticallywitheffect.Thedissertationresearchesthetheoriesofdatamininganddatafusion.Thehybridsystem’sbasicmodelispresented.Themainworkandachievementsarefollows:as(1)Inordertodeal谢t11redundancydata,anewdatafusionmodelbasedonroughsetsispresented.Appl37ingreductionmethod,thefusionalgorithmisextracted.ThisfusionmedeJcoulddealwithcontiRUOUSdata,byusing血ediscretizationalgorithm.Simulationresultsitsfeasibility.(2)Onekindoffuzzyneuralnetwork,whichisusedproposedbycombingtheadvantagesofneuralnetworkalgorithmisalsopresented.Simulationmsultsitstofusemulti-sonrcedata,isandfuzzyinference.Learningfeasibility.to(3)Datamininganddatafusionhavecomplementaryfunctions.Accordingtheircharacteristics,thetheoryofintegrateddatamiulngproposedanddatafusionsystemis(4)Anewfuzzyneuralnetworkbasedextracted&omdatabaseusingroughsetsonroughsetsispresented.Rulesare0。initializethestHlctoreoffuzzyneuralnetwork.Thefuzzyneuralnetworkistrainedwithoriginaldaca啊Bycombiningthoseadvantagesofthetwotheories,theresultismoresatisfactory。(5)Onekindofintegrateddatamininganddatafusionsystem’smodelisdesignedwnfazzyneuralnetworkbasedonroughsets.Aprinciplediagramandflowchartoftheintegratedsystemarepresented.Themodelofthenetworkisconstructed.Algorithmofthismodelisalsostudied.ThesimulationresultsprovethattheproposedmodelshowsllABSTRACTgoodperformanceinthelearningspeedandaccuracyKeywords:roughsets,fuzzyneuralnetwork,datamining,dmafusionIII第一章绪论第一章绪论1.1数据融合技术的发展近20年来,随着计算机技术、通信技术、微电子技术的迅速发展,各种面向复杂应用背景的多传感器数据系统大量涌现。在这些系统中,信息表现形式多种多样、信息容量巨大.对数据处理速度及精度的要求也越来越高,传统的数据处理方法已不再适用。此外,随着计算机技术和数据处理技术的快速发展,对大量数据进行实时并行处理已成为可能,在此背景下,数据融合技术便应运而生。数据融合是把多个渠道,多个方位采集到的局部环境下的不完整数据(往往是传感器数据)加以综合,消除多源数据问可能存在的冗余和矛盾信息,降低不确定性,形成对系统的一致性描述,提高智能系统决策、规划、反应的快速性和『F确性,降低决策风险。数据融合是--l']涉及信息科学、计算机科学、自动化科学的多学科交叉学科““。数据融合早期研究主要基于军用背景。随着该研究的深入和应用领域的不断扩大,数据融合技术在军事上已经广泛的应用于自动目标识别、导航系统、战场侦察、自动威胁识别等方面。近年来,在民用方面也得到了迅速发展。主要应用领域有:工业制造系统、智能建筑、资源探测、气象预报、金融系统、空中交通管理、船舶避碰、疾病诊断、工业机器人等等“’…’。随着科学技术的发展,各种新型传感器不断涌现,传感器性能不断提高,这极大地促进了数据融合技术的发展。多传感器系统所采集到的数据量大大增加,这些数据在时间、空间、可信度、表达方式上不尽相同、侧重点和用途也不相同,这对信息的处理提出了更高的要求。多传感器系统需要使用信息综合处理技术,协调各传感器彼此间的工作、更加有效地处理多传感器系统的各种数据。多传感器数据融合的发展主要集中在以下几个方面…1:(1)建立数据融合的基础理论。这包括研究融合技术的数学基础,对于同类数据相融合的数值处理:主要研究各种最优、次优、分散式算法:对于不同类型数据相融合的符号处理方法.引进其它领域的一些新技术:如具备学习功能的新型AI(ArtificialIntellJgence)技术、小波分析技术等。(2)兼有稳健性和准确性的融合算法和模型。研究相关处理、融合处理、系统模拟算法和模型,对数据融合系统的评估和度量标准进行研究。针对具体应用对象提出相应的模型及算法。(3)研究数据融合所用的数据库和知识库、高速并行检索和推理机制““。利用大型数据库中的数据和知识进行推理是融合系统的关键技术,但其数据量往往非第一奄绪论常大,因此,有必要研究和探讨用于空间数据库知识的发现机制和方法。(4)丌发推理系统,以进行融合过程中的状态估计和决策分析。(5)研究数据融合的体系结构:在Reiner和Yannor提出的集中式、自主式和混合式结构的基础上,又有学者提出了多级混合结构的设计思想‘7…1。1.2基于数据挖掘技术的融合方法研究如前所述,随着科学技术的发展,大量新型传感器不断涌现,传感器数据大量增加。虽然信息量的增加有助于提高融合精度,但也带来了许多问题,例如,庞大数据的处理需要增加计算量等。很明显,紧紧依靠数据融合本身的技术是不够的,需要引入处理海量数据的技术。为此,本文将数据挖掘技术与数据融合技术相结合,协同处理数据,扩展融合系统的应用范围。数据挖掘技术是人工智能和数据库的结合,它可以处理海量数据,提取有用知识,在数据挖掘的框架内综合各种数据融合方法,解决不确定的、难以建模的、动态的海量信息。该技术是Edward。“首次提出的,但没有给出具体的实现方法。本文针对现有的数据融合技术在理论上和应用中存在的问题,利用数据挖掘方法对这些问题进行研究。数据融合与数据挖掘是两种产生知识的过程。数据挖掘主要是通过统计或人工智能的方法从大量原始数据中推测、寻找数据之间复杂、潜在的关系或蕴含的模型1。4“,不关心数据的来源:而数据融合则强调和分析来自多个传感器或多个数据源的信息,用这些信息对目标进行识别、估计或做出某种综合判断。从逻辑推理的角度讲,数据挖掘和数据融合是两个相反的过程:即归纳和演绎。数据挖掘实现归纳过程,从原始数据中学习和总结知识,发现数据中有价值的模式或数据间的关联,揭示事件或对象特征的模型。由人来验证模型的可用性,并可应用到数据融合中去。融合过程实际为推演的过程——用已知的模型在数据中识别该模型的实例。因此,数据融合可以看作是利用已有的知识、经验来处理从未知世界得到的来自不同领域的数据的过程。由此可见,数据挖掘和数据融合技术作为两种分析、处理数据,提取有用知_c=}{的技术,虽然原理和所用的技术各不相同,但在功能上相互补充,可进行深层次的结合与渗透,有效地完成复杂数据的分析工作,解决实际应用中的问题。用数据挖掘技术辅助数据融合的原理如下:首先利用数据挖掘技术从数据中发现对象的规律和模式,然后以这些规律和模式作为融合模板,对符合模板的对象做出甄别,这一过程可以反复进行,直到取得满意的结果。本文基于这一思想,采用粗糙集理论、模糊神经网络等数据挖掘技术,以目标识别为应用背景,对数据挖掘在数据融合中的应用进行了较深入地研究和讨论。2第一章绪论1.3论文工作简介本文主要研究了数据挖掘技术在数据融合中的应用。政研究主要分两部分:(1)使用数据挖掘方法构造融合模型,建立融台系统。(2)结合数据融合与数据挖掘技术,建立集成信息处理系统。第一部分的研究主要采用粗糙集和模糊神经网络这两种数据挖掘方法建立融合系统。餐于这两种方法各有优缺点,因此,本文设计了一种新的粗糙集——模糊神经网络,并将浚网络用于第二部分的研究,用其构造数据挖掘与数据融合集成系统。本文的主要工作如下:第一章研究背景。包括数据融合技术的发展,数据挖掘与数据融合的关系,介绍了本文的主要研究内容。第二章主要介绍了数据融合技术与数据挖掘技术的基本理论。首先介绍了数据融合的概念、功能,给出了属性融合的三种结构模型;其次,介绍了数据挖掘的概念以及常用算法;最后对这两种数据处理技术进行了比较,阐述了两者相结合的原理。第三章研究了粗糙集方法在属性融合中的应用。首先介绍了粗糙集的基本理论,分析了粗糙集属性约简、去除冗余信息的特点。研究了粗糙集约简的相关算法,并通过对这些算法的改造和变换,提出了基于粗糙集的数据融合算法。最后对该算法进行了仿真。第四章研究了模糊神经网络在属性融合中的应用。首先介绍了神经网络的基本原理,给出了常用网络的算法,将模糊推理与神经网络相结合应用于数据融合中,实现对目标的识别,并对算法进行仿真。第五章研究了数据挖掘与数据融合集成系统。首先对集成系统的原理进行了阐述,给出了集成系统的原理图。接着,针对粗糙集与模糊神经网络各自的特点,取长补短构造粗糙集——模糊神经网络,设计了基于该网络的集成系统,给出了集成系统算法流程图,具体研究并设计了集成系统各部分的算法,弥补了单纯使用粗糙集方法或神经网络方法的不足,最后对浚算法进行了仿真。第六章对全文进行了总结,并提出了今后的研究方向。第一_=章数据融台与数据挖掘技术研究第二章数据融合与数据挖掘技术研究2.1数据融会技术简介2.1_1数据融合的基本概念数据融合【3,161是将从同一目标获得的多组传感器数据进行多级别、多方面、多层次的处理和组合.产生新的有意义的信息。这里的传感器是广义的,是指各种数据获取系统和相关数据库等。数据融合是多源信息的一种处理方法,简单地说,数据融合就是多种数据的综合算法。处理的目的是将获得的信息通过推理和识别,并据此做出估计和判决。通过对多传感器数据进行融合,可以增加置信度、减少模糊性,提高系统的可靠性。数据融合其实是利用计算机对各种信息源进行处理、控制和决策的~体化过程。数据融合系统的功能[17】主要有检测、相关、识别和估计,其功能模型如图2一l所示。融合系统共有两级,包括低级处理和高级处理。前者包括信息检测、数据互联,目标状态估计及属性分类;后者主要有行为模式的检测、目标和事件的互联、行为预测的估计及态势估计等口J。低级处理是数值处理,产生数值结果(例如,目标位置、速度、类型等1。高级处理主要是符号处理,将导致更为抽象的结果(例如,威胁、企图、目的等1。目标跟踪I传感器tI身份1只剐传感器2将来行为传感器3预测传感器n;..…….+..,.。.一低级处理过捏.…….……….;j高级处理过锌处理结果j:.一一...,。...一..:.....一.......:图2.1数据融合功能结钩数据检测就是用数据融合系统中的多传感器不断进行扫描并观测目标,在信号层上实现检测判决。数据互联单元的作用是用于判别不同时间和空间的数据是否来自同一目标。状态估计是根据传感器的观测值估计目标参数,并利用这些估4第二章数据融合与数据挖掘技术研究计预测下一次观测目标的状态。目标识别是根据不同传感器测得的目标特征彤成一个N维的特征向量,每一维代表目标的一个独立特征。如果预先知道目标有M个类型以及每类目标的特征,则可将实测特征向量与己知类别的特征进行比较,以便确定目标的类别。根据目标的位置,航迹,类别等信息,对全局态势发展和形势进行估计。根据对原始数据处理方法的不同,数据融合共分为三种处理结构【I8。圳,即集中式处理结构、分布式处理结构和混合式处理结构。在集中式处理中,备传感器的作用仅仅是信息检测、录取,传感器本身不作决策.它将测量值输送到融合中心,供融合中心作出最终决策。这种结构是相对完善的数据融合,其性能良好,但这种结构的缺点是需要频带很宽的数据传输总线来传输高速率的原始数据,同时需要有较强处理功能的中央处理器。这些要求使其很难在工程中实现。在分靠式处理中,每个传感器各自独立作出决策,然后将决策结果送入融台中心,供中央处理器作出最终决策。这种结构的优点是对信道容量要求低,工程上易于实现,但每个传感器自己作出决策,使得融合处理具有不确定性。混合式结构兼有两者的优点:低的数据传输总线要求及原始测量数据的可用性。2.1.2数据融合的级别数据融合可分为五级II6J:检测级融合、位嚣级融合、属性(目标识别)级融合、态势评估和威胁估计。(I)检测级融合。检测级融合是在采集到的原始信息层次上的融合,即在多传感器的信息末进行预处理之前进行分析和综合,先确定信号的有效性,再进行数据联合。其优点是保持了尽可能多的环境信息,缺点是信息处理量大,处理时间长,实时性差。(2)位置级融合。位置级融合是直接在传感器的观测报告或测量点逊和传感器的状态估计上进行的融合,包括时间和空间上的融合。位置级融合是为了获得目标的位置和速度,它通过综合来自多传感器的位置信息建立目标的航迹和数据库,主要包括数据对准,互联,跟踪,滤波.预测,航迹关联及航迹融合等。(3)属性级融合,也称为目标识别级的融合。它是指对柬自多个传感器的目标识别数据进行组合,以得到对目标身份的联合估计。属性层融合利用多个传感器采集观测目标的数据,再进行特征提取和数据联合,将同一目标进行分组,再利用融合算法将同一目标的分组数据进行合成,最后得到眩目标的联合属性判决,办即得到目标的类型和类别。该层融合的优点是实现了信息的压缩利于实时处理,并且融合结果直接与决策分析相关。根据融合的位置不同,目标识别层的融合分为三种方法,决策级融合、特征级融合、数据级融合。(4)态势评估是指由不完整的数据集合建立一般化态势表示,对前几级处理产生的兵力分布情况有一个合理的解释。通过对复杂环境的正确分析和表达,导第二章数据融合与数据挖摇技术研究出敌我双方的兵力分布推断,绘出意图、告警、行动计划和后果。(5)威胁估计是在前四层的基础之上,综合敌方破坏能力、机动能力、运动模式、及行为企图,估计敌方企图,定量表示敌方的作战能力。第一级属于低级融合,它是经典信号检测理论的直接发展,是近几年才开始研究的领域。目前大部分多传感器信息融合系统还不存在这一级,仍然保持着集中式检测,而不是分布式检测,但是分布式检测是未来的发展方向。第二和第三级是最重要的两级,它们是进行态势评估和威胁估计的前提和基础。融合本身主要发生在前三个级别上,而态势评估和威胁估计只是在某种意义上与信息融合具有相似的含义。第四和第五是高级融合,它们包括对全局态势发展和某些局部形势的估计。2.1.3目标识别级的融合模型本文具体研究目标识别级的融合,下面重点介绍该层的融合模型。1.数据级融合在数据级融合方法中,对来自同等量级的传感器原始数据直接进行融合,然后基于融合的传感器数据进行特征提取和身份估计[3,4J6,17]。为了实现这种数据缴的融合,所有传感器必须是同类的或相同量缴的。通过对原始数据进行关联,确定已融合的数据是否和同一目标或实体有关。融合后的传感器数据按照单传感器方法进行识别处理。数数据据关联特征提取属性判决数据级融合对数据传输带宽、数据之间配准的精度要求较高,因此,限制了它的应用。此外,由于没有任何办法对原始数据所包含的特性进行一致性检验,使得数据级融合具有盲目性,原则上不推荐在数据层上直接融合。2.特征级融合在特征级融合方法中,每个传感器观测~个目标并完成特征提取,以获得来自每个传感器的特征向量,再经数据联合获得同一目标的分组,按照这些分组融合特征向量.根据联合特征向量产生身份估计o,“,”,矧。孑一级一融任12-2数据缎属性融合6第二章数据融合与数据挖掘技术研究『传感器lb特征特征级属陛融合属蛀削泱j传感器2L-—_-提取I传感器N}_—一图2—3特征级属性融台口引…特征级属性融合的实质是模式识别问题。相比单传感器,多传感器系统提供了更多的有关目标的特征信息。具体的融合方法仍是模式识别的相关技术。特征级属性融合在融合的三个层次上发展得最为完善,有善良好的应用与发展前景,但模式识别技术本身的困难,也相应地限制了特征级属性融合的研究和发展。3.决策级融合在决策级属性融合中,对同一目标不同类型的传感器数据进行处理,包括特征提取,识别或判决,然后通过关联处理、决策级融合判决,获得联合推断结果…6,17].『传感器fL特征一判一决一结,一果,一一1一决策级属性融台属性判决传感器2提取传感器N判决一结,累一判决结黑图2-4决策级属性融台门川H决策级属性融合在信息处理方面具有很高的灵活性,系统对信息传输带宽要求低,能有效地融合目标各个侧面的不同类型信息。但是由于先验知识获取困难、知识库巨大、环境和目标的时变动态特性等问题,决策层属性融合的发展仍受到阻碍。三种方法的比较如表2-l所示表2.1三种方法的比较口2融合框架数据级信息损失小实时性差精度高容错性差抗干扰能力差f一作量小融合水平低第二章数据融合与数据挖掘技术研究『特祉级中中由中中由中决策级大好低优优人高~般地,数据层融合的结果精度最高,决策层的融合精度最低,但数据层的融合要求传感器是同类的,且由于要处理大量的数据会对系统的实时性有影响。也可以利用这三种方法组成混合式结构的信息融合系统,现实的应用中,对这三者并没有明显的划分,往往是针对实际情况,综合考虑,选择其中一种或者混合式的属性级融合结构。2.2数据挖掘技术2.2.1数据挖掘的概念数据挖掘[23,2L26l是从数据库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在有用的信息,提取的知识可表示为概念、规则、规律、模式等形式。广义地讲,数据挖掘是在一些事实或观察的集合中寻找模式的决策支持过程。也就是说,数据挖掘的对象不仅是数据库,也可以是文件系统,或其他任何数据集台。数据挖掘的任务是从数据中提取知识。这些知识按功能分为两大类:预测型和描述型‘2“。预测型可以根据数据项的值精确确定某种结果。描述型是对数据中存在的规则作一种描述,或者根据数据的相似性把数据分组。根据发现知识的不同,我们可以将数据挖掘任务归纳为以下几类【2327t28l:(1)特征规则从与学习任务相关的一组数据中提取关于这些数据的特征式,用以表达该数据集的总体特征。(2)分类。分类是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述。(3)聚类。聚类是将数据分组,把相似的记录放在一个聚集里。各组间差别尽量大,组内差别尽量小。聚类和分类的区别是聚类不依赖于预先定义好的类,不需要训练集。(4)关联分析。关联分析是指当两个或多个数据项的取值重复出现且概率很高时,它就存在着某种关联,可以建立起这些数据项的关联规则。(5)预测。预测是利用历史数据找出变化规律:即建立模型,并用此模型来预测未来数第二章数据融台与数据挖掘技术研究据的种类特征等。(6)偏差检测(异常分析)。偏差检测是探测数据现状、历史记录或标准之间的显著变化和偏离。偏差包括很大一类潜在的有用的知识。2.2.2数据挖掘常用算法数据库技术只是将数据有效地组织和存贮在数据库中,并对这些数据作一些简单的分析,大量的隐藏在数据内部的有用信息无法得到。机器学习、模式识别、统计学等领域虽然有大量的提取知识的方法,但没有和实际应用中的海量数据结合起来,很大程度上只是对实验数据或学术研究发挥作用。数据挖掘从一个新的角度将数据库技术、机器学习、统计学等领域结合起来,从更深层次中发掘存在于数据内部的有效的、新颖的、具有潜在效用的乃至最终可理解的模式。具体来说,有以下几种主要的数据挖掘方法[232,9I:①统计学方法统计学方法通过回归分析、时间序列、判别分析、因子分析和聚类分析等统计分析方法.可以从抽样分析中提取未知的数学模型。数据挖掘主要是对高级多元统计方法应用的拓展和深化。统计学方法是数据挖掘研究的重要途径之一。②关联规则挖掘挖掘关联规则就是发现存在于数据集中的关联性或相关性。③遗传算法遗传算法模拟生物的进化和遗传,借助选择、交叉和变异操作,使要解决的问题从初始解逐步逼近最优解,解决了许多全局优化问题。遗传算法已广泛用于分类和优化问题。在数据挖掘中,还可用于评估其他挖掘算法的适合度。④粗糙集方法【24l粗糙集方法能从不精确的、模糊的、不确定的数据中发现知识。粗糙集理论在知识获取和数据挖掘中得到了广泛的应用,它为数据挖掘提供了理论基础。粗糙集理论可以用于分类,发现不准确数据或噪声数据内在的联系。找出可以描述给定数据集中所有概念的最小属性子集。⑤模糊论方法利用模糊集合理论,对实际问题进行模糊判断、模糊决策、模糊模式识别、模糊簇聚分析。系统的复杂性越高,精确能力就越低,模糊性就越强。模糊逻辑系统已用于许多特别是基于规则的分类领域。⑥神经网络方法模拟人脑神经元方法,建立了三大类神经网络模型:前馈式、反馈式、自组织网络,可以完成分类、聚类、特征挖掘等多种数据挖掘任务。在数据挖掘中.神经网络主要用于获取分类模式。神经网络用于数据挖掘,要解决好两个关键问9第二章数据融合与数据挖掘技术研究题:一是降低训练时间,二是挖掘结果的可理解性。2.3数据挖掘方法在数据融合中的应用数据挖掘和数据融合是两种分折、处理海量数据,提取有用知识的技术,分别针对数据的巨量性和分散性D“。两者的目标、原理和所用的技术各不相同.但功能上相互补充,整台两种技术能更有效地解决实际问题。数据挖掘的重要问题之一是数据来源,来自不同样本的数据可利用数据融合技术有效地组合,再作数据挖掘。数据融合的处理需要在已知模型的基础上进行,利用数据挖掘技术则可自动建立融合模型。这两种技术还可进行深层次的结合渗透,协同完成复杂而有效的数据分析工作。数据挖掘方法处理数据、提取知识的过程,实际上是归纳过程,发现数掘中有价值的模式或数据间的关联,也就是揭示事件或对象特征的模型p”。数据融合过程实际上是一种自适应外部环境的知识创建过程,数据融合过程是演绎性的,它只是把传感器观测数据与先前学习(归纳)到的模板或模式进行匹配比较,以便对被观测域内的目标或目标群进行探测、建模和识别”“。数据融合和数据挖掘都是知识建立过程,但数据挖掘是知识学习,而数据融合是知识应用。它们之间的比较如表2—2。表2—2数据挖掘与数据融合的比较‘3032.类比方面数据挖掘大量的典型数据,包含了对输入数据已知实体的观测。这时数据从多个传感器或其它来源来的数据,往往是实时的。数据融合一般是预先收集好的。建立知识的方法发现知识的模式归纳:根据大量事实的相关性.发现描述数据的通用规则集未知:通过训练和自学习,发现隐藏在数据中的新模式演绎:将数据与已知的模型或模式匹配,推断实体或事件的存在或其身份已知:将特定模式作为模板,探测观测数据所代表的类似模式利用已有的模型检测已知实体的存在和状态。根据已知模型在多数据源中检测匹配目标。发现与某类实体相关的,原获取的知识已存在但尚未被识别的模式(模型)输出的知识描述实体或事件关系或行为的模型。知识的运用提高系统的自学习能力和智能水平0目标识别、目标跟踪、念势评定、威胁估计、决策、武器分配等第二章数据融合与数据挖掘技术研究由上面的比较可知,数据融合和数据挖掘作为两种推理过程,在建立对象模型(模式)和利用模型来甄别对象方面往往可以起到互补的作用。而且由于数掘挖掘的优点是可以利用数据融合系统收集到的数据进行分析,而并不需要专门的实验过程,因此可以很自然的和数据融合过程结合在一起。首先利用数据挖掘技术从数据中发现对象的规律和对象的模式,然后以这些规律和模式作为融合模板,对符合模板的对象做出甄别,这一过程可以反复进行,直到取得满意的结果。2.4本章小结本章主要介绍了数据挖掘技术与数据融合技术的基本理论。首先介绍了数据融合的概念和基本功能模型,给出了目标识别级融合的结构模型;其次,介绍了数据挖掘的概念和常用方法:最后,通过这两种技术的比较,叙述了数据挖掘与数据融合集成应用的原理。本章所研究的内容为后面各章节奠定了基础。11第三章粗糙集理论在散据融台中的应用第三章粗糙集理论在数据融合中的应用3.1粗糙集的基本概念粗糙集是由波兰数学家Z,Pawlak于t982年提出的一种处理含糊和不确定性问题的数学方法‘2…。它在数据约筒、特征提取、消除冗余数据等方面功效卓著,已经广泛地应用于在人工智能、知识与数据发现、模式识别与分类、不精确数据的分析推理以及发现潜在知识等方面。粗糙集理论作为一种分析不确定性数据的数学工具,与经典集合理论不同,它认为知识即是将对象进行分类的依据,通过这些知识可以将对象划分为不同的类别。知识可以用属性和相应的值来描述。由此知识可以理解为;使用等价关系集合R对空间u进行划分,知识就是用R对u划分的结果”“。由于知识的获取是有限的,为合成等价关系所进行的分类细化到某种程度时,就出现了不可分辨关系,这就是不能精确地表示知识某些概念的原因。为了描述知识的精确程度,在粗糙集理论中引入上近似与下近似的概念,可用来描述不精确与模糊性。粗糙集理论作为一种处理模糊、不精确或不完全信息问题的新方法,其主要思想是:在保持信息系统不可分辨关系不变的前提下,根据论域中两个等价关系的依赖关系,剔除相容信息,提取潜在的有价值的规则知识。用粗糙集理论进行知识不完全处理有很多优点。其中最主要的特征是精糙集理论对不确定性的描述是相对客观的,即无需预先给定某些特征或属性的数量描述。而模糊集和基于概率方法的证据理论需要一些数据的附加信息或先验知识,如模糊隶属函数、基本概率指派函数和有关统计概率分布等,这些信息有时并不容易得到。粗糙集直接从给定的数据集出发,以数据对象集合等价关系的划分作为知识,因而比较客观。粗糙集理论提供了严格地处理数据分类问题的数学方法,从而不需要任何数据的附加信息。由于对各类不确定性理论研究的出发点不同,因此,粗糙集理论并不能代替其他理论,它可以和其他的不确定性计算方法结合使用,以更有效的解决问题。3.1.1信息袁知识表达系统信息表知识表达系统[33,34,“1的基本成分是研究对象的集合.关于这些对象的知识是通过对象的属性和属性值来描述的。一个信息表知识表达系统可以表示为[331S=<U,R,V,,>,其中U是对象的集合,R=CUD是属性集合,C和D分别为条件属眭集和结果属性集.V=U以是属性值的集合,其中■为属性r的值域;,=u×R_矿是一个信息函数,苁n’r)表示对象X在属性r下的属性值。知识表第三蕈辊槌集理论在数据融合中的戍用达系统可以用信息表来表示。信息表的行表示集合中的对象,列表示对象的属性。定义R代表论域U中的一种关系,可以是一个属性或一个属性集合的描述。当用R描述U中对象的等价关系时,用U/R表示根据关系R划分的等价类族,用[明日代表等价关系中的一个等价类。对于子集Ⅳ,ycu,和属性子集PcR,若x和Y根据定义的关系P不可分辨,即子集x,Y都属于P中的一个范畴时,称为不可分辨关系IND(P)。决箫表是一种重要的信息表,定义如下口4J:一个决策表是一个信息表知识表达系统S=<U,R,V,,>,R=CUD是属性集合,C和D分别为条件属性集和结果属性集,且D≠o(D也可称为决策属性集)。3.1.2粗糙集与集合近似令Ⅳ[u.当x能用属性子集P确切的描述时,称x是P可定义的,否则称X是P不可定义的。P可定义集称作P精确集,P不可定义集称作P粗糙集(简称粗糙集)。给定知识表达系统S=<U,R,V,,>,对于每个子集z£U和不分明关系P,x的下近似集和上近似集分别定义如下:P一(x)=U{x10∈UA[x】PEX)}P一(工)=U{x10∈U^[Ⅳ]Pnz≠o))集合BNp(z)称为x的P边界BⅣP(Ⅳ)=P一(膏)一P_(鼻)(3-3)(3-1)(3-2)集合尸0酃(x)称为X的P正域POSp(X)=P_(X-)(3-4)集合NEGP(x)称为X的P负域NEGp(Ⅳ)=U一.P一(Ⅳ)P(3-5)fz、是根据知识P,在U中所有一定能归入集合x的元素的集合。P一(Ⅳ)是根据知识P,在u中所有可能能归入集合x的元素的集合。边界域BNP(x)是不确定域.其中的元素既不能肯定属于x,也不肯定属于牙。正域POSP(f)b-JD一(一)相同,负域NEG:.(Ⅳ)是根据知识P,在U中一定不属于集合X的元素的集合。,塑三兰望焦塞里丝垄墼塑壁垒!塑窒旦一——3.2知识获取知识获取就是识别出存在于数据库中有效的、新颖的、具有潜在效用的乃至最终可理解的模式的非平凡过程。近年来,粗糙集理论对模糊和不完全知识的处理比较成功,成为数据库知识获取研究的有力工具。下面对知识获取中需要用到的基本概念作如下介绍,为下文知识约简和知识获取做准备。可辨识矩阵[33,41-451令决策表系统为s=(U,R,v',),R=PUD是属性集合,子集P;{a,Ii=1,…,卅}和D={d)分别称为条件属性集和决策属性集,U={x.,…x。),是论域,a.(x.)是样本x,在属性a、上的取值。C。(i·j)表示可辨识矩阵中第i行J习的元素,则可辨识矩阵C。定义为c撕∽=㈦吼酣”“t净吼。一’嬲嚣髫其中i,,=1,…,月。㈢s,可辨识矩阵是一个依主对角线对称的矩阵,只需考虑可辨识矩阵上三角(或下三角)部分。根据可辨识矩阵的定义可知,当两个样本(实例)的决策属性值相同时,可辨识矩阵中的对应元素取0:当两个样本的决策属性值不同时,需要通过某些条件属性的取值不同来加以区分,它们对应的可辨识矩阵元素为这两个样本属性值不同的条件属性集合,即可以区分这两个样本的条件属性的集合:当两个样本发生冲突,即样本的条件属性值相同而决策属性值不同时,对应可辨识矩阵的元素为空集。可辨议矩阵是否包含空集可用来判定决策表知识系统是否包含不一致信息。属性重要性利用粗糙集方法,可以对属性的重要性进行度量。与传统方法不同,属性的重要性完全通过论域中的样例计算,不依赖其它先验知识。根据3.1节定义的分类的质量~(F)这一概念,可以对样本属性的重要性进行度量。设F是属性集D导出的分类,属性子集R’在属性集R中的重要性口∥(F)定义为:“F(F)=rR(F)一‰P(F)响越大,属性越重要。属性的重要性还可以由下式定义:14(3-7)上式表示从属性集R中去掉属性R’对F近似分类的质量的影响。对分类质量的影萋三兰塑堡苎里笙鱼塑塑壁宣!盟壁璺——w,=篙躲其中POS月(,)=【JPOS月(工)决策规则㈤s,决繁袁中包含了某一领域大量的数据,记录了大量属性值和决策的情况。知识获取的目的就是通过分析决策表以得到该领域有用的、规律性的知识。从决策表分析得到的规律性知识通常用决策规则表示。决策规则定义描述如下:首先定义原子公式(以%),。表示条件属性,圪是条件属性a的取值。公式A_B的逻辑含义称为决策规则.A称为规则前件,B称为规则后件。表示一种因果关系。公式“中所包含的原子公式只有决策表中的条件属性,B中所包含的原子公式中只有决策表的决筻属性。对于决策表S.如果决策规则A—B为真,即决策表中所有实例都满足规则A_8,则称决策规则A_8在决策表S中是协调的,如若有实例不满足规则』。B,称决策规则.4+B在决策表S中是不协调的。3.3知识系统的简化3.3.1知识系统的协调性知识系统进行简化的前提是判断系统提供的数据是否协调。决策表是一类特殊而重要的知识表达系统,本文重点讨论决簧表的简化。下面介绍决策表协调性的判定。上文定义了决策规则协调性的判定,当决策表s中所有的决策规则都协调时,决策表是协调的,否则决策表就是不协调的㈣。可以使用条件属性和决策属性的依赖度芷c(D)来判断系统的协调性。依赖度Kc(D)定义如下:Kc(D):—car—d(P五OS亓C-(D))协调的,如果依赖度等于1,则决策表是完全协调的。3.3.2知识系统条件属性的简化对于数据协调的系统可采用如下两种方法对条件属性进行约简。一般方法124,33,45](3-9)如果决策表条件属性与决策属性的依赖度Kr(D)小于l,袭示决策系统是不设决策表系统为S=(U,IkV,厂).R=CUD是属性集合.C和D分别为条件属第三章粗糙集理论在数据融合中的应用性集和决策属性集,C=慨,。2,…,%}。对于每一个条件属性n,计算POSe,,q(D),如果存在POSc(D)=POSc\。.(D)则条件属性a,是可约简的,否则属性研不可省略。简化的条件属性集记为redD(c),条件属性核为cote口(c)=firedD(c)(3-11)(3-lO)基于可辨识矩阵的约简算法124,331约简步骤如下(1)根据决策表构造可辨识矩阵C。,(2)对可辨识矩阵中所有取值为菲空的元素c,.。(c,,』≠O,C:,,≠o),建立相应的析取逻辑表达式“JDF2口f∈VcⅣal(3-12)(3)对所有析取逻辑表达式P。进行合取运算,得合取范式P’p’c口。余,j.{opC(4)将合取范式p7转换为析取范式pP2Vp,(3.㈦(3-14)(5)析取范式中每个合取项对应一个约简的结果,每一个合取项中所包含的属性组成约简后的条件属性集。由于可能存在多个合取项,约简后的条件属性集不是唯一的。因此,基于可辨识矩阵的属性约简方法实际上得到决策表所有可能的属性约简结果。在实际应用中可以根据需要选取约简的条件属性集合。3.3.3知识系统决策规则的简化由上述可知,从决策表中分析得到的知识是用决策规则表示的。因此对决策规则的简化,实质就是对挖掘出的知识进行耩炼、提纯。可见,决策规则的简化问题是粗糙集理论的核心的问题之一。知识表达系统和决策规则常用的简化方法如下吼“”1:第一步:计算条件属性和决策属性的依赖度Kc(D),根据依赖度判断决策表是否协调;第三章粗糙集理论在数据融合中的应用第二步:对协调的数据表进行属性约简;第三步:对已经简化条件属性的决策表化简决策规则,算法如下{对于规则集合中的每一条规则;{对于该规则中的任意条件属性;{如果去掉该条件属性值,该决策规则不与其它决策规则发生冲突:则可以从该规则中去掉该条件属性。}}}经过决策规则约简后,得到最简决策规则,此时的规则集合中所有的规则都不含冗余条件属性。通过决策规则体现的蕴涵在数据中的知识也得到最大程度的精炼。3.4决策表离散化方法用粗糙集理论处理数据时,要求决策表中的值是离散的,如果某些属性值是连续的,则应在处理前对连续属性进行离散化。常用的离散化方法有:等距离划分算法、等频率划分算法、基于属性重要性离散算法等。等距离划分算法和等频率划分算法虽然简单,但是离散化过程不考虑信息系统的不可分辨关系,处理过程往往会改变系统原有的不可分辨关系.使用起来有很大的局限性。本文重点介绍基于属性重要性的离散化方法,该方法不会改变知议系统的不可分辨关系,应用范围广泛。基于属性重要性的离散化算法H01如下:(I)计算条件属性C={cl,c2,.-C。}各属性的重要性:根据重要性,按从小到大对条件属性C排序:若属性重要性相同,则按条件属性断点个数由多到少对c.排序。(2)对每个属性C,进行下面的操作:a)计算每个候选断点E,(,=1,2,..ir),E,=(c,(耳)+q(x,O)/2,(3—15)构成候选断点集。式中C,(‘)与c。(札)是条件属性i中,大小相邻的两个属性值。b)对于E,进行如下判断:把决策表中与Ej相邻的两个属性值中较小的一个改为较大的那个,如果决策不发生冲突,则在候选断点集中去第三章糨糙堡理论在数据融合中的应用除该断点:如果发生冲突,说明E,是必要的,把修改的属性值还原,并在断点集中保留£.。(3)对于最终得到的断点集,若某一属性的所有断点都被去除,则该条件属性可以约去。3.5粗糙集方法在数据融合中的应用3.5.1融合系统原理粗糙集作为一种数据挖掘方法也可以应用到数据融合中,用于获取融合的规则。融合系统原理如图3.1所示。过程如下:。数据挖掘过程图3.1融合系统原理图(1)选取数据库中的样本数据建立信息系统S=<U,R,V,f>,其中U=慨,“:,…,“。}为样本数据记录的集合。(2)如果有连续的条件属性,需要对其进行离散化处理,得到离散的属胜值。这一步属于数据预处理过程。(3)用3.3节中的方法分别对条件属性和决策规则进行约简,得到最简决策规则。(4)通过最简决策规则得到相应的融合算法。(5)输入相应传感器信息,获取融合结果。前4步是融合系统的建立过程,也可看作数据挖掘方法发现知识的过程,最后一步是融合系统的应用过程,即数据融合过程。第三章粗糙集理逾往教据融台中的应用3.5.2算法实例本文以空袭兵器类型识别口6l为例,说明粗糙集理论在目标识别级数据融合中的应用。将空袭兵器分为五类:第一类是TBM(战术弹道导弹):第二类是重型兵器:第三类是轻型兵器;第四类是武装直升机;第五类是诱饵。依据平时收集的资料和积累的数据,对空袭兵器的识别因素有:飞行高度(H,50m~30000m);发现距离(R<250km):飞行速度(V:50m/s~2200m/s);航线特征(Y:等高平直飞行,爬升,分岔,下滑及俯冲):电磁辐射(E:有辐射、无辐射)。由于空袭兵器突击目标时,其行为特征具有明显的规律,不同兵器的行为特征在某些因素上反映突出,而另一些因素又显得模糊。因此在类型识别时,应选取对类型反映突出的因素作为主要识别因素。通过粗糙集方法,不需要任何先验信息就可以剔除冗余信息,获得各类型的主要识别因素。样本数据如表3.1。表3-l样本数据‘56样本JlH(m)28000280002000012020003000030002500808000R(Van)240200210180220220200200200200V(m/s)15003008008030022004008080800YE目标类型l类II类III类爬升平直无有有有无无有有有无x2x3分岔平直下滑抽X5Ⅳ类V类【类Z6爬升俯冲平直下滑下滑Z1lI类Hl类Ⅳ类V类l抽X9,。。根据样本数据建立信息系统,S=<U,R,V,f>,条件属性C={H,R,V,Y,E},为方便起见,将条件属性抽象为C={al,82,a3,a4,35}决策属|生D={d)为目标类型。将文字特征用数字替代:航线特征Y(a。):爬升=1.平直=2,分岔=3,下滑=4,俯冲=5电磁辐射E(n5):无=0,有=l:目标类型(d):I类=1,II类=2,III类=3,Ⅳ类=4,V类=5。得到决策表如表第三章辊糙集理论在数据融台中的应用3.2所示。表3-2决策表U而X2q280002800020000i2020003000030002500808000a2幻15003008008030022004008080900口d(25d1234240200210t80220220200200200200l0l12奶。。24lIX5O011l05lX6X75244234妇‰xlO5(t)离散化属性数据粗糙集方法是对离散数据而言的,因此在进行处理之前。应首先对属性数据进行离散化处理。本文采用基于属性重要性的离散化方法,具体步骤如下:第一步:计算条件属性的重要性由于只需要对q、42、43进行离散化处理,此处仅计算这三个属性的重要性。IND(C)=“1},12},{3j,{4},{5),(6),{7},{8},{9},{10}},IND(D)2“l,6),{2,7},{3,8},{4,9},{5,10}},POSC(D)=U,POSc、。(D)=UPOSc、m(D)=UPOSn。,(D)=U酝q(D)2card(POSoq)/card(U)=lO,10=l=card(1…234,5,6,7,8,9,10}/card(U)同理《c、啦(D)21:.】ra旬(D)2第三章粗糙集理论在数据融合中的应用由于三个条件属性的重要性相同,应通过断点数目确定离散化的顺序。决策表三个属性的候选断点集为:E。l={100,1060,2250,2500,2750,5500,14000,29000)E。2=(190,205,215,230)Ea3={190,350,600,1150,1850}因此处理顺序为d1、q、a2。第二步:按顺序对条件属性。。、tTt3、a2进行离散化处理,得到表3-3。表3-3决策表U■X2dIa2d]dr405dl234300003000030000300003000030000300003000030000300002402402401802402402402402402402200123240l118008008080022008008080800X3X4X50O1l1051234)j615244X7,。l{。。,。。第三步:约去冗余的条件属性a.,改写决策表得到离散的决策表3—4。表3.4决策表UXldr2a3dda5d1222213221212324Oi1lOx2x334)XdJ522Z6310l第三章糖檄集理沦在数据融合中的j簟用。,2222lt252441ll23d。。,,m(2)约简条件属性2O5对属性数据进行离散化时,己经约简了部分的冗余属性。通过属性约简算法可以完全去除冗余属性。POSc、。,(D)={1,2…356,7,9,10},POSc\。(D)={1,3,4,5,6,7,9,lO},POSC\a4(D)={l,4,5,6,10}POSc\q(D)=U可见属性。5是冗余的,应当约去。约筒结果如表3.5所示。表3-5约筒的决策表Ua2a3dJd12f卸、。6);:222l2222322122l1】2324勺X44{X5、Jlo)X75234524xBX9(3)最简决策规则观察样本x.、z6,去掉属性n2、口3,决策不发生冲突,因此最简决策规则为(口4,1)斗(d,1),用相同原理处理其他样本,共得到8条舰则①(a4,I)斗(d,I):②(a4,5)斗(d,2):③(口3,2)^(口4,2)一(d,2);④(。4,3)斗(d,3):22第三蕈耜糙集理论在数据融合中的应用⑤和2,2)A(a3,1)A(a4,2)一(d,3)⑥(a2,1)一(d,4):⑦(啦,1)A(04,4)呻(d,4);⑧(03,2)^(a4,4)斗(d,5);(4)融合算法经过粗糙集的相关运算,约去了冗余的条件属性。在实际的融合过程中,不再考虑与这些条件属性对应的传感器数据。显然融合模型的输入维数得以降低。融合算法如下:{if航线特征=1、3、5(爬升、分岔、俯冲)fif航线特征=1,then目标是战术弹道导弹;if航线特征=3,then目标是轻型兵器;if航线特征=5,then目标是重型兵器i}if发现距离R≤180,目标是武装直升机:if(发现距离200≤Rs240)and(飞行速度50≤V≤80)and(航行特征=2)then目标是轻型兵器;if飞行速度300sys800fif航行特征=2,then目标是重型兵器;if航行特征:4,then目标是武装直升机}if(飞行速度50≤Vs80)and(航行特征=4),then目标是诱饵。Else拒绝判断;}通过上面的算法可知,该算法并没有覆盖整个论域,对于某些输入,无法进行融合做出判断。例如:当航线特征是2或者4,发现距离180<R<200,并且飞行速度80<V<300时,目标无法识别。这类问题是由于样本数据有限,断点两侧属性值相距较远造成的。通过此例可知,在使用粗糙集方法进行融合时,应使样本数第三章粗糙集理论在数据融合中的应用据尽可能完备,以防止拒判情况的发生。由于粗糙集方法主要针对离散数据,它的应用受到一定限制。要真正克服这种局限性,需要和其他算法相结合来解决。3.6本章小结粗糙集方法可以去除冗余信息,提取有用信息,并且不需要任何先验信息。这些特点使其可以方便的应用到数据融合中。通过离散化属性数据、属性约简、决策规则约简等方法提取最简规则,最后根据最简规则制定融合算法。仿真结果验证了算法的可行性。第四章神经叫络在教据融台中的应用第四章神经网络在数据融合中的应用4.1神经网络技术概述1943年MeCulloeh与wpitts合作首次提出了神经元模型,开始了神经科学理论的研究。1949年美国心理学家Hebb提出了神经元之间连接的变化规则,即Hebb舰则。20世纪50年代Rosenbatt提出了感知器模型,60年代Widrow提出了自适应线性神经网络。进入80年代,物理学家Hopfietd提出了FINN模型,引入了能量函数的概念,给出了神经网络的稳定性判据,由此,神经网络热潮得以再次兴起。在数据融合过程中,传感器提供的信息具有一定的不确定性,数据融合实际是不确定推理过程。神经网络可以根据已知的样本数据,通过特定的学习算法获取知识,得到不确定性推理机制。因此,神经网络研究为数据融合技术的发展提供了很好的方法。随着神经网络理论的发展,越来越多的学者将其应用于数据融合领域。例如:PongsakAjimarallgsee等人利用神经网络融合视觉传感器和红外传感器信息,进行图像处理;MalurK.Sundareshan运用神经网络融合多普勒雷达和TWS雷达完成目标跟踪;ThompouolosS,C,A,运用神经网络方法融合多种异构传感器信息进行目标识别卧5“。神经网络技术作为~种融合方法可以广泛地应用于数据级融合、特征级融合、决策级融合。进行融合时,多是利用神经网络的非线性逼近能力,通过对大量样本的离线学习,训练神经网络获得融合模版,最后在线融合多源信息。使用神经网络进行数据融合时,主要需要处理以下的问题:(1)确定网络类型与结构根据数据融合系统的类型和要求,应当选择合适的神经网络。常用的神经网络有BP网络、径向基(RBF)网络、Hopfield网络等。确定类型之后,根据融合系统,确定网络的拓扑结构,即网络的层数,每层的功能。(2)确定网络各参数根据所要实现的功能和网络类型确定各层的传递函数.如:sigmoid函数、线性函数、高斯函数等。(3)确定学习算法神经网络有多种学习算法,常见的有,感知器学习算法、误差反向传播(BP)算法,Hebb算法,遗传算法等。通过这些学习算法,对网络进行训练,确定权值,获取知识,构成融合的模版。第四章神经网络在数据融台中的应用4.2BP网络4.2.1BP网络模型在神经网络的应用中,很大一部分网络模型采用BP网络和它的变化形式,它是前向网络的核心部分。BP网络{35,42I模型分为:输入层、隐层和输出层,根据需要可以有一层或多层隐节点。结构如图4-1所示。“m翻4_1BP网络结构图传递函数一般为sigmoid函数m)=专(4.1)隐层第j个神经元的输出为H,=,(∑~t一巳),,=l,2,…·"(4.2)令,Ⅳ,=∑wF_一巳,则上式变为H』=,(,Ⅳ,)仁l输出节点计算输出为mY,=,(∑%H,一岛),,=1,2,…P(4-3)1=1令,』V,=∑_,Ⅳ,一岛,上式写为Y,=f(/N,)J=l上面的公式中Ⅵ,是输入节点隐节点间的网络权值,■f是隐节点与输出节点侧的网络权值。(如图4.1所示)4.2.2BP学习算法BP算法也称为误差反向传播算法(ErrorBack。propagationAlgorithm)[431,是一类有导师的学习算法,用于BP网的权值和闽值学习。第四章神经唰络在数据融合中的应用(1)误差函数第q个样本误差计算公式为E9=』——。-∑(%一Yql)2其中,tq,和y。f分别为期望输出和网络的计算输出。(2)权值修正公式对输出节点的公式推导如下8E一七!E。)_k一8E劫|av|?急eykaVt却l8pjlE是多个y★的函数,但只有y,与‰有关。其中嚣=净zctt-Yk,‘券叫卜川粤:熹孚=厂(/Nf)H,。i8Vl|8IN|8y?l’8E8P。|令输入节点误差为矗4=(ff—Yf)f’(Ⅲ,)则一d,饱aV。i对隐节点的公式推导如下嚣2莩莩筹参蔫E是多个y,的函数,对于¨,只有一个Ⅳ,与之相对应.因此有下式箦。≥:也叫,‘筹叫,,一川44-12)薏2盖券=厂c蚍警=,.c蛳_,(4.4)(4—5)㈤s,(4—7)(4.8)(4.9)㈤·¨(4.10)㈤㈩第四章T十经网络在数据融合中的应用当:生.孚:八删∥,01Ns钒u。(4.14)awu则熹2{盱",tcm抄q删¨铲乏砜。弋mJ诲¨。5y隐节点误差州%鹕(4.16)‘则旦%一嶂斗权值的修正量△一』、AXw“正比于误差函数沿梯度下降,权值修正公式如下%叫瓷卅lHj(4-18)Vjr(k+1)=■,(t)+△■,=■,(t)+口4日J毗叫嚣鹕7xw口(七十1)=wq(后)+△~=w口(七)+r/8,X,(3)阈值的修正对输出节点的公式推导8EaE卸l88i却{8eIiOE:(‘f—y∥f,(巩):4丽2【‘f一腑。(剧护6。&ej:H堕:q6’a口,舅(≈+1)=q(k)一rift对隐节点的公式推导aE℃aEay!eHi6e?■0yaH?00j(4.17)(4—19)(4.20)(4·21)(4.22)(4.23)(4.24)(4.25)(4.26)第四章神经网络在数据融台中的应用著一弘谢八圳¨㈣。手矾蚂=-暑卅,7只(k+1)=0,(k)一鹳厂’(IN)=J,(4-27)(4—28)(4.29)4.3径向基函数(RBF)神经网络4.3.1RBF网络工作原理径向基函数神经网络是一种前馈神经网络,常用三层网络结构,也可用于函数逼近与分类,结构如图4-2所示。电qlx—c-}1)o,(卜一%11)图4-2RBF网络结构图4—2为n—m.P结构的RBF网络,网络有n个输入,m个隐节点,P个输出。W∈R“9为输出权值矩阵,m,(Jl-一c,II)为第i个隐节点的激活函数。RBF网络最显著的特点是隐节点的基函数采用距离函数,并使用径向基函数(如高斯函数)作为激活函数。径向基函数关于11维空间的中心点具有径向对称性,而且神经元的输入离该中心点越远,神经元的激活程度就越低。隐节点的这个特性披称为“晨部特性”口“。RBF网络的每一个隐节点都具有一个数据中心。图4.2中c,就是网络中第i个隐节点的数据中心,㈩表示欧式范数。径向基函数中,可以采用很多形式.最常用的为高斯函数r2了of(x)=e其中口.是该基函数的宽度。输出层第,个的输出为q(4-30)第四章神经网络在数据融合中的应用ⅢY,=R(x)=∑W。,中脾一c。11)(4—31)悼】4.3.2RBF神经网络学习算法RBF网络学习算法需要解决以下的问题:确定网络和结构,即确定网络隐节点数目;确定各径向基函数的数据中心c,和宽度t3-,,修正网络权值Wff。RBF网络的设计方法主要有两种‘35州}:(1)数据中心从样本数据中抽取:这种方法数据中心从输入样本中选取,如难交最小二乘(OSL)算法。该算法的特点是数据中心一旦获得就不在变,隐节点的数目可以一开始就固定,也可以动态调整。(2)数据中心动态调整算法:这类方法数据中心是动态调整的,如各种基于动态聚类的算法、梯度训『练算法等聚类算法聚类算法是最经典的RBF学习算法,思路是先用无监督学习方法确定RBF网络中m个隐节点的数据中心以及宽度,再用有监督学习方法确定个隐节点的输出权值。确定输出权矢量w=【wll,w12,.wh,】时可以采用有监督学习方法(梯度法)训练获得。梯度法该方法通过最小化目标函数对数据中心、扩展常数、输出权值进行调节。设目标函数为,ⅣP,NP£={∑∑锄2=寺∑∑(o/一YjI)2(4-32)。j=lI=l。j=11=1式中r,,为第,个输出节点对应第j个输入矢量x,的期望输出,Y,,为实际输出Y圹∑~中徘,(4.33)数据中心、扩展常数、输出权值的修正公式为州卅-;军》i刷bl”州川却鼬)_△咿删+-莩莩≯刷卜c帜卜邮2㈤35’wft(k+1)=wil(k)+AWil=wa(k)+_∑∑8Ⅳm球厂。“)(4·36),1第四置神经网络在教据融合中的应用正交最小二乘(OLS)法正交最小二乘法从样本输入中选取数据中心.整个算法基于Gram—Schmidt正变化过程。OLS算法最显著的特点是可以确定隐层节点的数目,网络结构虽然不一定是最优的,但是网络规模相对较小。隐层节点越多,网络的精度越高,但网络的泛化能力随之下降,因此应在满足精度要求的情况下,尽量选择少的隐层节点。4.4模糊神经网络4.4.1模糊系统与神经网络模糊理论与神经网络技术是人工智能的两个重要分支。模糊理论基于模糊逻辑,具有模糊推理、非线性映射等功能,可以模仿人脑处理大量不完整的、模糊的数据。尤其在处理病态数据方面,功效卓著,而神经网络往往对此类数据办法很少。此外,神经网络的结构选择有一定盲君性,难以定性的表达知识。另一方面,神经网络具有模糊理论不具备的并行计算能力:其强大的自适应学习能力,亦可以帮助调节模糊系统的束属函数。因此,将模糊理论与神经网络相结合,将大大增强它们在智能信息处理中的能力。模糊理论与神经网络的融合的原理如下,由模糊推理机制确定神经网络的层数、每层神经元数目以及神经元的激励函数:用神经网络的并行处理以及自适应学习能力确定隶属函数等参数,完成模糊推理功能。这样的网络同时拥有模糊系统和神经网络的优点,它既能像模糊逻辑那样表达定性的知识,处理不完整、模糊的数据,又拥有神经稳网络强大的自学习,自调整能力。4.4.2模糊神经网络的结构模糊神经网络结构如图4-3所示。图43模糊神经网络结构图网络第一层输入的是精确值,第二层模糊化输入量,每个神经元表示一个模糊集合,图中Ⅳ为隶属函数。常见的隶属函数有以下几种:/'[triangle=max(rain(嚣,暑)’0)J—OC一03l第四章神经网络在数据融台中的应用fl:rapzo扩㈣(min(若^箬)'0)Ⅳ一犷exp{-;(等)2}‰“:l/1+(型)26前两层实现模糊规则的前件,第三层实现模糊与运算,图4.3中172∥。l。1(。1)乒走以(。2)…一月"。(x-n)(4·37)网络中第一、二层之间,第二、三层之间的连接权值皆为…1。第四层为输出层,W,为输出权值,第三层与第四层对应模糊规则的后件。由此通过神经网络,构建了完整的模糊推理系统。通过神经网络的学习算法,可以调整隶属函数的各个参数,以及输出权值,实现模糊系统的自学习,白适应。4.4.3基于径向基函数网络的模糊神经网络RBF网络实现模糊推理系统的功能需要满足如下的条件[36,471:1)接收域单元数目等于模糊规则的数目:2)每个规则的隶属度函数都选择高斯型函数;3)每个规则的启动强度采用各规则前件的隶属度值乘和;4)RBF网络和模糊推理系统使用相同的方法计算输出。用RBF网络实现模糊推理的原理如下:假设有m个模糊规则,每条规则有13个输入和1个输出,每个输入对应k个模糊集合.第i条规则的形式为:Rulei:IF置is一},。{andand晶isA目,hTHENYisM(,=1,2,…辨)式中一,,为第i条规则前件对应的0的模糊集合(‘=1∥2·^),叶为常量。输入向量x对于第i条规则的适用度t(x)表示为嗔(1)。p4,q(。I)卢屯,Q(。2)…卢~“(J一)(4_38)式中的隶属函数取为高斯型。由上所示模糊系统构建RBF网络,网络结构如图44所示。图中基函数为剐加时砉掣,2吵㈤实现模糊与运算,隐层的输出为规则的适用度。㈤。,,第四章神经网络在数据融合中的应用R。(x)图4—4基于I强F的模糊神经网络网络输出与模糊推理系统保持一致,采用加权平均法∑R,(x)‰yt2£L——一∑R,(x)(4.40)由上式可见,此类模糊神经网络本质上与普通径向基函数神经网络类似,区别在于一般情况下径向基函数神经网络的隐层是一个如高斯函数一样的非线性函数,而模糊神经网络隐层是一个高斯函数非线性组合的非线性函数,两者都是非线性函数.所代表的物理意义不同。学习算法本文采用误差函数负梯度下降算法,训练网络,更新网络参数。设目标函数为E:;兰壹(‰-Y/k)2其中N为训练样本数,p为输出单元数目。需要修正的参数为c扩_,、W“-修正公式如下荨弘砒,专丛R即等。‘“圳’y.。”(4.42)峨』叫挚渺呲,蚩幔警盯』(f+1)2cr/,(t)+△盯,f(4.43)(4—44)第四蕈神经网络在数据融合中的应用幽扩一喏寸驰∞女(t+1)=∞^(r)+Aco止‰(4,45)}争4.5神经网络在数据融合中的应用4.5.1应用原理由于神经网络广泛的应用于模式识别与分类领域,同理可以将其应用与身份融合中,实现目标识别级的数据融合。旧F、传感器特征提取数据特征向量X2,:神经网络融合系统X月图4—5神经阍络用于身份融合的原理圈使用神经网络进行身份融合之前,有时需要对传感器数据进行特征提取或者其它的数据预处理。本章主要讨论神经网络方法在融合中的应用,因此略去对输入数据的处理,从网络的输入端开始考虑。每一个输入节点(如图4-5中一、j2、…x。)代表一个特征元素(亦可为某传感器数据),输出Y代表目标类型。输出Y可以是一维或多维向量。如果是一维的则可用1、2、3--m代表m个目标类型;如果输出是多维可选Y为m维,n00…or、【010…ojr、【00Io…oIr、……【000…oqT分别代表m个目标类型。使用神经网络进行身份融合的系统,需要建立一个包含典型数据的知识库。知识库中的样本数据包括目标的各类特征信息以及目标的类型。使用这些样本数据对神经网络进行训练,输出误差满足要求之后,就可以使用神经网络进行身份融合了。应用神经网络进行身份融合的步骤如下[46,491:(1)对网络进行初始化,确定初始权值,隐层数目:第四章神经网络在数据融合中的应用(2)将样本数据输入网络,对网络进行训练,计算输出层的总误差,当误差趋于零时,网络融合学习过程结束;(3)将新的数据输入网络,输出层输出值最大的目标即为所识别的目标。4.5.2算例与仿真基于模糊神经网络的优越性,本文采用模糊神经网络进行仿真。对于某一交通目标识别系统,有如下四条模糊规则;(1)if目标面积大,and形态简单,and速度快,then,目标为汽车;目标为摩(2)if目标面积偏大,and形态复杂度偏小,and速度偏快,then,托车:(3)if目标面积中等,and彤态复杂度中等,and速度中等,then,行车:目标为自(4)if目标面积小,and形态复杂度大,and运动速度慢,then,目标为行人。上面所示模糊规则满足RBF网络应用于模糊推理系统的要求,因此采用基于RBF的模糊神经网络构造融合系统。网络采取多输入单输出的结构,输入mz,、z:分别是代表面积、形状复杂度以及运动速率的特征值,(已经经过归一化处理):输出Y代表四种目标类型,Y等于l、2、3、4分别代表汽车、摩托车、自行车、行人。每个输入变量分别对应4个模糊集合,各模糊集合隶属函数取高斯函数,初始形状如图4.6、图4.8、图4.10。隐层节点数目为4,与规则数目相同,激活函数如式453。网络输出权值w=[wl,W2,w3,W4】的初值选为[1'2,3,4]。使用40组样本数据对网络进行训练,学习算法采用负梯度下降方法.网络学40习速率取ool,误差函数取为E={∑(f,一y,)2,当压so.01时,停止训练。整个。1=I仿真过程在mad曲65环境下进行。经过135次训练,网络的误差达到要求。网络学习后,各输入变量的隶属函数如图4.7、图4.9、国4ll,网络学习的误差曲线如图4.12。经过学习后的模糊神经网络构成了信息融合系统。进行融合时,将特征数据输入模糊神经网络,经过网络运算得到输出,此输出即为特征融合的结果。图4-6面积的初始隶属函数图4—7训练后面积的隶属函数第四章神绎嘲络在数据融合中的应用吲4.8复杂度的初始隶属函数图4-9训练后复杂度的隶属函数图4.10速度的初始隶属函数图4.11训练后速度的隶属函数图4-12网络学习误差曲线为验证融合系统的可靠性与可行性,另外取40组数据对网络进行测试,测试数据可视为有待融合的传感器特征向量。(部分测试结果见表4.1)由表4-1可见,融合系统的输出基本与目标实际类型相符,从而证明利用模糊神经网络进行特征融合是可行的、有效的。第四章神经网络在数据融合中的应用表4.1测试结果。。x2奶0.984l0.82420704l0767805079049340.15860.5443类型112233dy1.OOl7l002509051o7324o4911033750203501845012370.1068O.12460120502016025900330904535096800768,02.0278188722.959730044.00013.979l4本算例构建的融合系统是一类典型的目标识别级的数据融合系统。融合数据为目标的特征信息,属于特征级融合方法。本文采用模糊神经网络建立融合系统。首先根据模糊规则,确定网络的基本结构,再用知识库中的典型数据对网络进行训练,调整各模糊集隶属函数及输出权值,完成目标特征信息到目标类型的映射,最后利用训练好的模糊神经网络对输入数据进行融合,获取目标的类型数据。4.6本章小结用神经网络进行多传感器数据融合,无需先验信息,训练好的网络可直接用于数据融合,克服了传统方法中难以获取先验信息的缺陷。集成了模糊理论的模糊神经网络的功能更为强大,不仅拓宽了神经网络处理信息的能力,将模糊推理机制蕴含于神经网络结构中,而且神经网络强大的学习能力使模糊推理系统可进行自学习,自适应,大大提高了融合系统的融合能力。仿真结果验证了该方法的可行性。第五章数据挖掘与数据融合集成系统的宴现第五章数据挖掘与数据融合集成系统的实现5.1数据挖掘与数据融合集成的原理数据挖掘,又称为知识发现,是从大量数据中提取出可信的、新颖的、有效的并能被人理解韵模式的高级处理过程。数据融合是指对多组传感器数据进行多级别、多方面、多层次的处理和组合,从而产生新的有意义的信息。数据融合的基本目的是通过多传感器收集的数据对环境进行识别和预测。数据挖拥实质是通过目标实体的历史数据去形成对之的理解。数据挖掘着重模式的发现,而数据融合则着重于对模式的应用。当前的数据融合主要依赖于凭直觉建立的模型,但实际目标的行为相当复杂,难以检测和分析,建模非常困难。利用数据挖掘的自动建摸能力能有效地解决这个问题。用数据挖掘技术辅助数据融合的原理表述如下:多传感器中采集到的数据存放在数据库中,经过数据预处理、数据挖掘处理过程,得到较准确描述传感器所有环境的模型,用于指导数摒融含中五级融合过程中各层次信息的抽取。前面的章节主要介绍了数据挖掘方法在融台中的应用,实际上两者互为补充,可相互作用,形成一种闭环系统。一方面,数据挖掘从已有的知识库中获取知识,将其作为数据融合的模型:另一方面,数据融合以发掘的知识为模版对新数据进行处理,这些新数据又被存八知识库中,使知识库更完备、史准确,降低了数据源的模糊性和不确定性,再次进行数据挖掘,所获得的知识更可靠,以这些知识为模版的融合结果也更准确。由此实现良性循环,使融合系统的精度不断提高删。数据融合和数据挖掘的集成有几个方面poJ:(1)数据级集成:融合原始数据。数据融合在多个应用领域的低级数据处理方面积累了成熟的技术成果,能有效地组台数据,存入数据仓库或送入数据挖掘模块。(2)模型级集成t数据挖掘自动发现的模型用于控制数据融合。这里的模式包含各个层次,分剐用于不同级的融合。数据融合的结果也是对数据挖掘结果的验证,判断数据挖掘得到的模式的意义,再去调节挖掘模块的参数,以获得更接近实际的模式。(3)系统级集成:综合多个各类过程其同完成分析任务。数据融合由于应用本身数据分散的特点决定其系统结丰句的复杂性。数据挖掘看似只需用简单的顺序模型,但实际的数据过程是相当复杂的:涉及多数据集从而有多分析工序:数据之阳]会有各种联系,使数据分析过程变复杂;有时要同时挖掘多种模式,还要使用几种技术;数据分析投有万能方法,往往需要反复进行试验,分析比较试验结用几种技术;数据分析投有万能方法,往往需要反复进行试验,分析比较试验结第五章数据挖掘与数据融合雍成系统的实现果,最后才能得到合适的结果。因此数据挖掘处理过程本身就有融合的要求,需要借用数据融合的技术。(4)算法级集成:算法研究的主要目标是效率、精度、可理解性和泛化能力,一般思路是融合多种基本算法。例如将前馈神经网络与符号逻辑结合起来提高精度与可理解性,还可再融入遗传算法来优化网络。(5)思维级集成:很高智自2程度的集合。如达尔文从生物现象中抽取出柬的进化思想与计算机技术相结合,成为进化计算,再应用回数据挖掘和融合中。又如数据挖掘与数据融合的集成本身也是~个思想的融合。由于思维问题仍是科学界的重大难题,集成系统以此为目标,是一种在实现方法上的探索。(6)反馈:高级融合或挖掘的结果反馈回去调节下级,来增加精度,减少代价等。图5.1是简单地描述集成数据挖掘和数据融台技术的知识处理系统:囤5—1集成系统塘理图图中传感器从外部环境采集进来的数据经过一组数据融合和数据挖掘部件的反复处理。数据挖掘器的输入是存储于知识库中的典型数据,通过相应处理获得用于数据融合的模型:另外挖掘器也可以直接作为自适应、自学习的融合器。根据数据挖掘获取的融合模型,对传感器新输入的数据进行融合处理,并将传感器数据与融合结果存入知识库。补充了大量新数据的知识系统可以重新进行数据挖掘,进行新一轮的知识处理过程。知识库中的数据和模式用作数据挖掘的背景知识、结果验证,数据融合的模型.以及对挖掘和融合进行控制。5.2建立集成系统模型5.2.1粗糙集与神经网络的集成神经网络作为人工智能的热点一直以来受到广泛关注,然而其在应用中却存第五章教据挖掘与数据融合燕成系绕的实现在一定局限性。这主要表现在专家系统的知识获取瓶颈和脆弱性等问题上,神经网络也存在知识的黑箱性,决策过程的难以解释性等问题。通过与模糊理论的结合虽然可以使网络推理过程变得透明,但仍然存在一些问题”w:(1)初始知识库的获取,如初始的模糊规则。目前专家系统的开发,知识库多是通过知识工程师从领域专家获取.也有用实例归纳学习的方法获取知识的系统,存在的不足是大量实例收集的工作量大,难以保证专家例证的全面性、完全性和有效性。(2)初始规则库的约简。一般的智能系统,知t}{库经常有几百,上千条规则如此繁多的规则若全用于转化为神经网络,则网络的规模就会很庞大,造成网络的训练困难。这些问题单靠网络本身很难克服,需要集成其他的技术帮助解决。粗糙集是一种新的知识获取技术,它通过不可分辩、约简等概念,能从不完全、不确定的专家实例中获取可信度较高的规刚支持决策。粗糙集的优势在于能够有效去除冗余,而且不需要先验信息。特别值得注意的是与其它软计算方法广泛的集成能力”1I,尤其和神经网络的融合,能够缓解上述问题。粗糙集理论处理的对象用属性描述,这些属性可以是符号型属性,也可以是连续型属性。由于粗糙集不能直接处理连续型属性,所以连续型属性需要离散化。离散化后取值仍是符号型属性,因此粗糙集可视为~种符号型知识的挖掘工具。租糙集理论通过对数据集的约筒,浓缩蕴涵在其中的逻辑规则,用于推理或预测。它基于不可分辨性的思想和知识约简的方法,把数据中推理逻辑规则作为知识系统的模型,可以输入定性、定量或者混合性信息;定义条件属性和决策属性间的依赖关系,即输入空间与输出空间的映射关系是通过简单的决策表约简得到的,而且通过去掉冗余属性,可以大大简化知识的表达空间维数:可以描绘知汉表达中不同属性的重要性,进行知识表达空间简化,从训练数据中获得推理规则。粗糙集的知识获取过程,实质上是基于实例的归纳推理,因为它推导出的决策规则是决策表部分的数据之间的依赖关系。粗糙集理论的知识约简方法可以利用并行算法实现,神经网络的最大特点之一就是无须现实函数表达而完成并行处理,且有容错和抗干扰的能力。相糙集与神经网络的对比如表5-1所示,通过对比可知,粗糙集与神经网络有许多互补之处,是粗糙集与神经网络集成的基础。表5-1粗糙集与神经网络的对比【5类比方面租糙集定性、定量或混合信息通过规则定性表达知识无需决策表外的任何先验知识神经网络主要是定量信息.缺乏语义知识表达有黑箱性网络结构设计需要经验和试探}处理数据可解释性先验知识第五章数据挖掘与数据融合集成系统的实现冗余数据处理自学习知识发现可推广性集成性能够确定决策表属性及属性值的重要性,去除部分冗余数据目前自学习方法少见通过对数据集的约简获取知识较弱几乎和所有的软计算方法可以紧密集成一般难以约简很强的自学习能力非线性映射极强的泛化能力和模糊集、粗糙集、遗传算法有较强的结合能力粗糙集和神经网络最常用的结合方式是粗糙集作为神经网络的前端处理器。这不仅可以减少网络学习所需的数据量,浓缩数据蕴涵的规律,改善网络因数据量大带来的效率问题,同时使网络有较好的泛化能力和预测精度。其基本的思想是先对连续属性量化,然后用粗糙集理论对量化的属性进行优选,以便确定最简C所含属性最少)的网络输入,减小网络规模,提高训练速度,节省了测试费用和时间。粗糙集神经网络智能系统的缺点是粗糙集与神经网络的结合松散,粗糙集对数据集的约简仅仅是属性约简,并未涉及属性值域约简,即样本中的冗余数据没有完全排除。为了更有效的去除冗余数据,也可同时进行属性约简与属性值域约简,与单进行属性约简的方法相比,网络的训练速度更快。另一种常见的集成方法属于强耦合p“,结合了粗糙集与神经网络的优点。原理如下:先用粗糙集方法处理数据,得到初始规则,再由神经网络进行调整、细化。由上文可知,模糊推理与神经网络相结合,虽然可以解释神经网络的推理过程,但没有涉及初始的领域知识如何获取的问题。初始知识库不仅关系到网络的初始结构,其质量也直接关系到知识精化的效果。粗糙集能够对不完全、不确定的信息进行有效的预处理,去除冗余数据,提取有用信息。通过集戒粗糙集方法可以为神经网络的构造和学习提供赵好的前氍系统。以模糊神经网络为例,体现这几种方法集成的作用。模糊神经网络中蕴含的模糊规则,避免了神经网络在知识表达中的黑箱性,但模糊规则的获取存在困难,是模糊神经网络应用的障碍。根据粗糙集规则约简的功能,可以通过粗糙集方法确定初始知识.帮助解决初始模糊规则获取的问题。5.2.2基于粗糙集——模糊神经网络的集成系统模型本文采用粗糙集——模糊神经网络建立数据挖掘与数据融合集成系统。粗糙集是一种处理不确定性问题的方法,它在提取特征,消除冗余数据方面有显著功效a粗糙集作为一种数据挖掘方法,同样可以应用于数据融合中。使用粗糙集方法进行数据融合虽然简便易行,但是由于粗糙集方法本身的局限性——例如,半日糙集方法不具备推广性,很难处理新数据,并且对连续性数据办法不多——使其应用范围很难推广。同理,模糊神经网络虽已广泛的应用于数据处理中,但也f_J第五章数据挖掘与数据融合集成系统的实驻样有自身的缺陷,例如,难以获取模糊规则,很难约简冗余数据。上述两种方法虽然各有不足,但在功能上可以互补。模糊神经网络可以对数据进行离散化处理,且具有很强的泛化能力,可弥补租糙集的不足:同时,粗糙集约简算法可降低网络输入数据的维数,缩短网络训练的时间,通过约筒获取的初始规则,避免了网络构造的困难【56J。因此,本文将车且糙集与模糊神经网络技术相结合,柬建立集成系统模型。图5.2是基于粗糙集——模糊神经网络的数据挖掘与数据融合集成系统工作原理图。输送新知识到数据库嚣出壅U升世,曙i尝”r-1差{广—叫训练网络Rs约简规则鼍㈡。坠仁却鬲扔规则竺l嚣I姗了库~输数奄『传感器数据连续数据一入据询图5—2集成系统=I=作原理系统的工作分为两步。第一步,通过数据挖掘算法获取数据融合的模版。具体步骤如下:(1>从知识库获取原始数据,进行离散化得到初始的决策表。再由隶属函数获取算法得到各模糊集的隶属函数。(2)对离散化的决策表进行属性约简,去掉冗余属性,获得最简决策规则。(3)以最简决策规则为模糊推理系统的模糊规则,训练模糊神经网络。网络输入层节点数与决策表条件属性数相同,规则层节点数与决策规则数相同。第二步,融合传感器数据并补充数据库。用挖掘出的模版——模糊神经网络对传感器数据进行处理,获取融合结果。具体步骤如下:(1)进行融合之前,首先通过查询数据库判断传感器数据是否为新数据,如果不是新数据,直接输出数据库中存储的融合结果。(2)如果是新数据,则将传感器数据输入神经网络,经过网络运算获取融合结果。(3)将传感器数据与融合结果一起存入数据库中,以降低其中数据的模糊度和不确定度,并为下一轮数据挖掘提供更加完备的数据。第五章数据挖掘与数据融合集成系统的实现(4)如果数据库添加了大量有代表性的新数据,可以进行新一轮的集成处理,以提高数据融合的准确性。5.3集成系统各部分算法研究5.3.1算法整体介绍集成系统的算法流程图如图5-3所示,主要的步骤如下:(1)学习样本集的输入:从收集的原始数据中产生,数据的多少取决于许多因素,如神经网络的大小,测试的需要及输入输出的分布等。其中网络大小晟为关键,通常较大的网络需要较多的训练数据;对数据预先加以分类可以减少所需的数据量。(2)连续属性值离散化:粗糙集方法是一类符号化分析方法,所有的属性值均看成定|生数据,若定量数据要和定性数据综合处理.则需将定量数据转换成定性数据。因此对连续属性值离散化是粗糙集理论应用的关键问题之一。粗糙集理论拥有自己的离散化方法,但应用范围有限。此时,可使用更为通用的模糊聚类方法对连续属性量化。(3)构造决策表:数据库中储存的数据分为两大类,各传感器输入数据以及融合结果。以各传感器的输入作为决筻裹的各条件属性,融合结果作为决策属性,将离散化的数据写入表中,构成决策表。(4)确定最简规则:用粗糙集理论的属性约简算法对决策表进行处理,寻找属性间关系,获取最简规则。决策表去除了冗余属性,成为约简的决策表。(5)获取初始隶属函数:约简的决策表中每一个离散数值对应一个模糊集,因此,离散化的结果直接决定各输入对应的模糊集的数量。通过求取隶属函数的算法,对离散化过程中一些相关数据进行处理,可以求得各模糊集扔始的隶属函数。最简舰则的前件经过模糊化处理后,这些规则即成为模糊规则。求取的隶属函数显然比随机获得的隶属函数更贴近真实值.模糊神经网络的训练误差也会收敛得更快。(6)构造模糊神经网络:通过模糊规则确定模糊神经网络的基本结构。网络的输入zl、x2、x。对应约简后的条件属性Cl、C2、C。,由求得的隶属函数以及相关参数切始化网络。用约简后形成的学习样本对神经网络进行学习和训练。(7)测试:以上步骤都是数据挖掘过程,测试部分可看作数据融合过程。通过测试可以检验数据挖掘方法的可行性,融合模型的有效性。(8)经过一段时间的融合过程,如果数据库中输入了大量新的数据,可以重新进行数据挖掘,开始新…轮的信息处理过程。第五章数据挖掘与数据融合集成系统的实现数据:数据图5-3集成算法流程图44第五蕈数据挖掘与数据融台集成系统的实现5.3.2连续属性值离散化算法由前文可知,离散化方法主要分为两大类:粗糙集离散化方法以及其他方法。粗糙集离散化方法在处理数据时,要求数据离散程度较小,造成应用中很大的局限性。因此本文又介绍了另一种离散化方法,模糊聚类方法,可根据实际的数据选择使用。粗糙集离散化方法粗糙集离散化方法很多,但原理一致:求各条件属性的断点,用这些断点将属性值分为若干段,每一段代表一个语义,求取断点过程中.要求信息表的不分明关系不变。本文采用基于属性重要性的离散化方法,它是获取隶属函数的第’’步,该方法通过属性的重要性求各属性的断点,由此确定模糊集合的数目和大概范围,为确定隶属函数做准备。模糊聚类方法本文介绍一种FCM(模糊C均值)算法‘46I对数据进行离散化,使用此方法还可获得各条件属性值隶属于相应离散集的隶属度,为下文获得隶属函数奠定基础。令决策表样本集为X={J.,X:…x。},共有K个条件属性,表示为P={q|i=1,-t)。离散化决策表时,应当针对每一个条件属性分别进行离散化处理。下面,以第L个象件属性为例,介绍模糊聚类的方法,由于所有条件属性的聚类方法相同,为方便起见在公式中不对L进行标注,并用』代替对象x.的第L个条件属性即吼(‘)。聚类数c由用户指定,V“’=(vl“,V11,,v∥)和u“’=阻∥】。。,。。分别表示经过t次迭代的聚类中心和模糊分类矩阵。式中以表示样本z,隶属于类别i的隶属度。FCM算法的目标函数Jm(U,矿)=∑∑(一)”《2,t=Ij=l(5-1)其中d;,定义为x,与第i个聚类中心"12,的距离彤爿ix,一■nm∈[1,00]是权指数。算法过程描述如下:(5-2)(1)确定C(1<c<n),m∈[1,叫,初始化矿‘o’并令迭代次数#l:(2)利用公式第五章数据挖掘与数据融合集成系统的实现心=(d。)21(1m)/[∑如2111-m}】(5·3)计算第t次迭代的模糊分类矩阵u‘(3)由u“’和公式v,=号一,∑∥?j=l∑∥?x,(5—4)更新V“k[v”v黔…v㈡;(4)若max{|卢?’一∥?。’}ss(5-5)(g为预设的小正数),则迭代结束,否则令Fc+1,转入步骤(2)。该方法中,聚类数c的确定是一个难点。如果c值取小了,很可能会引起决策冲突,即信息表中两个或多个对象的条件属性值相同而决策属性值不同。若c值取得过大,离散化的效果就不好,网络的结构也会比较复杂。为解决这一问题,可以将模糊聚类方法与粗糙集离散化方法相结合,对连续属性值进行离散化处理。首先用模糊聚类方法对连续数据进行处理,聚类数c可以取得比较大,保证知识系统不出现冲突;再用粗糙集方法进行进一步的离散化处理,得到离散的决策表。两种方法相结合,既突破了粗糙集离散化方法的局限性,又避免了模糊聚类方法引起知识冲突。离敖化程度不高的问题。下面,通过粗糙集属性约简算法,约去冗余的条件属性及条件属性值,得到约简的决策表及最简规则(具体算法见第三章)。这些规则的规则前件经过模糊化处理后,即成为模糊规则,为构建模糊神经网络奠定基础。5.3.3获取初始隶属函数的算法一般在构造模糊神经网络时,要么由专家给出初始隶属函数,要么随机取隶属函数,很少专门讨论获取隶属函数的方法。本章提及的模糊神经网络是与粗糙集相集成的,粗糙集在离散化连续属性的过程中.已经获得了一些关于模糊集的信启、,因此本章提出的获取隶属函数的算法是与离散化算法密切相关,以离散化算法为基础的。此外,算法处理的数据源自约简的决策表,并非原始决策表。算法~如果离散化过程采用模糊聚类算法,则采用下述方法获取隶属函数:假设对第i个条件属性x,进行模糊化处理,由于对每一个输入的处理方式相同,为方便起见不对i标注。隶属函数采用高斯型,第j个模糊集合A,的隶属幽第五蕈数据挖掘与数据融台集成系统的实现数为删一p卜孚m-l,z,小式中C为模糊聚类数。隶属函数中心取为聚类中心o,;求aj的算法如下:仔6)设用于聚类的样本数据为小z2一h,查询对于聚类中心。J,隶属度值最小的样本数据,设为x。m,对应的隶属度值为一,mm,将x。与一。。。带入式5-6,可求得a;。算法二如果离散化过程采用粗糙集方法或者模糊聚类与粗糙集相结合的方法,则采用下述方法获取隶属函数:离散化算法求得的断点可以将条件属性分为若干段,但断点附近的属性值仍具有一定的模糊度,需要进行模糊化处理。下面通过断点和断点临近的条件属件值来构造模糊隶属函数。由前面的概念可知,为保证知识系统不出现冲突,断点两侧的属性值应隶属于不同的模糊集合,两者对于同一模糊集合的隶属度值之差,应该大于一个指定值f(一般大于0.6)。通过这种方法可以保证离散化前后,信息表的不分明关系不变。不失一般性,假设对第1个条件属性(即网络输入)站进行模糊化处理,由于对每一个输入的处理方式相同,为方便起见不对i标注。确定隶属函数时,要处理三种数据:断点,断点两侧相邻的条件属性值,最大和最小的条件属性值。设共有n个断点(用El、£2、E。表示),则有n+1个模糊集合(用Ao、or·』.表示),第J个断点为Ej,£,左侧相邻(小于E,的最大属性值)的属性值为。/,l·右侧相邻(大于£,的最小属性值)的属性值为。^,,该条件属性中最大的属性值为cm;,最小的属性使为cmin。隶属函数采用高斯uj(x)=exp(一!三二:止)盯j(5—7)(1)求模糊集合A,的隶属函数(J=1,2,…n—1)确定第j个模糊集合4,时.要通过左右两侧的断点才能确定其范围,因此应同时考虑断点Ej,Ej+l。勺右侧的属性值。,,r属于第j个模糊集的隶属度值应尽可能的大于Ej左侧的属性值。,,属于第j个模糊集的隶属度值,同时为了使隶属函数尽可能的平滑,应取满足f的最大方差值a同理,Ej+I左侧的属性值q+1,,属于第J个模糊集的隶属度应尽可能的大于其右侧的属性值cf+l∥通过以上算法,可以保证断点两侧的值属于不同模糊集合。由于通过Ej和EJ+I及其相邻的属性值求得的方差不同,应选择其中较小的一个。隶属函数中心取为aj=(日+Ej+1)/2,选取参数q的算法如下:(5-8)t求噼印c专笋一砸专≯州砒嗍∥;{If(1llax≤。.6)then。,,,2=(乃,f)2:泞∞a;,t=max{(o-j,,)2exp(二!;:;j;;!!:·一ex—c二!;:;笋,,。a;cs—t。,o'j,r2=(口j.,)2;求m“tex—c二!!苦等等,一ex—c二生暑;亏2,,以及此时的ca知,2:幅叫·,{If(max≤o,6)then。…№j.r)Z矿(盯i,≤盯川2)盯;=盯J2.,;eIseIexp(i等笋hx烈等萨Ⅲs㈨吨,(5-t3)(5—14)J;=。川2第五章数据挖掘与数据融合集成系统的实现表5-2决策表以表52所示信息系统为例,对于条件属性A,UA8lO12B205dll共有两个断点13、17,三个模糊集合山、Al、A2。模糊集和Al的中心al=(13+17)/2=15,l23151020101515OlCl,l-12,c¨=14,c2,=16,c2,e=18,df』=3.64,口己=3.64,因此df=3.6445614141216180lOl(2)求模糊集合山的隶属函数78∥o(。):exp(一垒三挈上)盯d(5一15)ao=(Cmin+C1.1)/2,∥o(EI)=o4带入方程求得J;。(5—16)对于表5-2所示系统的条件属性A,钆=(8+12)/2=10,(9-j=9.8(3)求模糊集合A。的隶属函数硝。):exp(一坠黑芒)a月=(cm“+c".,)/2,∥。(E。)=o(5一17)(5一18)4带入方程求得口;。8)/2=l对于表5.2所示系统的条件属性A,口2=(18十I8,J;=15.3.4构造模糊神经网络模糊神经网络的结构为简便起见.假设约简后的系统为(cl,c2,D)即两输入单输出的知识系统。决策规则表示如下:R‘:IFX1isAjandx2isAi,THENyisdx,、z:是系统的输入变量,即精确的条件属性;A0《分别对应模糊集合。第五章数据挖掘与数据融合集成系统舶实现Y为网络输出,即决策属性。i=1,2一/72,m是规则总数。设‘、x:分别对应3个模糊集合,共有9条规则,决策属性的数目为3。粗糙集模糊神经网络可以采用5层网络实现。,j表示第k层第j个节点的输入,o÷表示第k层第j个节点的输出,网络拓扑结构如图5·4图5—4网络的拓扑结构第一层为输入层,每个神经元代表一个输入变量,变量值是精确的条件属性值,节点数与条件属性数目同为2。Ji=“(k-1,2)o:=,2(5-19)(j20)第二层为模糊化层,用以模拟粗糙集规则莳件的离散化。第一层神经元只与表示其离散集合的第二层神经元相连,连接权值为…1。通过上文介绍的算法,可获得各模糊集合的高斯型隶属函数。将各隶属函数的参数带入相应神经元激活函数中:圪=o{(k=l,2)(5—21)阮:e。p(一盟=芷).(1:1,2,3)仃五(5-22)即得到xl、x2映射到相应模糊集的隶属度值。第三层为规则层,实现粗糙集规则匹配的功能。本例有两个输入,每/卜输入有3个模糊集合,因此共有9条规则,需9个节点。若第二层神经元对应的离散值是某条规则的规则前件,该神经元与相应规则层神经元的联接权值即为…1’,否则为“0”。规则层的输出体现某条规则的适用度,本文用第i条规则条件属性的第五章数据挖掘与数据融台集成系统的实现隶属度乘积表示规则的适用度,公式如下露=魄谚,(5-23)0;;,;(滓1,2,3)(j。1,2,3)(s·24)第四层为结论层,该层的节点数与决策属性的类型数相同,本例中有三个节点。第三层神经元与第四层中代表相应结论的神经元相连,表示该规则推断出某条结论。该层的连接权值设为co,:/』?=∑∑四mp,oP=,,(,=1,2,3)(5—25)(5-26)式中q“表示决策规则的可信度,初值选为相应规则的可信度。决策规则可信度计算公式如下:一掣掣,舡皆of=,?悖:,,其中‰代表第k条规则,D^代表第k条规则的决策属性类,Rx代表针对该规则的第i个条件属性所作的分类。当决策规则不发生冲突时,肛=I。当决策靓则出现冲突时,“<1。第五层为输出层,节点数与决策属性个数一致,该层的功能是去模糊输出精确量。本例中节点数为“r。㈤z引参数6。为决策节点对应的决策属性值。6,数值保持不变,不用对其进行调节。如果约简后的知识系统是协调的,即没有规则冲突,网络可以简化为四层结构。四层网络与血层网络差别在于没有结论层。两类网络前三层的网络函数相同。四层网络中输出层的输出权值为嘶,呦会随网络的学习过程发生改变,但仞值仍选为决策属性值。输出函数如下:私旨cs-z”第五章数据挖掘与数据融台集成系统的实现o}=,?网络结构如图5.5输八层模糊化层规则层输出层图5-5四层网络结构网络的学习算法对于五层网络,采用BP算法来修正网络的可调参数“F、8F、吩,。定以目标函数为E=÷耋c靠N为训练样本的数量。(5.30)设总的输出为y,显然y=oi。通过式5.24—5.29可得户it蕊J户专袁蒜∑b,∑∑四。叫i(5.31)tli∑b,∑∑瑶%。胛∑,6oy72幻%∑,∑,守厶。,瑶o,2幻吩∑6,∑∑嘶%%,(∑∑哟。口,)1,i1J(5-32)(∑∑∑o。2。u:2,m,f)2∑6,∑D五m吖y(∑∑醛。w)∑唧』=L1扩钉一∑(西一y)∑屹m”,∑彰1(5—33)第五蕈数据挖掘与数据融合集成系统的实现同理劫∑(6f—y)∑D0。F,∑四,ao缶(5.34)掣:丢(,一㈦ooh(5-35)矿£等专(…d:盯未。”’(5.36)a盯b一OE:丝旦监a口h印a00Oak,(5-37)_(r一,)“,{()C--ak;)D:口盎(5-38)一OE:丝旦篮80"卸碱?aoh:一(r—y)sk。;(X-口lkr)2嚷盯矗OE(5.39)OE加(5—40)Owot匆却m将式5.30代入≤坠=————L‘L』—;i寻耳———L——}—L——~(∑∑Zob∥)26fo;(∑∑∑四。,,)一(∑岛∑Zo¥o,∥)四知吖(5.41)“’:皇堡:垡(bl—y)o;(5.42)嚣叫一,麓㈣utEZEob0-,ZEZobo,(5.43)>>>oi∞“对于四层网络,同样采用BP算法来修正网络的可调参数叼、。F、02口。对于四层网络,网络的输出表示为:第五章数据挖掘与数据融合集成系统的宴现∑∑嘭。F__'气"O,2。0。2/。F—!!———!——————一:——』.—..!......—,———一∑∑噶ii(5-44)∑∑oj吆il推得也一。专两∑(m口一,)o为(5.45)J如,2面/』∑(mF—y)oj(5-46),o,fJ—OE:堡旦盟Oakieya哦|8d“盯玉一(丁一y)氏÷o—dh).oZOE—oEOy峨00-k,(5.48)ao-ki咖a00=一(r—y)J“÷(X--cgM)2·D磊仃己aEaEav旦:卫ZZo,;00·/100J0.匆e嗡(5-49)旦:一rr0∞H"赢0:;(5.50)5.4算例与仿真本文以目标识别级的融合为例,检验粗糙集——模糊神经网络算法构造集成处理系统的可行性。表5-3是4种物体在三个波段中的传感器数据,三类传感器数据组成条件属第五章数据挖掘与数据融合集成系统的实现性集A=扣l,02,a3}。目标类型为决策属性集D={l,2,3,4},分别代表四种地形:水域、沙滩、阴影、森林[601。算法的具体步骤如下:(1)采用基于属性重要性的方法对数据进行离散化处理。条件属性nI的断点集E。={1.4.5},得到两个离散集合{I2,1.3,1.4}、{1.5,1.6,1.71:条件属性。2的断点集易2={1.35{,对应两个离教集合{1.2,i.3)、f1.4,1.5,l6}:条件属性q的断点集E∞={1.05、2.15},对应三个离散集合{0.8,0.9,1}、{1.1,1.2,1.3,1.4,1.5,1.7,1.8}、{2.5,2.8,2.9,3)。经过改写后,得到离散的信息表如表5-4、5-5所示。表5-3原始样本数据[删Udla2表5—4离散数据样本U口I口2a3表5-5离散数据样本Uqla2口3ll0.80.80.9ll1.21.4l2l3DDq000001D116141.41.51.614l2l3l4l41ll2341l7l4141.71.71.61.31.3161.6l6161.6t6lllllll,81.8I.8l8l81.8l81.8t_8】.833333l1l1l22222333334444423456789110011ll1lL1lll23400llIlll222rl22222333334444461.51.617161.6I2l3I41.3131.3l3l6l4l5l41.4l51.61.6L5l51.4l41.5ll678910111213141516171819201.7l7l7171.71.41.41.41.41.4141.41.7I4l7II·8910£I1213141516i71819201111OO00000I0l11lll1Ill222222233330444446lOL£1213141516171.5I71.51.8l8292832925I6l616l_61.616l6lllIl1l441.51.61.41.6l6【18【19201.6第五章数据挖掘与数据融合集成系统的实现对表5—5的数据进行归并,得到决策表5-6。表5-6决策表数量253352口1a2a3D000lll0lL10lI3412O121l24(2)属性约简采用可辨识矩阵的方法对决簧表进行约简处理,可辨识矩阵C如下0a2a3d2c/3010q口3ala3aIa2a3口n0C=qala3a130盹叩o00q印。p1=(912P2v43)^(c12VVa3)A(qvV02va3)^(olvc12v。3)2t23A(aIa3)^aI^(al03)P3=(al。口3)A(alv口3)卢42口3^03P52a3p=Pl^P2^P3^P4^P52q“吒由上式可知条件属性a2是冗余属性。约去冗余条件属性,得到约简的决策表,如表5-7所示。表5~7最简决策表【数量25口l∞0lDOO13第五章数据挖掘与数据融合集成系统的实现30Il12Ol4L24}3{5f2(3)计算初始隶属函数2采用5.3,2节的算法对约简后的条件属性集{。。、。3}进行模糊化处理,得到初始隶属函数如图5—7、5—8。(x=(xlz2)为神经网络的输入向量,分别对应条件属性叩日,)。卢o(XI)=exp(卢101)=cxp(誊耐盹,=exp(-%笋,H(x2)=expc一%笋,盹胁烈一%笋,(4)模糊规则对应最简决策表,共有以下六条模糊规则:①②③④⑤⑥如果传感器q输入为…0,传感器吼输入为…0’,目标为水域;如果传感器矾输入为“099传感器m输入为…1’,目标为阴影;如果传感器∞输入为…0’,传感器玑输入为“2”,目标为森林;如果传感器∞输入为“l”,传感器a,输入为…0,目标为水域:如果传感器吼输入为“L”,传感器n,输入为“L”,目标为沙滩;如果传感器矾输入为…1’,传感器a,输入为“2”,目标为森林;(5)构造神经网络出于知识系统是协调的,即没有矛盾的决策规则.可采用四层网络构造数据融合模版。网络结构如图5-6。网络输入z,、X2分别代表条件属性即传感器数据al、电;输出Y代表决策属性即四种目标类型,Y等于1、2、3、4分别代表水域、沙滩、阴影、森林。输入变量zI对应2个模糊集合,输入变量如对应3个模糊集合,各模糊集合隶属函数取高斯函数。隐层节点数目为6,与规则数目相同。网络输出权值w=[wll,W12,w13:W21,W22,w23】的初值选为[1,3,4:1,2,4】。57第五章数据挖掘与数据融合集成系统的蜜观输入层模糊化层规则层输出层囝5-6网络结构使用表5。3所示样本数据对网络进行训练,学习算法采用负梯度下降方法∑(峋一y)O;j∑∑0:—_2(Jl一口1.(t))啸(b盯二I,2)(5-5∑(wF—y)oj."专再r’专(X2-a2j(k))"0五产o’2’3¨}52’∑(w。一y)o;,盯l,(七+I)=盯If(七)+r1(t—y)∑∑q∑(wu—y)壤孝“—丁(x2仃jJ。2,(t+1)20"2』(女)+_(r—y)∑∑q吲川Ⅲ渺…”力南‘1=1(5.55)网络学习速率rl取0.005,误差函数取为E=iI∑--(,f—y,)2,整个仿真过程在matlab6.5环境下进行。网络训练后,网络的输出权值w=【O.943l,2.9965,3.9991;0.9838,I.9801,40063],各输入变量的隶属函数如图5-9、图5.10.网络学习的误差曲线如图5.1l。图5.12是随机选取初始隶属函数的网络学习误差曲线。对比图5—11与图5.12,误差同样是收敛到0005,采用本文的方法只需要62步,而普通方法需要348步,收敛速度加快了近6倍。53第五常数据挖掘与数据融合集成系统的实现图5-7善性“l的叫婚隶罹函数图5-8傅姓“3fB刊始求暑幽致医5—9训练再羁陛a1的隶嚼函敷蛩5—10训练后蔷忖d3的柬镩喃毁Ⅻll攘精辅防、图5.11本文算法的误差匝线图5.12普通算法误差曲线(6)测试与融合经过学习后的模糊神经网络构成了数据融合系统。进行融合时,将传感器数据输入模糊神经网络,经过网络运算得到输出,此输出即为融合的结果即日标类型。为验证融合系统的可靠性与可行性,下面对网络进行测试,测试数据可视为有待融合的传感器数据。由于传感器获得的数据往往混有一定噪声,因此在样本数据中加入一定随第五章数据挖掘与数据融合集成系统的实现机噪声构成测试数据,共得到20组测试数据。将这20组数据输入网络.经过网络运算得到融合结果。部分测试结果见表5-8。表5-8测试结果JlX2类型11y1009l583l4121.6221.592l-31612841.607l38809960.7891.1941.299l7071.81330132.9121.0322.0052.02329683.0464.0074.003223344由上表可得,融合系统的输出基本与目标实际类型相符,融合系统的可行性与可靠性得到了验证。上文的算法实例是一个通过粗糙集——模糊神经网络构造的数据挖掘与数据融合集成系统,该系统通过融合各传感器的数据,判断目标类型,实际实现了目标识别级的融合。数据挖掘方法首先用于挖掘模糊规则,通过本文的算法,不仅可以获得模糊规则,而且可以获得较为接近真实情况的初始隶属函数,使得网络的学习时间大大降低。该部分的数据挖掘方法主要采用粗糙集及其相关算法。接下来通过获得的模糊规则以及初始隶属函数,构造模糊神经网络,并用样本数据对其进行训练,这一过程实际也是数据挖掘的过程,用于发现数据融合的模版。网络训练结束以后,向网络输入未知的传感器数据,获取目标类型数据的过程,是实际的数据融合过程。5.5本章小结本章在进一步叙述了数据挖掘与数据融合集成系统的原理之上,重点研究了该集成系统的实现问题,提出了一种使用粗糙集——模糊神经网络构造集成系统的算法,充分发挥了粗糙集理论与模糊神经网络技术各自的优势,弥补了各自的不足。从仿真实例可知,文中的方法可以得到令人满意的结果。该方法具有如下特点:1.通过粗糙集方法进行知识约简,得到最简规则,使网络具有简洁的拓扑结构,解决了获取模糊规则的问题。第五章数据挖掘与数据融台集成系统的实现2.通过相应的离教化方法,不仅将粗糙集方法推广到了连续域,而且获得了属性数据各模糊集合的隶属函数,解决了初始隶属函数获取的问题,大大地提高了网络的训练速度。3.模型可以解释.各层都有明确的物理意义,每层的结点数都是确定的,每个节点都有确切的含义,具有极好的语义。4.实现数据挖掘与数据融合过程,体现了两者的协同作用。5整个算法过程,不需要任何先验信息,知识的挖掘与运用仅需要样本数据.摆脱了普通模糊神经网络对专家提供的经验等信息(如模糊规则,隶属函数)的依赖,大大拓宽了信息处理的领域。6l第六章总结与展望第六章总结与展望6.1论文总结数据挖掘与数据融合是两种新兴的信息处理技术。数据挖掘运用归纳的思想发现数据中有价值或有用的模式,以及数据问的关联,而数据融合则以演绎的思想实现对知识的运用,通过将观测到的数据与先前学习(归纳)到的模板或模式进行匹配比较.实现对目标的探测、建模和识别,并获取新的数据。在集成应用中,数据挖掘为数据融合提供模版,同时数据融合为数据挖掘提供数据,以提高系统的智能化和自动化水平。本文研究了数据挖掘与数据融合的集成原理.建立了集成模型,推导出了相关的算法,主要研究成果有:I.使用粗糙集进行数据融合。通过粗糙集相关约简算法获取融合规则,得到了最快、最简融合算法,解决了数据融合中冗余信息难以处理的问题。采用粗糙集的离散化方法处理连续数据,使基于粗糙集的融合算法可以应用于连续域。2.利用模糊理论与神经网络各自的优点,把模糊推理机制嵌入神经网络,通过神经网络的学习机制训练隶属函数的参数,完成了模糊推理功能。研究了基于模糊神经网络的数据融合系统的原理、融合步骤,以及相关算法。3.针对粗糙集与模糊神经网络各自的特点,设计出了一种新的粗糙集——模糊神经网络模型。采用粗糙集相关算法去除冗余信息,获取模糊规则,解决了一般模糊神经网络依赖专家经验确定模糊规则的问题。同时,网络的自学习能力也使粗糙集方法得以泛化,降低了拒判的几率,使融合系统的应用领域得以拓展。针对难以确定初始隶属函数参数的问题,本文提出了一种基于属性重要性的隶属函数获取算法。4.研究了数据挖掘与数据融合的集成问题。针对数据挖掘技术与数据融合技术在功能上互补的特点,通过集成这两种技术,完善了知识获取过程,提高了系统的融合精度。研究得到了采用租糙集——模糊神经网络建立集成系统的方法,设计了集成系统的模型,给出了建立集成系统的具体步骤以及囊成系统的算法流程图,推导出了集成系统各部分的算法。6.2展望随着全球信息化的发展,数据挖掘与数据融合相集成的研究会越来越深入。本文尽管在此方面取得了一些成果,但仍有许多阀题有待进一步研究,可以第六章.巷结与展望总结如下:I.寻求矛盾数据、病态数据的融合方法。2.定义集成系统的通用结构。3.找出集成系统的性能评估准则。4.实际应用中要考虑传感器、数据挖掘器、融合器、通信网络、知识库与过程控制器等部件。j应用中要实现两种技术的紧密结合,需要综合两种技术已有研究成果,制订统一的接口规范。参考文献参考文献郁文贤,雍少为,郭桂蓉.多传感器信息融合技术评述.国防科技大学学报.1994年9月,第16卷,第3期:1~ll徐涛,杨国庆,陈松灿.数据融台的概念方法和应用.南京航空航天大学学报.1995年4月,第27卷,第2期:258~265[3]HallDL,LinasJ.Anintroductiontomultisensordatafusion[J].ProcIEEE,1997,85(1):卜一23:4]何友,王国宏等.《多传感器信息融合及应用》.北京:电子工业出版社,200015:ABID【MA,GONZALEZRCDatafusioninroboticsandmachiReinte]1igence1992[圳.AeademicPress,INC[6]高翔,王勇.数据融合技术综述.计算机测量与控制.2002.i0(1i):706~709[7]YARSHNEYPK.DistributedSpringer—VerIag,1996detecti01]anddatafusiorl[砌.NewYork:[8:FAYYADM,piatets—shapireG.Advancesinknowledgediscoveryanddatamining[M].MenloparkCA:AAAl/MITPress.[9]蓝金辉,周兆英,李勇.混合结构的数据融合方法在目标识别中的应用[J:.仪器仪表学报,200l,22(3):313~314.[10]关键。何友,彭应宁.多传感器分布式检测综述[j],系统工程与电子技术,2002.(12):1l~15.[1ljVISWANATHANR,THOMOPOULOSSCA,TUMULURIR.OptimalserialdistributeddeciSion[J+.IEEETrans。onAES,1981,17(4):501~510。[121刘源,崔宁周,谢维信等.具有模糊信息和自学习权重的分布式检测算法!J]电子学报,t999,27(3):9~12.L13]WaltzE.L,1998.InformationUnderstanding:IntegratingDateFusionandOataMiningProcesses.[SCAS’98,Proceedingsofthe1998onIEEEInternationatSymposiamCircuitSandSystems,6:553~556.:14]Pialets—ShapiroG,Frawleyw.,WilliamJ.(eds),199i.KnowledgeDiscoveryinDaLabase.Wenl0ParkCA.AAAIPress/MITPresS[1jJFayyadU.M.,Piatetsky—ShapiroG..eta1.(eds),1996.AdvancesinKnowledgeDiscoveryandDataMining.Cambridge,MA,MITPress.叁耋塞堕[16]何友,彭应宁.多传感器数据融合模型综述.清华大学学报(自然科学版).1996年,第36卷,第9期:14~20[17]王建海,方振和,李英.多传感器数据融合浅析.上海大学学报(自然科学版)1997年8月,第3卷,第4期:454~461[18]AlhakeemS,etalAUnifledApproachtotheDesignofDecentralizedDetectiorlSystemIEEETransAES,1995,31(1):9--20ofROCsforVariousSensorFusionSchemes.[19]TueciR.TsaiMJ.ComparisonSPIE(TheFusionIII1990.1306:81~89SocietyofPhotoOpticalInstrumentationEngineers).Sensor[20]J1inasJ,etai.DataFusionTechnologyForestforCJMXS.[EEEConfThirdonInternationa]ConferenceManagementCommand,Contral,CommunicationandInformationSystem.1989:148~158alOptima]m—aryDataFusionwithDistribut|,edSensors[21]BaekWonjang,et]'gEETransAES,1995,31(3):1150~1152[22]杨华,林卉.数据融合的研究综述.矿山量测.2005年9月第3期:24~28[23]员巧云,程刚.近年来我国数据挖掘研究综述.情报学报.2005年4月,第24卷第2期:250~256124]PawlakZ.Roughset.InternationalJournalofinformationandComputerScience,1982[25]HartJ,KamberM.DataMining:ConceptsPublishers,2000andTechniques.~lorganKaufmam[26]ChenaMingsyan,HanJiawei,PhilipSYu.DataMining:Anoverviewfromdatabaseperspective[J].IEEETransactionsonKnowledgeandDataEngineering,1996,8(6):866--881.[27]Faloutsos,C,Lin,K.FastMap:A24thACMSIGMOD,1995DetectionbyMiningAssociationfastalgorithmforindexing.dataminingandvisualizationoftraditionalandmultimediadatasets.InProeof[28]YairiRulesT,KatoY,HofiK.FaultfromHousekeepingData.Proc.RoboticsandAu;omationinSpace,200l129]王光宏,蒋平.数据挖掘综述.同济大学学报.2004年2月,第32卷第2期:246~252[30]何剑斌,郑启伦,彭宏.数据融合与数据挖掘的集成研究.计算机工程与应用2002,18:204~206[311frawleywJ,PiatetskyG.KnowledgediKnowledgediscoveryinscoveryindatabase:Anoverview,pressdatabase[M].AAAI/MIT199l『32]刘同明,曾富贵,刘伟.数据融合与数据挖掘相集成的自动目标识别系统.计算机工程与应用.2002,3:92~95参考文献[33]王国胤.@ough集理论与知识获取》.西安:西安交通大学出版社.200i.[34]曾黄麟.《智能计算》.重庆:重庆大学出版社.2004:35]魏海坤.《神经网络的结构设计与方法》.北京:国防工业出版社.2005[36]闻新,周露等.{Matlab神经网络仿真与应用》北京:科学出版社.2003[37]张云涛,龚玲.《数据挖掘原理与技术》北京:电子工业出版社.2004[38]李永敏,朱善君,陈湘晖,张岱崎,韩曾晋.基于粗糙集理论的数据挖掘模型清华大学学报(自然科学版),1999年,第39卷第l期:29~33.[39j夏雨佳,李少远,席裕庚.一种基于粗糙集的信息系统决策规则提取方法.控制与决策.第16卷第5期:577~580.[40]赵军,王国胤.基于粗集理论的数据离散化方法.小型微型计算机系统.2004年1月,第25卷第l期:60~64[41]PawlakZ.Roughsets,theoreticalDordrecht:KiuwerAcademiCaspectsofreasoningaboutdata[M].Pubtish—ers,1991.[42jHaykinS.NeuralNetworks:AComprehensiveFoundation.第二版.北京:清华大学出版社,2001j43]RumehartDE,HitonGEandWilliamsRJ.Learningrepresentationbyback—propagationerrors.Nature,1986(323):533~536.f44]J.BarryGomm,DingLiYu.SelectingRadialBasiSFunctionNetworkCenterswithRecursiveOrthogonalTransactionOnLeastSquareTrainingIEEENeuralNetwork.2002。13(5):1245~1250。[45]刘普寅,吴孟达.《模糊理论及其应用》.长沙:国防科技大学,1998[46]王士同.《模糊系统、模糊神经网络及应用程序设计》.上海:上海科技文献出版社.1997:47]吴晓莉,林哲辉.《Matla9辅助模糊系统设计》.西安:西安电子科技大学.2002[48]RobertFullet,IntroductionNewYork,2000toNeural—fuzzysystems,Physica—Vertag,[49]闻新,宋屹,周露.模糊系统和神经网络的融合技术.系统工程与电子技术.i999年,第2l卷,第5期:55~58[50:王墙,高社生,赵霞.基于数据挖掘方法的多传感器数据融合系统.弹箭与制导学报.2005年8月,第25卷,第3期:635~638:5I]赵卫东,陈国华.粗集与神经网络的集成技术研究.系统工程与电子技术.第24卷第10期:L03~106.参考文献[52]PawlakZ.Roughsezs,roughre[ationsandroughfunctiORS[JJ108.Fundaments【nformatfcae,1996,27(2,3):103[53]BanerjeeM,ChakrabortyMK.AofComputinganddecisioncategoryforroughsets.Foundationssciences,1993,18(3-4):167~180setsas[54]Aasheim0I,SolheimHG.RoughaframeworkfordataminingProjeetReport,NorwegianUnfversityofScienceandTechnology,1996[55]LubaT,RybnikJtoA190rithmfcapproachtodiscernibiLityfunctionwithrespectattributesandobjectsreduction.FoundationsofComputingandDecisionSciences.1993.18(3-4):24l~258[56]王璐,高社生,赵霞.基于粗糙集理论的模糊神经网络构造方法.计算机测量与控制.已录用[56]陈绍顺,王颖龙,基于模糊神经网络的空袭兵器类型识别模型.电光与控制,2004年第u卷,第1期:27--30[57]袁冬莉“基于信息融合技术的无人机组台导航系统研究”[D]西北工业大学博士论文,2003[58]易正俊.“多源信息智能融合算法”[D]重庆大学博士论文,2002[59]陈文林,郝丽娜,徐心和.粗糙集一神经网络一专家系统混合系统及其应用.计算机工程.2003年6月,第29卷,第9期:147~t49[60】余春艳,吴明晖,吴明.遥感图像识别中粗糙集理论与神经网络的结合.遥感学报.2004年7月,第8卷,第4期:331~338作者在攻读硕士学位期间所参加的科研项目盈发表的论文作者在攻读硕士学位期间所参加的科研项目及发表的论文所参加的科研项目1.国家自然基金项目项目名称:异类传感器信息融合算法及在目标识别中的应用研究项目编号:604740322.兵器预研基金项目项目名称:制导弹药智能控制算法研究项目编号:N3HQ38发表的科研论文[1]王塔,高社生,赵霞.基于数据挖掘方法的多传感器数据融合系统.《弹箭与制导学报》.2005年8月,第25卷,第3期:635~638[2]王墙,高社生,赵霞.基于粗糙集理论的模糊神经网络构造方法.《计算机测量与控制》.已录用待发表[3:王培,高社生,赵霞.数据挖掘与数据融合集成系统模型.应用》.已录用待发表14]赵霞,谢栓勤,王培,高社生.无陀螺SINS加速度计配置与角速度解算方法研究.《弹箭与制导学报》.2005年11月,第25卷,第4期:680~683《计算机工程与致谢致谢本文是在我的导师高社生教授的精心指导和悉心关怀下完成的。从论文的选题、立意及研究方案,到论文的撰写和完成,都倾注了导师的大量心血。高老师严谨的治学态度,渊博的知识、开拓创新的敬业精神和无私奉献精神使我受益匪浅。三年来,我不仅学到了扎实、宽广的专业理论知识,而且也学到了许多做人的道理。对导师在学习和生活上给予我的热情关心和帮助,我表示最衷心的感谢!感谢我攻读硕士学位期间的同窗学友赵霞,师兄张振龙,杨波,师妹邢化玲,唐士杰及所有师兄弟对我论文工作的支持和关怀。感谢自动化学院信息对抗与系统工程系的全体老师,感谢他们对我论文工作所给予的热情帮助和支持。西北工业大学业学位论文知识产权声明书本人完全了解学校有关保护知识产权的规定,即:研究生在校攻渎学位期司论文一作的知识产权单位属于龉北工业丈学。学校有权保留并向国家有关部fJ或机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。学校可以将本学侍论文的全部或部分内容编入有关数据库进行检索.可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时本人保证.毕业后结合学位论文研究课题再撰写的文章一律注明作者单位为两北T业大学。保密论文待解密后适用本声明。学位论文作者签名:=圣盘郐《年3月f§日指导教师签名,焉∽_z一‘年3爿虏日西北工业大学学位论文原创性声明秉承学校严谨的学风和优良的科学道德,本人郑重卢明:所呈交的学位论文,是本人在导师的指导下进行研究丁作所取得的成聚。尽我所知,除文中已经注明引用的内容和致谢的地方外,本论文不包含任伺其地个人或集体已经公开芨表或撰写过的研究成果,不包含本人或其他已申请学位或其他用途使用过的成果。对本文的研究做出重要贡献的个人和集体.均已在文中以明确方式表明。本人学位论文与资料若有不实,愿意承担一切相关的法律责任。学位论文作者签名圣盛20《年jt};j侈日数据挖掘与数据融合相结合的信息处理技术研究
作者:
学位授予单位:被引用次数:
王璿
西北工业大学1次
1.郁文贤.雍少为.郭桂蓉 多传感器信息融合技术评述 1994(03)2.徐涛.杨国庆.陈松灿 数据融合的概念方法和应用 1995(02)
3.Hall D L.Linas J An introduction to multisensor data fusion[外文期刊] 1997(01)4.何友.王国宏.彭应宁 多传感器信息融合及应用 2000
5.ABIDIMA GONZALEZRC Data fusion in robotics and machine intelligence 19926.高翔.王勇 数据融合技术综述[期刊论文]-计算机测量与控制 2002(11)7.VARSHNEYPK Distributed detection and data fusion 1996
8.FAYYADM.piatets-shapire G Advances in knowledge discovery and data mining
9.蓝金辉.周兆英.李勇 混合结构的数据融合方法在目标识别中的应用[期刊论文]-仪器仪表学报 2001(z3)10.关键.何友.彭应宁 多传感器分布式检测综述[期刊论文]-系统工程与电子技术 2000(12)11.VISWANATHANR.THOMOPOULOSSCA.TUMULURIR Optimal serial distributed decision 1981(04)
12.刘源.崔宁周.谢维信.李隐峰 具有模糊信息和自学习权重的分布式检测算法[期刊论文]-电子学报 1999(3)13.Waltz E L Information Understanding:Integrating Date Fusion and Data Mining Processes 199814.Piatets-ShapiroG.Frawley W.William J Knowledge Discovery in Database 1991
15.Fayyad U M.Piatetsky-Shapiro G Advances in Knowledge Discovery and Data Mining 199616.何友 多传感器数据融合模型综述[期刊论文]-清华大学学报(自然科学版) 1996(9)17.多传感器数据融合浅析[期刊论文]-上海大学学报 1997(4)
18.Alhakeem S A Unified Approach to the Design of Decentralized Detection System 1995(01)19.TueciR.TsaiMJ Comparison of ROCs for Various Sensor Fusion Schemes.SPIE(The Society of Photo-Optical Instrumentation Engineers) 1990
20.JlinasJ Data Fusion Technology Forest for C3MIS 1989
21.Baek Wonjang Optimalm-ary Data Fusion with Distributed Sensors 1995(03)22.杨华.林卉 数据融合的研究综述[期刊论文]-矿山测量 2005(3)
23.员巧云.程刚 近年来我国数据挖掘研究综述[期刊论文]-情报学报 2005(2)24.Pawlak Z.Rough set 查看详情 1982
25.Hart J.Kamber M Data Mining:Concepts and Techniques 2000
26.Chen Ming syan.Han Jiawei.Philip S Yu Data Mining:An overview from a database perspective 1996(06)27.Faloutsos C.Lin K FastMap:A fast algorithm for indexing.data mining and visualization oftraditional and multimedia datasets 1995
28.Yairi T.Kato Y.Hofi K Fault Detection by Mining Association Rules from House-keeping Data 200129.王光宏.蒋平 数据挖掘综述[期刊论文]-同济大学学报(自然科学版) 2004(2)
30.何剑斌.郑启伦.彭宏 数据融合与数据挖掘的集成研究[期刊论文]-计算机工程与应用 2002(18)
31.frawley W J.Piatetsky G Knowledge discovery in database:An overview,Knowledge discovery in database
1991
32.刘同明.曾富贵.刘伟 数据融合与数据挖掘相集成的自动目标识别系统[期刊论文]-计算机工程与应用 2002(3)33.王国胤 Rough集理论与知识获取 200134.曾黄麟 智能计算 2004
35.魏海坤 神经网络的结构设计与方法 2005
36.闻新.周露.李翔.张宝伟 Matlab神经网络仿真与应用 200337.张云涛.龚玲 数据挖掘原理与技术 2004
38.李永敏.朱善君.陈湘晖.张岱崎.韩曾晋 基于粗糙集理论的数据挖掘模型[期刊论文]-清华大学学报(自然科学版) 1999(1)
39.夏雨佳.李少远.席裕庚 一种基于粗糙集的信息系统决策规则提取方法[期刊论文]-控制与决策 2001(5)40.赵军.王国胤.吴中福.唐宏.李华 基于粗集理论的数据离散化方法[期刊论文]-小型微型计算机系统 2004(1)41.Pawlak Z Rough sets,theoretical aspects of reasoning about data 199142.Haykin S Neural Networks:A Comprehensive Foundation 2001
43.Rumehart D E.Hiton G E.Williams R J Learning representation by back-propagation errors 1986(323)44.J Barry Gomm.Ding Li Yu Selecting Radial Basis Function Network Centers with Recursive OrthogonalLeast Square Training 2002(05)45.刘普寅.吴孟达 模糊理论及其应用 1998
46.王士同 模糊系统、模糊神经网络及应用程序设计 199747.吴晓莉.林哲辉 MatlaB辅助模糊系统设计 2002
48.Robert Fuller Introduction to Neural-fuzzy systems 2000
49.闻新.宋屹.周露 模糊系统和神经网络的融合技术[期刊论文]-系统工程与电子技术 1999(5)50.王璿.高社生.赵霞 基于数据挖掘方法的多传感器数据融合系统[期刊论文]-弹箭与制导学报 2005(3)51.赵卫东.陈国华 粗集与神经网络的集成技术研究
52.PawlakZ Rough sets,rough relations and rough functions 1996(2-3)53.Banerjee M.Chakraborty M K A category for rough sets 1993(3-4)54.Aasheim O T.Solheim H G Rough sets a s a framework for datamining 1996
55.Luba T.Rybnik J Algorithmic approach to discernibility function with respect to attributes andobjects reduction 1993(3-4)
56.王璿.高社生.赵霞 基于粗糙集理论的模糊神经网络构造方法
57.陈绍顺.王颖龙 基于模糊神经网络的空袭兵器类型识别模型[期刊论文]-电光与控制 2004(1)58.袁冬莉 基于信息融合技术的无人机组合导航系统研究 200359.易正俊 多源信息智能融合算法 2002
60.陈文林.郝丽娜.徐心和 粗糙集-神经网络-专家系统混合系统及其应用[期刊论文]-计算机工程 2003(9)61.余春艳.吴明晖.吴明 遥感图像识别中粗糙集理论与神经网络的结合[期刊论文]-遥感学报 2004(4)
1. 王璿.高社生.赵霞.Wang Xuan.Gao Shesheng.Zhao Xia 数据挖掘与数据融合集成系统模型[期刊论文]-计算机工程与应用2006,42(18)
2. 肖金石.邢昌风.XIAO Jin-shi.XING Chang-feng 粗集理论在目标识别信息处理中的应用[期刊论文]-情报指挥控制系统与仿真技术2005,27(4)
3. 吴云志.胡学钢.乐毅.涂立静.WU Yun-zhi.FIU Xue-gang.YUE Yi.TU Li-jing RoughSet-NN模型在林业信息处理上的应用[期刊论文]-计算机技术与发展2008,18(7)
4. 相卫华.方莹.杨尔弘.Xiang Weihua.Fang Ying.YANG Erhong 基于模糊集理论的中文事件框架的建立和模板匹配[期刊论文]-山西电子技术2005(1)
5. 付雪峰 基于模糊—粗糙集的文本分类模型[学位论文]2005
6. 巫莉莉.徐艾洁.张波.李涛.WU Li-li.XU Ai-jie.ZHANG Bo.LI Tao 基于数据融合和数据挖掘的网络教学资源体系[期刊论文]-重庆工学院学报(自然科学版)2008,22(6)7. 周耀 基于泛系的粒度计算理论研究[学位论文]2005
8. 代劲 不完备信息系统处理技术及其在文本分类中的应用[学位论文]2006
9. 吴淑宁.崔德光.王丹妮 基于Java和Oracle数据库的航空飞行电报数据处理[期刊论文]-计算机应用2003,23(3)10. 杨文静.苏力华.田绪安.YANG Wenjing.SU Lihua.TIAN Xu'an 基于数据融合和数据挖掘技术的网络取证体系的研究[期刊论文]-现代电子技术2007,30(9)
1.傅春常.张楠 数据挖掘与信息融合技术研究[期刊论文]-西南民族大学学报(自然科学版) 2012(4)
本文链接:http://d.g.wanfangdata.com.cn/Thesis_Y857792.aspx