浅析计算机领域的数据挖掘技术
2022-01-09
来源:意榕旅游网
浅析计算机领域的数据挖掘技术 孙 杰 河北联合大学唐山师范学院 河北 唐山 O65O0O 【摘 要】随着空间数据采集技术的飞速发展,复杂多样的空间数据日益膨胀,迫切需要更新数据挖掘的知识和方法 文章从空间数据 挖掘的基本概念出发,阐述了空问数据挖掘的类型与过程,介绍了空问数据挖掘在Gls中的应用,分析了当前空问数据挖掘面临的问题, 并对空间数据挖掘技术的发展进行了展望。 【关键词】空间数据挖掘 地理信息系统 研究分析 中圈分类号:G623 58文献标识码:B文章编号:l009-4067(2012)16一l06-01 随着数据采集技术的成熟和普及,大量的空间数据通过遥感、 地理信息系统、多媒体系统、医学和卫星图像等多种形式汇集成 庞大而丰富的信息源。面对庞杂、繁多的数据类型,空间数据挖掘 技术应运而生,并在地理信息系统、遥感勘测、图像处理、交通管 理、环境研究等领域得到广泛应用。 1、空间数据挖掘研究概述 空间数据挖掘(spatial Data Mining,简称SDM),是指从空间 数据库中提取用户感兴趣的空间模式、普遍关系、数据特征的过 程。空间数据挖掘技术综合数据挖掘技术与空间数据库技术,可 用于对空间数据的理解、空间关系和空间与非空间关系的发现、 空间知识库的构造以及空间数据库的重组和查询的优化等,其根 本目标是把大量的原始数据转换成有价值的知识,发现大量的地 学信息中所隐含的规则。 空间数据挖掘一般可分成空间分类、空间聚类、空间趋势分析 和空间关联规则四类。目前提出的空间聚类方法有基于分割的方 法、基于层次的方法、基于密度的方法和基于棚格的方法。空间趋 势分析指离开一个给定的起始对象时非空间属性的变化情况。空 间数据挖掘过程一般可分为数据筛选(消除原始数据的噪声或不 一致数据)、数据集成(将多种数据源组合在一起)、数据选择(根据 用户的要求从空间数据库中提取与空间数据挖掘相关的数据)、数 据变换(将数据统一成适合挖掘的形式)、空间数据挖掘(运用选定 的知识发现算法,从数据中提取用户所需的知识)、模式评估(根据 某种兴趣度度量并识别表示知识的真正有趣的模式),知识表示 (使用可视化技术和知识表示技术,向用户提供挖掘的知识)等阶 段。 2、空间数据挖掘在GIS中的应用 空间数据挖掘技术与地理信息系统(GIS)的结合具有非常广泛 的应用空间。数据挖掘与GIs集成具有三种模式:其一为松散耦合 式,也称外部空间数据挖掘模式,这种模式基本上将GIS当作一个 空间数据库看待,在GIS环境外部借助其它软件或计算机语言进行 空间数据挖掘,与GIS之间采用数据通讯的方式联系。其二为嵌入 式,又称内部空间数据挖掘模式,即在GIs中将空间数据挖掘技术 融合到空间分析功能中去。第三为混合型空间模型法,是前两种 方法的结合,即尽可能利用GIS提供的功能,最大限度的减少用户 自行开发的工作量和难度,又可以保持外部空间数据挖掘模式的 灵活性。利用空间数据挖掘技术可以从空间数据库中发现如下几 种主要类型的知识:普遍的几何知识、空间分布规律、空间关联规 律、空间聚类规则、空间特征规则、空间区分规则,空间演变规则、 面向对象的知识。 3、空间数据挖掘面临的问题 (1)多数空间数据挖掘算法是由一般的数据挖掘算法移植而 来,并没有考虑空间数据存储、处理及空间数据本身的特点。空间 数据不同于关系数据库中的数据,它有其特有的空间数据访问方 法,因而传统的数据挖掘技术往往不能很好地分析复杂的空间现 象和空间对象。 (2)空间数据挖掘算法的效率不高,发现模式不精练。面对海 量的数据库系统,在空间数据挖掘过程中出现不确定性、错误模 106’.中国电子商务.I 2012.16 式的可能性和待解决问题的维数都很大,不仅增大了算法的搜索 空间,也增加了盲目搜索的可能性。 (3)没有公认的标准化空间数据挖掘查询语言。数据库技术飞 速发展的原因之一就是数据库查询语言的不断完善和发展,因 此,要不断完善和发展空间数据挖掘就必须发展空间数据挖掘查 询语言。为高效的空间数据挖掘奠定基础。 (4)空间数据挖掘知识发现系统交互性不强,在知识发现过程 中很难充分有效地利用领域专家知识,用户不能很好掌控空间数 据挖掘过程。 (5)空间数据挖掘方法和任务单一,基本上都是针对某个特定 的问题,因而能够发现的知识有限。 (6)空间数据挖掘与其他系统的集成不够,忽视了GIS在空间知 识发现过程中的作用。一个方法和功能单一的空间数据挖掘系统 的适用范围必然受到很多限制,目前开发的知识系统仅局限于数 据库领域,如果要在更广阔的领域发现知识,知识发现系统就应 该是数据库、知识库、专家系统、决策支持系统、可视化工具、网络 等多项技术集成的系统。 4、空间数据挖掘的发展趋势 (I)空间数据挖掘算法和技术的研究。空间关联规则挖掘算 法、时间序列挖掘技术、空间同位算法、空间分类技术、空间离群算 法等是空间数据挖掘研究的热点,同时提高空间数据挖掘算法的 效率也很重要。 (2)多源空间数据的预处理。空间数据内容包括数字线划数 据、影像数据、数字高程模型和地物的属性数据,由于其本身的复 杂性与数据采集的困难,空间数据中不可避免地存在着空缺值、 噪声数据及不一致数据,多源空间数据的预处理就显得格外重 要。 (3)其他各种空间数据挖掘及其相关技术研究。如网络环境下 的空间数据挖掘、可视化数据挖掘、栅格矢量一体化空间数据挖 掘、背景知识概念树的自动生成、基于空间不确定性(位置、属性、 时间等)的数据挖掘、递增式数据挖掘、多分辨率及多层次数据挖 掘、并行数据挖掘、遥感图像数据库的数据挖掘、多媒体空间数据 库的知识发现等。 5、小结 空间数据挖掘可从大型空间数据库中提取感兴趣和规律性的 知识,可用于理解空间数据、发现空间数据与非空间数据的关系、 建立空间知识库、优化查询,重组空间数据库等,空间数据挖掘技 术在广度和深度上的不断进步,也将使GIs集成系统朝着智能化、 网络化、全球化与大众化的方向发展。可以预见,空间数据挖掘不 仅会促进空间科学、计算机科学的发展,而且必将增强人类认识 世界、改造世界的能力,从而更好地服务人类社会。 参考文献 【1】韩家炜.数据挖掘概念与技术【M】.北京:机械工业出版社,2o01. [2】KANTARDZIC M.数据挖掘:概念、模型、方法和算法【M].闪四清,陈茵, 程雁,译.北京:清华大学出版社,2003. [3】宋爱波.Web挖掘研究综述.计算机科学….2001.28(11):13-1 5.