您的当前位置:首页正文

电力调度知识领域的智能搜索关键技术研究

2020-12-28 来源:意榕旅游网
◎31万~60万中国科技信息2018年第20期·CHINA SCIENCE AND TECHNOLOGY INFORMATION Oct.2018DOI:10.3969/j.issn.1001- 8972.2018.20.031可实现度可替代度行业曲线linkappraisementindustry徐家慧1,2 叶健辉3 殷 智1,2 刘慧勇1,2 张 旭1,2影响力真实度1.南瑞集团(国网电力科学研究院)有限公司;2.北京科东电力控制系统有限责任公司;3.国网湖南省电力有限公司行业关联度电力调度知识领域的智能搜索关键技术研究本文采用语义Web技术分析海量电网调度生产运行和管理数据,度本体的查询,最终得到相应的查询结构。首先结合调度业挖掘数据间的业务关系,构建调度知识库;并通过倒排索引技术设计数务对OWL本体解析,其次构建调度知识推理规则及关键字据存储及搜索方式,构建调度全数据搜索引擎。最后展示搜索的应用场词库,最后基于关键字和推理规则查询调度本体,本文调度景,实现对调度运行和管理数据智能搜索,为调度运行业务管理及更高知识库支持关系推理及属性查询两种。层决策提供有力支撑。本体熟悉描述用符号P表示,C表示推理条件,O表示本体,R表示推理关系,W表示属性的权重值,Q表示推理为了能够对海量的调度运行和管理数据进行深层准确分结果。析,发掘电力调度业务的丰富价值,在目前报表、统计分析本体查询,假定查询条件定义为:“变压器”,电压等的基础上提供更深层次的语义分析智能分析查询,探索数据级=‘220KV’”,“继承”,根据推理公式Q=(R,O,C),之间的关系,建立数据的语义本体模型,更好地辅助用户日可获得符合条件的相应变电站结果:“远东变”及本体属性。常工作,支撑电网调度运行业务。若电压等级修改为500kV,则查询结果为空。系统建设在全面、快速、安全、稳定层面提出了较高的属性查询,根据(1)中查询条件,对于具有继承关系要求,传统企业里仅仅搜索文档资料等非结构化数据的需求的本体,定义推理公式为P = (O,W),本体定位查询公不能完全满足电力调度领域检索数据的需求,电力调度领域式Q=(O1…On)。查询过程按照继承关系排序,本体查更需要检索结构化数据,特别是围绕电网设备,搜索电网设询结果示例如(“变电站”,“远东变”,“母线”,“#2备的模型数据,如设备的运行数据、管理数据等等,这些结母线”),实现对相应本体的快速定位。通过推理公式P可构化数据蕴含了更大的价值,但是针对结构化数据建立搜索以得到过滤后的本体属性,查询结果例如(“变电站”,“远引擎的相关技术和产品在调度领域尚属空白。所以,需要结东变”,“母线”,“#2母线”,“电压等级”)。合国内外其他行业的研究成果,再结合电力调度领域结构化智能检索核心技术数据的分析和搜索要求,对语义知识库、大数据、搜索引擎Lucene是目前主流的一款全文检索引擎框架,它通过等技术进行研究,搭建调度领域专有的搜索引擎。提供函数调用接口的方式为数据搜索和管理提供服务,并且本文基于目前互联网搜索领域关键技术,通过文本提取、Lucene可以很方便的在各应用程序中使用,提供全文检索倒排索引、元数据解析等技术建立索引库。用户搜索请求由引擎结合电力词库进行分词,提取语义关键词,并根据语义关键词匹配展示,实现检索准确、安全、全面、快速的要求。电力调度知识领域语义分析调度知识库的构建现阶段电网调度运行系统中保存数据类型多样,其中即包含电网设备台账、调度管理及运行等信息的结构化数据,也包含变电站现场监控视频、调度过程录音及调度报文等非结构化数据。通过对上述数据抽取,结合对电网调度专业术语及业务知识理解生成相应的调度知识库,具体过程如图1所示。基于调度知识库的语义分析基于电网调度知识库,建立调度本体间关系,实现对调图1 词库数据分析-80-CHINA SCIENCE AND TECHNOLOGY INFORMATION Oct.2018·中国科技信息2018年第20期31万~60万◎图3 非结构化数据索引文件生成图5 全网发电量搜索与传统的索引结构不同,本文采用的Lucene框架采用倒排索引,倒排索引通过属性值确定记录位置而不是通过记录。这种索引结构是通过属性值来查找应用中需要的记录,具体如图4所示。图4 调度本体索引生成按照本体分类对索引文件分类,例如:调度管理类、电网运行类、设备模型类等,然后将分类后的索引文件合并,功能。本文在搜索引擎方面采用Lucene框架,保证了电力利用机器的硬件资源,Lucene可以在创建索引的过程中提调度知识检索和全文索引的稳定性。高索引效率。在内存中开辟缓存区,采用二级存储机制提高基于电网专业词库切词读写效率,这样Lucene使用IndexWriter可以控制缓存区基于Lucene的搜索引擎的分词工具很多,其中大小与写文件频度,从而实现对索引文件的合并。IKAnalyzer是对中文分词支持最好,性能最优越的工具包。智能检索应用IKAnalyzer具有很高的处理能力,可以达到60万字/秒,现有的调度管理系统因为数据类型多样,同时数据量随在分词算法方面采用“正向迭代最细粒度切分算法“,分词着时间推移越来越庞大,传统通过各功能模块筛选查询的方精度和准确度都较理想。结合专业的电力词库,能够对结构法不仅查询效率低、关联程度不强,而且需要耗费大量的人化数据和非结构化数据进行很好地切分。工时间,所以使用电网调度知识库智能检索技术可以提升电结构化数据的查询网调度管理系统的检索效率和准确性,减少大量的人工时间,电网的基础数据,运行数据以及流程数据主要是以结构化提升工作效率,对于调度管理具有重要意义。的形式存储于数据库中,在数据库中主要以模式,表,视图,字现有的智能电网调度控制系统中涵盖了多种类型数据,段的形式存在,并通过表之间的联系构成本体之间的依赖关系。包括运行数据、统计数据等。通过关键字查询调度知识库可在生成索引文件时,对于结构化数据,调度知识库为所以实现本体及与本体存在关联关系的相应结果的数据展示,有本体提供数据类型属性,包括扩展属性,属性结构:[数据源,数据类型包括结构化与非结构化。查询实例如图5所示。条件,结果,结果别名模式,表/视图,字段名],在通过关保证电网安全、稳定运行是调度运行管理的目标和职责,键字索引文件时,首先根据关键字在搜索源中出现次数,根目前电网结构复杂、规模庞大,对电网调度管理提升提出了据次数计算相应权重,基于权重大小排列符合条件的结果。新的要求,同时对调度人员而言需要具备对全局信息分析、非结构化数据查询并能提前对电网故障、事故作出预判的能力,因此提供一种电网调度专业的非结构化数据主要包括新闻文档,流可智能查询全局信息(电网事故和事故产生原因、后果、处程附件,上报材料等信息,其存储形式主要以html、pdf、置方法)的检索系统可以对调度人员形成有效支撑。word、txt、ceb、ppt等类型进行存储。而Lucene提供结语了专门的文档解析器,通过对文档的扫描,文件类型过滤,本文通过分析电网调度专业的术语、相关数据及推理逻文档内容解析等操作,获取文档内容,通过创建索引,将解辑,构建电网调度知识库,实现调度本体及关联关系的建模。析的文档内容进行索引存储。如图3所示。采用Lucene搜索引擎框架构建电网调度智能检索技术,并Lucene框架的核心是索引创建,索引是一种特殊的数生成调度知识库索引,实现对电网调度数据智能检索,为电据结构,可以在查找搜索数据前对相应的数据或者文档构建网调度机构专业人员全局、高效分析调度数据提供了支撑,索引结构,分析分散在不同对象中的各种信息、内容预处理,系统智能化水平高、检索便利,实现对电网调度专业的相关为快速检索数据提供预处理机制,尤其是数量庞大、数据稳联数据分析,数据检索准确性高,为提升科学决策管理能力定时,搜索效率提升明显。和驾驭电网能力提供技术支撑。-81-

因篇幅问题不能全部显示,请点此查看更多更全内容