400-618-1990

搜索

版权所有©北京瑞风协同科技股份有限公司  
京ICP备16029927号-3

资源中心

新闻中心

服务热线:

产品方案

瑞风测试

400-618-1990

8610-82119375

 

关于瑞风

新闻中心

试验知识图谱分析

【试验工程师·公益学习营】第九期第2讲

【试验工程师·公益学习营】总第42讲,于2020年10月30日如期举行,本期讲师是瑞风协同技术总监,他具有20余年软件开发和架构设计经验,参与多个领域的设计仿真平台、材料库、知识库系统建设,重点研究方向为大数据技术和人工智能技术,专注于文本挖掘技术、自然语言处理技术在知识库自动构建、知识自动分类、知识智能推送、知识关联挖掘、知识图谱方面的应用研究。

前言:知识图谱是知识工程不断发展衍生出的新一代知识工程技术,知识图谱的概念最早是由谷歌在2012年正式提出,最初仅应用在智能搜索领域,目前已应用在多垂直领域,比如金融行业、医疗卫生、政府、能源与工业得到广泛的应用。

本期课程重点分为以下四个方面:试验知识综述、试验知识图谱分析、试验知识图谱构建技术和试验知识图谱技术展望。

一、试验知识综述

复杂产品试验的程序一般为制定试验计划、编制试验任务书、制定试验大纲、抽取受试产品、组织试验前评审、试验、试验数据的处理、编写试验报告等,其目的是为了检查验证研制和生产的产品达到规定标准的程度。

试验种类繁多,可按照产品研制阶段、试验性质、试验组织形式、试验条件、试验件规模、试验件类型、试验内容、试验对象的数字化程度、产品的组成层级等多种方式进行分类。

试验领域的显性知识包括试验类型、试验流程、试验工具、试验方法、试验场景、试验规范和标准类知识等,而隐性知识是通过数据分析、挖掘得到的知识。

试验知识目前共性问题:

1、试验知识零散、分散,信息抽取困难

2、缺少合适的方法、标准来融合各类试验知识数据

3、知识图谱在试验知识关联挖掘方面的案例较少,没有充分体现、发挥试验知识的真实价值

4、试验知识积累、更新方式以人工为主,远远跟不上大数据、人工智能技术发展

  

 

  

 

二、试验知识图谱分析

知识图谱(Knowledge Graph)简单说是一种大规模的语义网络,图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形。知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论和方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构,以达到多学科融合目的的现代理论。

与传统数据分析计算展示相比,知识图谱的优势更显著:

1、关系的表达能力强

2、像人类思考一样去做分析

3、自我知识学习

4、高速反馈

试验知识图谱的特征:综合化、定量与定性相结合、知识发现性、客观性、关联性、动态性、空间性、图谱解读的建构性、知识依赖性和滞后性。通常我们把知识分为领域知识、百科知识、场景知识、语言知识以及常识知识等,并且根据所存储的知识的类型,可以对知识图谱的类型进行划分,包括:领域知识图谱和通用知识图谱。试验知识图谱是一种信息可视化方法,也是知识可视化方法。

  

通用知识图谱

知识图谱与知识地图(knowledge map)之间存在着一定联系:

相同点:二者都是知识管理的工具,并不存在截然分隔的知识鸿沟,但它们在基本概念、应用领域和绘制技术方面有所不同。

不同点:

Ø 概念不同:“图谱”是涉及时间和空间两个维度的动态概念,“地图”是涉及二维或三维空间形式的地理学概念。

Ø 应用领域不同:知识地图更侧重于导航功能,主要应用于企业;知识图谱则更侧重于知识发现功能,主要应用于科研领域、知识应用。

Ø 绘制技术不同:知识地图绘制时不一定基于数据库,而知识图谱的绘制目前大部分基于数据库、大数据、人工智能(前者动态性,后者静态性)。

知识图谱核心内容

三、试验知识图谱构建技术

试验知识图谱构建流程为:

1、信息抽取

信息抽取是知识图谱构建的第1步,其中的关键问题是如何从异构数据源中自动抽取信息得到候选知识单元;信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术,涉及的关键技术包括:实体抽取、关系抽取和属性抽取。

  

信息抽取结构图

2、知识融合

通过信息抽取的结果中,可能包含大量的冗余和错误信息,数据之间的关系也是扁平化的,缺乏层次性和逻辑性,因此有必要对其进行清理与合并。知识融合包括两部分内容:实体链接和知识合并,通过知识融合,可以消除概念的歧义,剔除冗余和错误概念,从而确保知识的质量。

  

Falcon-AO结构图

3、知识加工

通过信息抽取,可以从原始文本中提取出实体、关系与属性等知识要素,再经过知识融合,可以消除实体名称项与实体对象之间的歧义,得到一系列基本的事实表达,然而,事实本身并不等于知识,要想最终获得结构化、网络化的知识体系,还需要经历知识加工的过程。知识加工主要包括3方面内容:本体构建、知识推理和质量评估。

  

 

本体构建流程结构图

4、知识更新

人类所拥有的信息和知识量都是随着时间呈单调函数递增,因此知识图谱的内容也需要与时俱进,其构建过程是一个不断迭代更新的过程。从逻辑上看,知识库的更新包括概念层的更新和数据层的更新,概念层的更新是指新增数据后获得了新的概念,需要自动将新的概念添加到知识库的概念层中;数据层的更新主要是新增或更新实体、关系和属性值,对数据层进行更新需要考虑数据源的可靠性、数据的一致性(是否存在矛盾或冗余等问题)等多方面因素。知识图谱的内容更新有两种方式:数据驱动下的全面更新和增量更新。

  

 

试验知识图谱的应用

四、 试验知识图谱技术展望

在试验知识图谱的技术展望方面,希望与大数据技术紧密结合来发展试验知识图谱。试验数据具有多个维度:被试件数据、参试件数据、试验环境数据、人员数据和保障活动数据。

RF自动转换器:通过类似的科学变换、人工智能技术,将试验件、文档、数据、分析方法等知识,自动生成各类知识图谱。

  

 

如果您对我们的课程感兴趣,欢迎扫描下方二维码进行听课!

新闻中心