| 编辑推荐: |
本文主要从概念体系到形式化建模介绍了什么事本体相关内容。希望对你的学习有帮助。
本文来自于微信公众号mediaTEA,由火龙果软件Alice编辑,推荐。 |
|
在知识图谱、语义网和知识表示中,本体(Ontology)是一个核心概念。初学者常把本体理解为术语表、分类表,或若干概念名称的集合,但这种理解并不完整。本体真正关心的,不只是“有哪些概念”,而是“这些概念如何定义、如何分类、如何关联,以及它们满足什么约束”。因此,本体可以看作是对某一领域知识结构的形式化建模。
一、什么是本体
从知识表示角度看,本体是对某一领域中概念、属性、关系及其约束的共享、明确、形式化描述。
这个定义中,有三个关键词值得把握。
1、共享
本体不是个人随意给出的名称集合,而是希望在一定范围内形成共同理解,以便不同的人、不同系统围绕同一套概念框架进行表达和交流。
2、明确
本体中的概念、关系和约束应当被清楚说明,而不是停留在模糊、含混的自然语言层面。
3、形式化
本体不是一般性的文字说明,而是要用较规范、可处理的方式表达出来,使计算机能够识别、校验和推理。
因此,本体不是某个具体对象本身,而是对一个领域“知识如何组织”的抽象模型。
例如,在动物领域中,可以围绕“动物”“哺乳动物”“鸟”“有毛发”等概念建立结构;在教育领域中,也可以围绕“学生”“教师”“课程”“学院”等概念建立结构。只有当这些概念之间的层次、属性和关系被明确表达出来时,它们才真正构成本体的一部分。
二、为什么需要本体
知识图谱并不是把事实一条条记录下来就足够了。
如果没有统一的概念体系,不同数据源往往会采用不同名称、不同分类方式和不同属性结构。这样即使数据很多,也难以整合、共享和复用。
本体的重要作用主要体现在以下几个方面。
1、统一概念
同一领域中,不同来源常常采用不同说法。本体能够给出较稳定的概念定义和层级结构,减少概念混乱。
2、规范关系
本体不仅说明“有哪些对象”,还说明“这些对象之间可以建立什么关系”,从而使知识结构更清楚。
3、约束属性
本体可以说明某些属性适用于哪些类、某些属性值应属于什么范围,从而使知识表达更规范。
4.、支持推理
当概念、关系和约束被形式化表示后,系统才能依据这些结构推出新的结论。
因此,本体不是知识图谱中的附属部分,而是知识图谱能够稳定建模、共享和推理的重要基础。
三、本体通常包含哪些内容
本体通常不只是概念名称的集合,而至少包括以下几个方面。
1、类
类(Class)表示某一类对象或概念。
例如:
2、属性
属性(Property)用于描述类或对象的特征。
例如:
3、关系
关系(Relation)表示对象之间或概念之间的联系。
例如:
4、约束
约束(Constraint)用于说明类、属性和关系应满足的规则。
例如:
-
“学生”是“人”的子类;
-
“有年龄”的定义域是“人”;
-
某些类之间互斥;
-
某些属性具有传递性。
|
在很多实际系统中,本体主要定义类、属性、关系和约束;在基于本体构建知识图谱时,还会进一步加入实例数据。
可以用下面这幅图概括本体的组成:
这说明,本体不是单一元素,而是由概念、关系和规则共同构成的结构体系。
四、本体与概念体系是什么关系
概念体系强调的是:一个领域中有哪些概念,以及这些概念之间怎样分层和关联。
本体则是在概念体系基础上,进一步把这些内容明确化、规范化和形式化。
可以简单概括为:
概念体系偏向“知识整理”;
本体偏向“形式化建模”。
例如,在动物领域中,若只是列出“动物、哺乳动物、鸟、鱼”,这主要还是概念体系;
若进一步说明“哺乳动物是动物的子类”“鸟也是动物的子类”“有毛发通常适用于哺乳动物”,那么就进入了本体建模。
因此,本体可以看作是把概念体系从“认识上的整理”提升为“机器可处理的结构”。
五、本体为什么能够支持推理
本体不仅帮助整理概念,更重要的是,它还能为推理提供基础。
原因在于,本体中不仅有名称,还有类层次、属性范围和逻辑规则。
例如:
-
如果“学生”是“人”的子类;
-
某个对象属于“学生”;
-
那么系统就可以推出:该对象也属于“人”。
|
再如:
-
如果“祖先”关系具有传递性;
-
A 是 B 的祖先;
-
B 是 C 的祖先;
-
那么系统可以推出:A 是 C 的祖先。
|
这说明,本体的价值不只在于“描述知识”,还在于“使系统能够根据这些描述得到新知识”。
也正因为如此,本体在语义网和知识图谱中始终占有重要地位。
六、本体与知识图谱是什么关系
本体和知识图谱关系密切,但二者并不相同。
1、本体更偏向结构与规则
本体关注的是:这个领域中有哪些类、属性、关系和约束,以及这些内容应怎样组织。
2、知识图谱更偏向对象与事实组织
知识图谱关注的是:有哪些具体实体,这些实体之间有哪些具体关系,具有什么具体属性。
因此,可以把二者的关系概括为:
- 本体提供建模框架;
- 知识图谱组织具体事实。
例如:
本体中可以定义“画家”“作品”“创作”这些类和关系;
知识图谱中则进一步写入“梵高”“《星夜》”“创作于 1889 年”等具体事实。
所以,本体不是知识图谱的替代物,而是知识图谱的重要支撑结构。
七、学习本体时最容易出现哪些误解
学习本体时,常见误解主要有以下几种。
1、把本体理解成术语表
术语表只是列出名称,而本体还要说明概念之间的关系、属性和约束。
2、把本体理解成普通分类表
分类只是本体的一部分,本体还包含属性结构和语义规则。
3、认为本体只适合理论研究
实际上,本体在知识图谱构建、数据整合、语义搜索和自动推理中都有实际作用。
4、认为有了本体就等于有了完整知识图谱
本体提供的是框架,不是全部事实内容。真正的知识图谱还需要大量具体实体、关系和属性实例。
因此,理解本体时,最重要的是抓住它的本质:本体不是对象本身,而是对对象世界进行形式化组织的知识模型。
小结
本体是对某一领域中概念、属性、关系和约束的形式化描述。它不是术语表,也不是普通分类表,而是把概念体系提升为机器可处理的知识结构,是知识图谱建模、共享和推理的重要基础。 |