1、本体是概念的集合,是大家都公认的概念框架,一般不会改变如“人”、“事”、“物”、

“地”、“组织”,在面对对象编程里面,我们把它叫做类,在数据管理里面我们把它叫做元数据;

2、实体是本体、实例及关系的整合,比如“人”是本体框中的一个概念,概念中也规定了相关属性比如“性别”,小明是一个具体的人,叫做实例,所以小明也有性别,小明以及体现小明的本体概念“人”以及相关属性,叫做一个实体(简单的说就是:本体+实例);

3、很多实体形成的数据库叫做知识库,如dbpedia等;

4、知识图谱是一种图谱组织形式,通过语义关联把各种实体关联起来,之前不叫做知识图谱,而叫做语义网。知识图谱把结构化、非结构化的数据通过数据抽取、融合在一起,体现了数据治理、语义连接的思想,有利于大规模数据的利用和迁移。

知识图谱有利于多源异构数据的整合,知识图谱也有利于多模(文本、视频、图片)数据的整合。最近谷歌正在研究一项工作叫做多模任务学习,就是要把文本、图片、视频多种模态一起作为输入进行学习,这是一项比较复杂的工作。但是语义连接的作用可能就是一个解决问题的方向,比如阿里的“看图说话”应用,通过深度学习识别图像中的实体和行为然后通过文本的形式呈现出来。既然图像可以转化为文本,那么视频也可以转化文本,所以通过深度学习把多种模态进行转化,利用语义进行连接和理解,这样说不定就可以解决相关问题。