-
产品及方案 产品及方案
-
数据驱动型组织通过体系化的方法构建全域数据能力,实现数据驱动运营,重塑组织生产力
- 行业方案
- 典型方案
- 产品
-
数据驱动型组织
- 服务与支持
- 社区
- 合作伙伴
- 关于爱数
请选择咨询类型
扫码关注
爱数技术支持中心公众号
大家好,我是Able,不知大家看了前几期「Able说AI」的内容,对领域认知智能是否有些许的了解呢?
最近Able收到了很多用户的私信,其中微信名“认知路上的小可爱”问道,“随着企业数字化进程的加快,企业需要的不是更多的数据,而是更高质量的数据,更智能的数据价值应用。那么,企业如何利用大数据和人工智能技术充分挖掘数据价值,辅助业务决策,驱动业务创新呢?”
别着急,今天我们请AnyDATA 研发负责人——Xavier,来聊下“领域知识图谱”,看领域知识图谱如何为领域认知智能服务,助力业务智能化。
p.s.以下内容出自Xavier
构建知识图谱,让认知智能更懂业务发展
认知智能是指机器具有主动思考和理解的能力;而领域认知智能,是一种弱人工智能,核心是利用人在某个领域的知识,以及从一部分数据中提取出来的知识解决特定领域的问题,并逐步推动认知智能在各行各业的落地。
要实现认知智能需要两个核心部分:第一是数据基础,也就是知识;第二是具备“理解”、“推理”和“决策”能力的“认知引擎”。
领域认知智能的数据基础是知识网络。(知识网络是将多元、异构、混合的知识相互关联,让认知引擎能够理解、推理和决策的知识表达模型。)领域知识图谱作为领域知识网络中最重要的知识表示方式,它强调的是领域的实体、概念、属性以及他们之间的关系,在领域认知智能实现的过程中起着非常重要的作用。
快速认识“领域知识图谱”
看图说话,下图是以C罗为主的知识图谱,有了这个知识图谱之后,球迷就能很轻松地搜索到C罗的相关信息,如球队、国籍、奖项等。因此,在实际应用中,知识图谱不但能够找到我们需要的信息,还能展示关联的信息,甚至推荐一些额外的信息。
在上述示意图中,三种不同颜色的圆圈以及连接箭头代表的是不同类型的实体,箭头则表现了不同圆圈之间的关系。图中我们可以看到的部分是构成知识图谱的数据部分(即数据层)。这些数据都是以三元组的方式来表达。
三元组顾名思义,由三个元素构成,形似下面的表达:
【实体】---【关系】--->【实体】
对应图中,
【C罗】---【效力球队】--->【曼联】
在知识图谱中所有的数据都可以用三元组表达,所有三元组的连接就可以生成知识图谱。
那么,是什么定义了背后这些数据的样式或组成方式呢?我们可以称之为“本体”,或者知识图谱的Schema,或者模型。在知识图谱中,本体是指对概念、数据和实体之间的类别、属性和关系的表示、命名和定义。所以,本体的核心是“定义”。因此,知识图谱在数据层面可以概括为:“本体”+“数据”。
知识图谱的本体定义非常抽象,基本上世间的万事万物都可以用实体来表示。这类抽象的本体更加适合对于百科知识或者事实类知识的描述。如果我们要描述一个特定领域的知识,若本体定义越符合领域特征,那么应用起来也会更加符合领域的使用场景。
举例说明,上图是一个公司客户关系管理的领域知识图谱中本体及数据示例。上半部分是知识图谱的本体层,下半部分是知识图谱的数据层。由此可见,在实际业务应用中,我们要建立一个面向领域的知识图谱,本体的设计就尤为重要。
构建领域知识图谱五步走
领域知识图谱中包含解决某个领域内问题的知识,这些知识可能存在不同的异构数据来源。有结构化数据、非结构化数据、机器数据,甚至是人类的大脑中,我们可以把这些知识构建成领域知识图谱。
1、数据准备:根据本体模型收集需要的数据,包括结构化数据、非结构化数据、半结构化数据;
2、本体建模:根据领域知识的特点设计知识图谱模型,需要考虑本体的抽象程度和复杂程度,这也决定了后面知识抽取的方法;
3、知识抽取:
结构化数据可以直接从数据源处抽取数据;
非结构化数据就需要训练知识抽取的模型,再将模型抽取的知识映射到本体上,形成知识图谱中的数据。
4、知识融合:将从不同数据源中抽取到的对于同一个实体的关系和数据进行融合,例如:“上海爱数”和“上海爱数信息技术股份有限公司”是同一个公司,需要进行相关的融合操作;
5、质量评估:对于知识图谱中的数据进行校验。
典型业务应用,提高企业认知智能
为了让数据价值最大化,我们把领域知识图谱带进业务应用。
由于领域知识图谱中保存了解决该领域专属问题的大量知识,因此可以应用于很多业务场景中。虽然当前领域认知智能还无法替代人类工作,但能够在一定程度上辅助人类解决问题。在实际应用场景中,领域知识图谱可以大大提升机器的生产力,从而解放人脑。
请就本文对您的益处进行评级:
拨打400
购买咨询
售后服务
申请试用