爱数博客

全部 AnyBackup AnyShare AnyRobot AnyDATA

知识汇 | 认知智能落地应用的驱动力:爱数认知智能框架解读

1721 1 2021-11-24
 

本期作者

陈骁

爱数研发副总裁

大数据和人工智能领域专家


 
 


数字工作空间需要认知智能

随着各行各业数字化脚步的逐渐深入,人类所生活的物理世界的很多要素都已经在计算机的虚拟世界中实现了映射。

我们的工作环境也正在转向一种数字工作空间。在这样的一个空间中,人类的知识也在加速数字化,有大量蕴含知识的数据被这个数字空间记录了下来,我们学习知识和认知世界的方式都在随之变化。但是我们现在的技术能力还不足以满足人们对于数字工作空间的使用需求。

请大家试想一个场景,作为一个数字空间的知识工作者,每天我们需要花多长时间在搜索以及查找资料这件事情上。如上文所说,大量的数据被记录下来,这些数据中蕴含着知识,但是由于数据量巨大,而知识的密度却相对较低,人类从这些数据中获取知识的难度变得很大。

在很多情况下,无论是包含了全网数据的公共搜索引擎,或者是企业内部的知识管理系统,都无法有效地帮助我们获得知识,反而出现了大量不精确、不重要的搜索结果,导致人类的认知负担。

如果有这样一种搜索技术,能够精确地知道我们的数字空间中有什么,同时能够精准地理解用户的使用意图,推送精准的结果,还能精准地解释推送的原因,那么人类的工作效率就能极大地提升,同时也能帮助组织实现降本增效。这种精确搜索推荐的场景就是认知智能要解决的问题之一。

 

认知智能落地挑战

谈到认知智能,我们先来讨论一下认知智能的定义。认知智能是一种技术,属于人工智能的范畴。经过了过去几十年的发展,人工智能从计算智能发展到感知智能,又从感知智能发展到认知智能。

 计算智能 · 利用自然界的规律,通过编程的方式用计算机来解决实际的问题。这一阶段的典型成果是现代计算机和高级编程语言的发明,使得计算机有快速计算和存储记忆的能力。

 感知智能 · 让计算机具备视觉、听觉、触觉等感知能力,利用各种传感器让机器能够吸收外界的数据,并具备基本的处理问题的能力,这一阶段的典型成果是深度学习的发明以及引入到各类问题的处理中。

 认知智能 · 赋予机器模拟人类认知思考能力的技术,是人工智能发展的高级阶段。复旦大学肖仰华教授在《知识图谱与认知智能》 一文中提到,“认知智能的核心能力是‘理解’和‘解释’,体现在机器能够理解数据、理解语言进而理解现实世界的能力,体现在机器能够解释数据、解释过程进而解释现象的能力,体现在推理、规划等等一系列人类所独有的认知能力上”。认知智能也将会是未来几年人工智能的重要研发方向。

 

人类的认知基础是知识,对于机器而言也是如此。要实现认知智能,首先需要实现海量数据的知识化,然后再实现基于知识的智能应用。

不过人类的认知和机器的认知有一个本质的区别,就是人类在与自然界交互的过程中学习到的知识是显性的、有结构的、多模态的,学习的过程中就能将知识存储在大脑中。而机器的“知识”是隐性的暗知识,隐藏在海量数据中、来源于各种各样不同数据的基础上。要实现认知智能的落地应用,面临着三大挑战:

01 数据获取以及治理困难

上文中提到,对于机器的认知智能而言,数据来源非常广泛,业务系统、互联网上的资料、个人的办公文档等,而且有不同形态的存在,有结构化数据、非结构化数据以及半结构化的机器数据,想要获取和管理好这些知识,需要强有力的技术支撑。

02 知识表示和知识获取困难

我们讲到知识,大家很自然地会联想到知识图谱,知识图谱是一种具有很强知识表示能力的知识形式,通过实体、属性和关系来描述世界,但是实际应用中,仅仅知识图谱是不够的。

例如在企业的分析和决策场景中,除了知识图谱表示的业务知识,还需要有表示业务规则的规则库,以及实现逻辑推理的决策树等知识表示方式。

有这些知识的表示方法之后,如何从海量、多元、异构的知识中抽取知识,也面临非常大的挑战,需要专业的数据科学家进行数据建模、算法开发以及对知识进行维护,确保知识的精准性,所以我们提出了融合多种知识表示的“知识网络”的概念。

03 实现知识的应用困难

有了多种知识表示方式之后,将这些知识有效地组织和利用起来,也需要花费大量的精力进行应用开发,如果我们要实现一个智能搜索的应用,就需要在知识之上实现一个搜索意图的理解和转化应用,精确地理解用户的使用意图,还要确保服务的性能满足用户的日常使用需求。

 

认知智能框架

结合上述的几个问题,我们研发了 AnyDATA 认知智能框架,从认知智能路径中的两个要点出发,目标是通过数据知识化生成领域知识网络,并基于领域知识网络实现认知引擎,提供开放框架赋能认知智能应用开发,并且能够赋能上层的知识管理、智能运维和先进分析应用。AnyDATA 面向两类用户,分别是数据科学家和应用开发者,并为他们提供不同的使用界面。

· 数据科学家:主要任务是通过知识建模、知识抽取和模型训练等手段来生成知识网络,实现数据知识化;

· 应用开发者:目标是利用认知引擎提供的推理、归纳演绎和决策等认知能力进行认知智能应用的开发。

AnyDATA 提供了一套认知 SDK,使得两类用户都能通过可视化的方式进行工作,提升他们的工作效率。


AnyDATA 之所以称之为认知智能框架,是因为 AnyDATA 并不是一个单纯的平台,而是提供了一套认知智能实现的方法论,以及实现认知智能路径中所必须用到的工具集和运行认知智能应用所需要的平台。刚才我们提到的三个挑战,在 AnyDATA 认知智能框架中都一一进行对了应对:

01 数据获取及治理

借助 AnyShare、AnyBackup、AnyRobot 的数据汇聚能力,使得爱数其他产品作为 AnyDATA 数据源,实现无缝的数据对接;

02 知识表示和获取

我们引入了知识网络的概念,将组织中的不同知识表示方式统一进行管理。AnyDATA 也提供了标注的知识建模、知识抽取模型训练工具,为用户提供个性化的模型训练和抽取,降低认知智能模型使用的门槛;

03 实现知识应用

AnyDATA 提供一整套的应用开发平台和配置工具,同时提供 API 和开发库,使应用开发更加便捷。



这里,我们再回到开篇提到的智能搜索的应用场景,如何为数字空间的知识工作者提供更好的搜索服务,“精准地理解用户的使用意图,推送精准的结果,精准地解释推送的原因”,在 AnyDATA 中,我们这么来实现:

 



利用 AnyShare 非结构化数据中台,实现组织内部的数据汇聚;

② 通过 AnyDATA 进行初步的知识网络构建,利用自监督的方式将组织文档中的概念知识以及文档本身的结构进行知识抽取,形成组织专属语言模型,并利用认知引擎实现基本的搜索与推荐;

③ 对于组织的知识使用场景进行知识建模,按照产品研发、人力资源、财务管理等业务线的需求创建知识网络,并设定知识抽取任务,逐步地向知识网络构建任务中进行数据的迭代,有必要时还需要引入结构化的业务数据;

④ 在认知引擎中配置用户意图理解相关的模型,并利用意图理解,识别用户不同场景的搜索请求;

⑤ 提供 AnyDATA 搜索 API ,可与 AnyShare 或者其他的应用程序集成,或者直接应用 AnyDATA 搜索 Web 组件,搜索结果中包含知识,以及用户搜索意图理解的结果与推荐结果之间的关联,实现可解释性;

在知识网络中导入用户的静态画像数据(如用户的部门信息),并借助 AnyShare 采集的用户行为数据进行行为分析,动态地进行个性化推荐。


当然,智能搜索只是 AnyDATA 结合爱数其他产品的一个应用场景,不久的将来,AnyDATA 也会不断地推出面向行业和不同场景的解决方案,请大家持续关注。
 


 

对于上面提出的认知智能挑战,AnyDATA还有很长的路要走,还有很多的难关需要攻克。

在 AnyDATA认知智能框架的开发迭代中,为了始终保持技术的领先性,爱数与复旦大学成立了认知智能联合研究中心,与天津大学成立了数据智能联合实验室,在认知智能的基础研究领域持续进行投资,将先进的科研成果转化为实际可应用落地的产品特性。

希望爱数能够通过 AnyDATA认知智能框架,让人工智能在组织落地上更进一步。

 

了解AnyDATA >>>

 

 

 

 

 

请就本文对您的益处进行评级:

标签

知识汇

相关文章

热门标签

版本发布 在线教学
联系我们
销售咨询
免费销售咨询热线
021 66609280
售后咨询
7*24 小时免费售后服务热线
021 36175802
为了给您提供更优质的服务,请您先完善以下信息:
确认提交

扫码关注

爱数技术支持中心公众号