爱分析调研：爱数助力企业实现领域认知智能，向数据驱动型组织迈进

如今，人工智能技术正由感知智能向认知智能迈进，知识图谱作为认知智能的代表技术正在诸多领域发挥价值。但是，知识图谱的落地之路并不顺畅，迟迟没有迎来行业爆发，主要受限于两点阻碍因素——高门槛、低可用。构建贯穿知识图谱生命周期的平台是破除阻碍因素的有效方法，是实现知识图谱规模化应用的必由之路。

面对上述问题和需求，近期，爱分析对爱数进行了调研，并对爱数研发副总裁陈骁先生进行了访谈。爱数历时三年推出AnyDATA Framework 2，从领域认知智能这个更高的维度出发，向全行业提出一种新解法。

构建贯穿知识图谱生命周期的平台是实现知识图谱规模化应用的必由之路

2012年，Google率先提出知识图谱（Knowledge Graph）的概念，在其搜索结果中加入知识图谱功能，用于提高搜索引擎的能力。发展至今，知识图谱概念不再局限于Google搜索引擎的某一项功能，而是外延为一种揭示实体之间关系的语义网络，用来描述真实世界中存在的各种实体和概念，以及他们之间的关系。

知识图谱正在越来越多的领域释放价值。人们使用搜索引擎搜索信息，和Siri聊天南海北的话题，使用企查查等平台查看意向企业的背景，这些行为背后都有知识图谱的身影。知识图谱不局限于C端使用，在B端同样有落地应用，包括智慧城市、智慧公安、智慧医疗、智慧教育、智能制造、智慧金融等。

知识图谱虽然有一定的落地应用，但始终没有迎来爆发式增长，在数字化市场中“出镜率”不高。爱分析研究发现有诸多因素对其施加负面影响，它们贯穿知识图谱项目始终。

万事开头难，知识图谱项目规划初期有三头拦路虎

图1：知识图谱构建和使用的主要步骤

首先是数据治理程度低。数据治理为知识图谱输送数据源，是知识图谱构建的前置环节与基础工程，知识图谱需要站在“数字巨人”肩膀上发挥作用。如今，大部分甲方的数据治理程度较低，虽然有一定的数据沉淀，但在数据汇聚、数据编目、数据质控仍有较多短板，难以为知识图谱输入充足的、高质量的数据。

其次是知识缺乏。知识图谱的一大用途是辅助决策，前提是需要大量的领域知识。比如化工厂选址，需要选址团队了解化工原料、上下游工艺、国内外供应商、所在园区、价格变化、化工原材料供需关系等，缺少知识很难做出优质决策。知识主要有两个来源，第一是自身知识积累，第二是外部输入。对于大多数企业而言，仅依托自身知识资源是不足够的，在引入外部知识时又缺乏相应的工具和渠道，最终由于知识缺乏而导致知识图谱非常“干瘦”，缺乏实用价值。

第三是人才短缺。构建并使用知识图谱需要三步，这些步骤均需要复杂的开发工作才能实现，对从业人员有比较高的能力要求。知识图谱属于人工智能范畴，通过中国人工智能人才缺口情况可以管中窥豹。2022年，浙江大学中国科教战略研究院携手百度联合发布《中国人工智能人才培养报告》，报告显示：中国人工智能人才缺口高达500万。同时还需要注意，即使存在一定的相关人才供应，也会被商汤科技、云从科技、依图科技、旷世科技、第四范式等AI企业和百度、阿里、腾讯、字节跳动等互联网企业优先抢占，其他实体企业、软件开发商、系统集成商的相关人才招聘更加困难。

在知识图谱项目执行阶段，“效率低”是最大痛点

在项目实践中，知识图谱开发者通常会选择算法、工具、领域业务专家三者进行深度人机协同的方式来进行知识输入。算法的作用是将知识从数据中抽取出来，工具的作用是将知识可视化处理并提供编辑能力，领域业务专家的作用是将已经抽取出来的知识进行再次编辑与自身业务知识摄入。知识图谱的建设不完全是技术工作，业务工作也是重要组成部分。领域业务专家常以非标准方式标记知识，返工较多，并且专家之间还存在协作问题。业务工作效率低下会直接影响知识图谱项目推进工作，延长建设周期，最终导致开发成本超出预期。

缺乏运维升级和上层应用的知识图谱没有生命力

知识图谱项目失败的主要原因之一在于将其视为“一锤子买卖”，项目参与者们将知识图谱构建完成视为终点。其实，知识图谱构建完成仅仅是起点，而非终点。在知识图谱构建完成后，需要对其持续运维升级，并开发丰富的上层应用，包括认知搜索、智能问答、智能推荐、图可视化分析等，这样的知识图谱才是有实用价值的，才是有生命力的。知识图谱开发者并非不知道这些要点，而是缺乏专业工具使得运维升级、应用开发等工作较难推进。

知识图谱市场发展的诸多阻碍因素可以总结为两点——高门槛、低可用。业内普遍认为知识图谱平台是破除两大阻碍因素的有效手段，有利于推动市场健康发展。如今，“如何构建贯穿知识图谱生命周期的平台”成为业内重要挑战。

爱数AnyDATA Framework 2，让“低门槛、高可用”的知识图谱照进现实

爱数是一家具备16年从业经历的全域数据能力服务商，2019年立项致力于实现领域认知智能。经过近3年的开发、优化，爱数于2022年正式推出AnyDATA Framework 2——基于领域知识网络的认知智能框架，可以让“低门槛、高可用”的知识图谱照进现实。AnyDATA Framework 2是知识图谱平台，但不仅仅是知识图谱平台。

AnyDATA Framework 2是爱数“领域认知智能”概念的承载者

基于16年数据产业从业经历，爱数总结出“数据治理→数据知识化→业务智能化”方法论，旨在打造DT（Data Technology）时代的数据驱动型组织，致力于实现：知识承载组织战略，认知驱动业务创新。有业务的地方就有领域，爱数聚焦新兴的认知智能，提出“领域认知智能”新概念，为实现业务智能化探明发展路径。

领域认知智能是一种实现业务智能化的技术手段。核心是融合内部数据和外部领域知识，形成领域知识网络，并在此基础上实现推理分析和辅助决策。领域知识网络是围绕领域认知模型的知识表示集合，包括领域知识图谱、领域词库、领域规则库、分析推理模型、领域预训练语言模型等。

2022年，爱数发布AnyDATA Framework 2，以领域知识网络、领域智商、集成的开发框架三大创新，赋予机器认知能力。AnyDATA Framework 2是爱数先进思想的承载者。知识图谱是知识网络的子集，这也是AnyDATA Framework 2可以让“低门槛、高可用”的知识图谱照进现实的原因所在。

AnyDATA Framework 2具备三大能力体系——完整、高效、易用

AnyDATA Framework 2可以覆盖知识图谱全生命周期，实现从业务建模到应用效果评估的全流程闭环。

图2：AnyDATA开发方法论

如果没有数据治理能力，就无法搭建优良的知识网络。爱数已经考虑到这一点，可以为甲方提供包含提升数据治理能力在内的整体解决方案。通过AnyFabric帮助甲方治理结构化数据，通过AnyShare帮助甲方治理非结构化数据。AnyDATA Framework 2、AnyFabric和AnyShare等爱数产品存在内置对接，可以在爱数的ONE架构上融合部署。

基于AnyDATA Framework 2，可以显著提升开发效率，进而降低项目成本。AnyDATA Framework 2 可以对接多种数据源进行图谱构建，可以方便地组合定时或实时的数据流，包含结构化和非结构化的数据处理，简化了开发难度。对于领域业务专家编辑知识返工多的问题，AnyDATA Framework 2制定统一标准以及内含高效编辑工具。

易用是AnyDATA Framework 2的重要能力，主要体现在三个方面。

• 第一，可视化提升开发体验。面向数据分析师、数据工程师和数据科学家等数据科学人员，AnyDATA Framework 2可供他们自由搭建和集成模型，并且把全文检索的能力放进图数据库，便于关系搜索。同时，AnyDATA Framework 2引入低代码开发思想，支持低代码化地构建知识图谱。

• 第二，丰富的上层应用。AnyDATA Framework 2封装了认知搜索、智能问答、智能推荐、图可视化分析等上层应用，还提供相关应用的低代码开发能力。

• 第三，短期培训即可投入实践。爱数为开发者提供完善的培训体系，包括产品手册、最佳实践资料、垂直培训指导等。高效率、低门槛开发平台叠加完善的培训体系，开发者通过两天的短期培训便可以投入实践，形成产出。

AnyDATA Framework 2为数据流动提供新思路，助力企业以KaaS模式实现数据商业增值

AnyDATA Framework 2不仅可以有效解决知识图谱行业的“高门槛、低可用”阻碍，还具有以KaaS（知识即服务）提升数据流动性实现数据商业增值的衍生价值。

数据成为新生产要素，与劳动力、土地、资本等生产要素并列。如何推动数据流动，促进数据要素市场繁荣成为各方关心话题。目前，各方主要聚焦于原始数据流动，形成了大数据交易市场、数据银行等思路与实践。

AnyDATA Framework 2另辟蹊径，为数据流动提供新思路，以领域知识为基础构建领域知识网络并提供对外输出。以AnyDATA Framework 2为依托，开发者可以将领域知识加工成领域知识网络，作为一个领域知识服务平台可以对外提供订阅服务，收费主体可以是开发者或者甲方，也可以是二者共建共享。

KaaS对甲方有两项显著价值。首先是内在价值，甲方通过KaaS实现数据商业增值，有利于打造企业多元化营收体系，并让企业数字化建设事业从成本侧向盈利侧转变。其次是外在价值，甲方可以面向产业链上下游伙伴输出领域知识，以知识赋能的方式提升产业竞争力，助力产业升级，以及增强自身在产业链中的影响力，取得或巩固链主地位。

AnyDATA Framework 2汇聚开发者力量打造快速落地机制，强调多方共赢

在AnyDATA Framework 2业务线，爱数的商业模式是“不做直客，服务开发者”，释放生态力量，实现AnyDATA Framework 2在各行各业的快速落地。

在项目前期的顶层设计阶段，爱数会和系统集成生态伙伴联合进行可行性研究，帮助伙伴顺利立项。在解决方案制定阶段，将AnyDATA Framework 2、AnyFabric、AnyShare等产品融入其中，以授权的方式供伙伴使用。在上层应用开发、数据建模方面，项目若有需要，爱数亦可提供相关服务。在授权方面，爱数以知识量为依据，采用阶梯授权模式。爱数以客户成功为导向，支持开发者按效果付费，降低开发者的投入与风险。

爱数为开发者提供AnyDATA Framework 2开源版——KWeaver，以开源之力激活创新，并助力AI普惠

开源的目的不是为了开源而开源，而是通过开放的机制推动生态创新的效率。开源不仅是一种商业模式，更是一种推动创新的加速器。目前，开源已成为 AI 框架的主流。

2022年3月，AnyDATA Framework 2正式发布，2022年9月，脱胎于此的KWeaver正式开源，其中的“K”代表知识（Knowledge），“Weaver”代表编织者，包含爱数希望将所有的知识编织在一起，从而实现领域认知智能的宏伟愿景。

图3：AnyDATA Framework 2和KWeaver演进历程

KWeaver选择Apache license 2.0作为开源许可证，这是一个比GNU、GPL、BSD等常用许可证更加自由的标准，几乎对开发者不加以限制，大家可以自由利用代码。爱数希望通过领域认知开源整合全球智慧，进一步推动AI普惠。KWeaver作为开源版AnyDATA Framework 2，在性能方面没有任何减弱。二者的核心差异在于前者没有企业级特性，后者有丰富的企业级特性，封装了智能问答、智能搜索等一系列认知服务。

领域认知智能在知识管理、领域认知中台和智能运维等领域多面开花

有业务的地方就有领域，有领域的地方就有领域知识网络的用武之地，AnyDATA Framework 2已在知识管理、领域认知中台和智能运维等领域成功落地。

AnyDATA Framework 2在知识管理领域主要有三个方面的用途。

• 统一知识搜索：建立统一检索平台，实现快速、准确地找到所需知识；

• 自动知识分类：自动生成知识标签，灵活进行知识分类；

• 智能知识关联与推荐：基于内容标签智能推荐相关知识，实现知识的自动聚合与发现。

AnyDATA Framework 2在领域认知中台方面主要有四个方面的用途。

• 全域数据治理与数据资产化：以业务为导向，领域认知智能驱动的数据治理，只为高质量的数据资产；

• 数据资产与领域数据知识化：基于数据资产知识网络，构建领域知识网络；

• 领域智商引领认知智能应用：基于领域知识网络，构建业务认知搜索、智能问答等，集成到业务系统流程，提供全局认知能力；并基于领域智商，持续优化领域知识网络；

• 领域知识网络产品化和服务化：共建共享领域知识网络，基于领域知识网络的数据产品开放和交易，促进数据要素生态市场繁荣。
AnyDATA Framework 2领域认知中台的应用案例集中在智慧城市方面，下面将对一个实际案例进行解析，展示AnyDATA Framework 2在智慧城市建设过程中可以发挥哪些作用。

AnyDATA Framework 2助力某城市打造智慧城市产业大脑，提升城市智慧化治理和服务能力

案例背景：某城市希望利用数据驱动城市智慧化治理和服务，实现精准招商，主动企业服务和区域产业分析预测功能。

解决方案：爱数联合甲方与生态伙伴，采用“1+3+N”的建设主线。“1”即一个企业图谱数据湖。将海量的外部网络数据和智慧城市内部数据汇总，形成数据湖，基于AnyDATA Framework 2为企业画像和关系图谱提供能力底座。“3”即三个平台，包括企业主动服务平台、经济运行分析平台、产品精准招商平台。通过三个平台连接政府与企业，为知识图谱提供应用基础。“N”即N个应用模块，将产业发展和智慧营商环境分为若干个应用模块，实现企业图谱的实用性和应用性。

项目效果：精准招商引资：建设1个企业画像库、9条产业链，使用产业链招商和招商雷达工具，获取领域隐形冠军、潜在招商标的企业，并使用招商分析报告进行企业评估。主动企业服务：建设1个智慧企业服务平台，全生命周期服务企业，问题解决率超96%。建设1个政策知识库，基于政策图谱，面向政策侧、企业侧智能推送匹配信息，政策惠企，主动服务。区域经济分析预测：建设1个财税数据、经济数据主题库，基于重点产业、企业的多维要素，结合区域经济模型，进行多因素智能关联分析预测。

AnyDATA Framework 2在智能运维领域主要有五个方面的用途。

1. 运维知识整合与治理：对基础性的通识类运维知识、应用系统中的运维知识和场景化的运维知识的整合与治理，形成运维知识网络；

2. 运维知识搜索：将运维知识网络应用于运维知识搜索，通过知识间的关联关系，即使是陈旧性文档也可以根据相关性推荐给用户；

3. 运维知识问答：将运维知识网络用于问答机器人，当用户提出问题较为模糊时，预测用户所想，帮助用户快速发现问题答案；

4. 运维知识推荐：通过运维知识网络构建用户行为画像，智能推荐感兴趣的运维知识，便于运维获取新知识；

5. 故障根因定位：通过运维知识网络进行故障根因定位推理，确定故障根源，快速推荐故障解决方案，提升工作效率。

多方共赢，一同向全域数据知识化、业务智能化方向进发

对于开发者而言，AnyDATA Framework 2的价值在于提供一套高效领域认知智能完整的工具链，让开发者的产品和方案能力更强，成本更低，效率更高，全面提升开发者的市场竞争力。

对于甲方而言，AnyDATA Framework 2的价值有两点。

• 第一，获得高可用的领域知识网络。AnyDATA Framework 2具备领域知识网络的持续运维升级能力和丰富的上层应用，可以为甲方提供一个健壮的、有强大生命力的领域知识网络。

• 第二，实现数据资产化。通过KaaS模式，甲方可以将数据资产化，实现数据商业增值。

三年时间，AnyDATA已服务多家大型甲方客户，产品价值得到多方认可

从2019年“AnyDATA”产品诞生，到2022年发布最新产品AnyDATA Framework 2并推出开源版本，在三年时间里，AnyDATA先后推出了智慧城市企业图谱、智能知识运营、智能合同管理、制造业先进分析、智慧城市产业大脑等多个解决方案，并服务多家大型甲方客户。

未来，随着AnyDATA Framework 2和KWeaver分别在在商业端和开源端发力，领域认知智能将更快地在千行百业实现落地应用，推动AI普惠和数据价值在社会层面的释放，打造更多符合DT时代特色的数据驱动型组织。

AnyDATA Framework 2作为爱数产品矩阵的重要组成部分，持续为爱数的数据产业战略保驾护航

爱数聚焦数据产业16 年，2006年以“备份市场的创新者”角色出发，2011年成为“数据管理市场的探索者”，2019年转型成“大数据基础设施领航者”。2022年，爱数延续自身在大数据基础设施领域积累的优势，将自己定位成“数据产业从0到1的创新者”，期望在云基础设施和应用之间构建一层简洁、易用的大数据基础设施，作为全域数据能力服务商与生态伙伴共同建设生态平台，与数字伙伴共创行业应用。

在数据领域稳扎稳打多年的爱数，具备了强大的数据整合能力，构建了完备的数据产品矩阵。基于AnyBackup、AnyShare、AnyRobot、AnyFabric，完成了全域数据的整合和治理，实现数据资产化。在数据之上，基于基于领域知识网络的认知智能框架AnyDATA，爱数将原始数据加工成更智能的知识网络数据，实现数据知识化。知识化后都可在爱数参与共建的交易平台进行知识网络数据产品交易，实现数据要素化和服务化。

AnyDATA Framework 2以其开源的认知智能框架，帮助企业降低认知智能应用开发的复杂度与人才门槛，更便捷地实现认知智能，实现以知识为源的数据驱动创新。未来，AnyDATA Framework 2将持续为爱数实现数据产业战略保驾护航。

爱数新闻

爱分析调研：爱数助力企业实现领域认知智能，向数据驱动型组织迈进

提交成功！