爱数博客

全部 AnyBackup AnyShare AnyRobot AnyDATA AnyFabric DIP

AnyDATA Framework 3.0.0.1版本发布

2023-11-10 2793 0

本次发布AnyDATA Framework 3.0.0.1版本，发布内容如下：
随着AnyDATA Framework 3正式发布，产品核心框架与相关界面也发生了重大变化。此版本主要针对首页进行调整，展示【模型工厂】、【知识网络】和【认知应用】三个模块卡片，点击不同卡片可进入不同的模块进行相应操作。

图1 首页入口

【认知工作台-知识网络】

一、知识网络生成之知识图谱构建

概念库中新增术语库

新增术语库，支持用户对概念的描述，近反义词，上下位关系等做统一标识和管理，使其具有业务属性。在后续可助力业务领域的知识网络构建，进而支撑上层应用开发，提升分析、搜索等功能的效率和准确性。

图2 术语库入口

例如，某业务本体中需要创建【员工】实体类，而术语库中恰好有对【员工】及其属性的描述，则在添加该实体类属性时，可直接推荐邮箱、电话等属性供用户选择，帮助用户更快地完成本体创建和图谱构建。当用户在搜索“某雇员的电话号码”时，通过术语库找到【雇员】是【员工】的同义词，进而找到该员工的电话信息返回给用户。
此外，当用户想搜索某公司在华东地区的员工信息时，如果图谱数据中员工地区是上海，则无法理解用户提问的“华东地区”，而有了术语库后，根据术语库中存在【上海属于华东地区】这一关系，可以准确向用户返回上海员工的相关信息。

图3 术语库配置

知识图谱构建流程优化

此版本对知识图谱构建中创建本体流程进行优化。对于画布中已有的实体类，可直接点击新建一个与之关联的实体类，省去了用户分别新建实体类和关系类的步骤。此外，对实体类、关系类侧边栏也进行了提示优化，例如当用户未添加属性或编辑了错误属性时，用户可以通过提示逐步定位到具体出错的属性，从而及时进行修正。

图4 本体画布优化

在图谱构建流程中添加数据进行知识抽取时，若添加的是AnyShare存储的csv，则支持用户根据具体的本体设计和业务场景，进行解析规则配置。当文件中存在分隔符不标准等问题影响了抽取，用户可在线直接修改，而无需重新编辑源文件，极大地提升了文件解析和知识抽取的灵活性。

图5 解析规则配置

知识图谱导入流程优化与升级

当用户将旧版本图谱的本体和数据导入新版本的AnyDATA时，需要先在图谱配置文件中修改版本号方可导入成功。而在此版本后，旧图谱直接导入新版本即可使用，这一改变简化了导入操作，帮助用户快速实现数据迁移。
用户在导入图谱时，可以在导入配置阶段就指定图谱的名称，无需进入构建流程再进行编辑。

图6 导入图谱名称配置

支持从文档中抽取信息构建图谱的能力

企业内部文档数据往往更新快、存放较分散，用户需花费大量时间进行查询文档以获取信息。因而此次版本提供了命名实体抽取的能力，可根据具体业务场景，梳理用户必要使用的内容，生成本体，从内部文档中快速抽取知识，进而构建知识图谱，实现企业知识体系自动关联，再结合认知搜索和相关推荐能力，使用户更高效精准地获取知识。
例如对于AnyShare的用户场景，术语、产品、标签、行业、客户、事件等是用户必要使用的内容，则从AnyShare的文档中抽取这些知识，构建图谱，再结合搜索等认知应用，即可让用户更快更全面的获取知识。当用户询问：内容数据湖有哪些相关文档，则会直接找到《AnyShare Family 7技术白皮书》等文档，且用户也可查看到文档中相关术语及其解释。

【认知工作台-认知应用】

一、认知搜索应用

图谱问答结果优化与升级

图谱问答的答案组织方式配置中，支持用户使用私有化大模型进行答案生成。通过使用私有化部署的大模型，避免了对外暴露数据，保证了数据的安全可控。并且针对使用不同的私有化大模型，用户可灵活的调整提示词，使大模型在具体场景下有更好的表现，进而给出正确、通顺、易于理解的文本答案，降低用户的理解成本。

图7 私有化大模型答案组织配置

比如在医疗场景下询问：幽门螺杆菌感染会导致胃疼吗？则大模型根据用户输入的提示词，明确回复会引起胃疼，并且可以在子图中查看治疗方式、治疗周期等信息。

图8 私有化大模型答案生成

此外，本次还新增支持用户对所获得的图谱问答子图结果继续进行探索，挖掘更深层次的价值。例如用户还可以接着了解到确诊幽门螺杆菌感染需要做的一些检查。

图9 基于子图结果继续进行探索

二、自定义认知应用：支持大模型进行意图识别

现有的认知搜索应用需要根据具体场景定制化的开发意图识别模型，方可准确地识别用户意图，精准地为用户给出答案。但模型的开发过程复杂繁琐，因此当前版本可以支持在自定义认知应用中，接入大模型，配置提示词，进行问句的意图识别，从而为用户寻找推荐准确的答案，这样极大地减少了模型的开发和配置成本。

图10 大模型意图识别配置

例如某证券公司想要了解北京车易付公司的违规信息，来分析是否有合作风险。当询问其有哪些违法行为时，大模型会识别出用户的意图是想进行企业违规情况查询，因而根据意图进入对应的图分析查询应用进行搜索，返回相应的子图结果。

图11 大模型意图识别结果

三、数据查询应用优化

当前版本的数据查询应用可直接对接第三方数据库，支持用户配置SQL语句调用数据，并基于配置生成应用，提供接口服务，后续用户在不构建图谱的情况下，可以直接调用所需数据进行认知应用的开发。
此版本新增了API文档说明，用户可查看具体的接口信息，并进行接口调试，从而更清晰的调取该数据查询应用。此外，在应用的创建和使用过程中，也新增关联参数配置，用户可以将同一个参数在多个位置复用，提升应用开发效率。