AnyDATA Framework 3.0.0.1版本发布
本次发布 AnyDATA Framework 3.0.0.1版本,发布内容如下:
随着 AnyDATA Framework 3 正式发布,产品核心框架与相关界面也发生了重大变化 。 此版本主要针对首页进行调整,展示【 模型工厂 】 、 【 知识网络 】 和 【 认知应用 】三个模块卡片,点击不同卡片可进入不同的模块进行相应操作。
图 1 首页入口
【 认知工作台 - 知识网络 】
一、知识网络生成之知识图谱构建
概念库中新增术语库
新增术语库,支持用户对概念的描述,近反义词,上下位关系等做统一标识和管理,使其具有业务属性。在后续可助力业务领域的知识网络构建,进而支撑上层应用开发,提升分析、搜索等功能的效率和准确性。
图 2 术语库入口
例如,某业务本体中需要创建【员工】实体类,而术语库中恰好有对【员工】及其属性的描述,则在添加该实体类属性时,可直接推荐邮箱、电话等属性供用户选择,帮助用户更快地完成本体创建和图谱构建。当用户在搜索 “某雇员的电话号码”时,通过术语库找到【雇员】是【员工】的同义词,进而找到该员工的电话信息返回给用户。
此外, 当用户想搜索某公司在华东地区的员工信息时, 如果图谱数据中员工地区是上海,则无法理解用户提问的 “华东地区”,而有了术语库后,根据术语库中存在【上海属于华东地区】这一关系,可以准确向用户返回上海员工的相关信息。
图 3 术语库配置
知识图谱构建流程优化
此版本对知识图谱构建中创建本体流程进行优化。对于画布中已有的实体类,可直接点击新建一个与之关联的实体类,省去了用户分别新建实体类和关系类的步骤。此外,对实体类、关系类侧边栏也进行了提示优化,例如当用户未添加属性或编辑了错误属性时,用户可以通过提示逐步定位到具体出错的属性,从而及时进行修正。
图 4 本体画布优化
在图谱构建流程中添加数据进行知识抽取时,若添加的是 AnyShare 存储的 csv ,则支持用户根据具体的本体设计和业务场景,进行解析规则配置。当文件中存在分隔符不标准等问题影响了抽取,用户可在线直接修改,而无需重新编辑源文件,极大地提升了文件解析和知识抽取的灵活性。
图 5 解析规则配置
知识图谱导入流程优化与升级
当用户将旧版本图谱的本体和数据导入新版本的 AnyDATA 时,需要先在图谱配置文件中修改版本号方可导入成功。而在此版本后,旧图谱直接导入新版本即可使用,这一改变简化了导入操作,帮助用户快速实现数据迁移。
用户在导入图谱时,可以在导入配置阶段就指定图谱的名称,无需进入构建流程再进行编辑。
图 6 导入图谱名称配置
支持从文档中抽取信息构建图谱的能力
企业内部文档数据往往更新快、存放较分散,用户需花费大量时间进行查询文档以获取信息。因而此次版本提供了命名实体抽取的能力,可根据具体业务场景,梳理用户必要使用的内容,生成本体,从内部文档中快速抽取知识,进而构建知识图谱,实现企业知识体系自动关联,再结合认知搜索和相关推荐能力,使用户更高效精准地获取知识。
例如对于 Any Share 的用户场景, 术语、产品、标签、行业、客户、事件 等是用户必要使用的内容,则从 Any Share 的文档中抽取这些知识,构建图谱,再结合搜索等认知应用,即可让用户更快更全面的获取知识。当用户询问:内容数据湖有哪些相关文档,则会直接找到《 Any Share F amily 7 技术白皮书》等文档,且用户也可查看到文档中相关术语及其解释。
【 认知工作台 - 认知应用 】
一、认知搜索 应用
图谱问答结果优化与升级
图谱问答的答案组织方式配置中,支持用户使用私有化大模型进行答案生成。通过使用私有化部署的大模型,避免了对外暴露数据,保证了数据的安全可控。并且针对使用不同的私有化大模型,用户可灵活的调整提示词,使大模型在具体场景下有更好的表现,进而给出 正确、通顺、易于理解的文本答案 ,降低用户的理解成本。
图 7 私有化大模型答案组织配置
比如在医疗场景下询问:幽门螺杆菌感染会导致胃疼吗?则大模型根据用户输入的提示词,明确回复会引起胃疼,并且可以在子图中查看治疗方式、治疗周期等信息。
图 8 私有化大模型答案生成
此外,本次还新增支持用户对所获得的图谱问答子图结果继续进行探索,挖掘更深层次的价值。例如用户还可以接着了解到确诊幽门螺杆菌感染需要做的一些检查。
图 9 基于子图结果继续进行探索
二、自定义认知应用:支持大模型进行意图识别
现有的认知搜索应用需要根据具体场景定制化的开发意图识别模型,方可准确地识别用户意图,精准地为用户给出答案。但模型的开发过程复杂繁琐,因此当前版本可以支持在自定义认知应用中,接入大模型,配置提示词,进行问句的意图识别,从而为用户寻找推荐准确的答案,这样极大地减少了模型的开发和配置成本。
图 1 0 大模型意图识别配置
例如某证券公司想要了解北京车易付公司的违规信息,来分析是否有合作风险。当询问其有哪些违法行为时,大模型会识别出用户的意图是想进行企业违规情况查询,因而根据意图进入对应的图分析查询应用进行搜索,返回相应的子图结果。
图 1 1 大模型意图识别结果
三、数据查询应用优化
当前版本的数据查询应用可直接对接第三方数据库,支持用户配置 SQL 语句调用数据,并基于配置生成应用,提供接口服务,后续用户在不构建图谱的情况下,可以直接调用所需数据进行认知应用的开发。
此版本新增了 API 文档说明,用户可查看具体的接口信息,并进行接口调试,从而更清晰的调取该数据查询应用。此外,在应用的创建和使用过程中,也新增关联参数配置,用户可以将同一个参数在多个位置复用,提升应用开发效率。
图 1 2 数据查询应用优化
图 1 3 关联参数配置
四、图分析 应用
新增支持力导图布局
图分析布局方式中新增力导图布局,用户可以调整相应配置,获取更丝滑的布局体验,从而提升数据探索和分析的效率。
图 1 4 力导布局配置
图分析服务实体快速搜索功能优化
图分析服务的实体快速搜索下拉框新增推荐实体,为用户搜索提供参考,提升了交互体验。
图 1 5 实体快速搜索推荐
【 认知工作台 - 模型工厂 】
一、新增内置模型
模型工厂中新增信息抽取算法模型的部署,用户可通过调用接口进行使用该模型,更快更精准地对于 术语、产品、标签、行业、客户、事件 等知识进行抽取,构建图谱,后续再结合认知应用,即可让用户充分地将这些知识利用起来。
图 1 6 内置模型部署
【 其他 优化】
API 文档中,仅保留 appid 为必填项,简化了认证过程。
图 1 7 appid 认证
AnyDATA Framework 3 部署在华为云时, 支持直接使用华为云的数据库,从而进一步减少资源消耗。
涉及名称的地方统一 新增键盘上的特殊字符,并调整 最长输入长度 ,提供更友好规范的交互体验。