AnyDATA Framework 3.0.0.1版本发布
本次发布AnyDATA Framework 3.0.0.1版本,发布内容如下:
随着AnyDATA Framework 3正式发布,产品核心框架与相关界面也发生了重大变化。此版本主要针对首页进行调整,展示【模型工厂】、【知识网络】和【认知应用】三个模块卡片,点击不同卡片可进入不同的模块进行相应操作。

图2 术语库入口
例如,某业务本体中需要创建【员工】实体类,而术语库中恰好有对【员工】及其属性的描述,则在添加该实体类属性时,可直接推荐邮箱、电话等属性供用户选择,帮助用户更快地完成本体创建和图谱构建。当用户在搜索“某雇员的电话号码”时,通过术语库找到【雇员】是【员工】的同义词,进而找到该员工的电话信息返回给用户。
此外,当用户想搜索某公司在华东地区的员工信息时,如果图谱数据中员工地区是上海,则无法理解用户提问的“华东地区”,而有了术语库后,根据术语库中存在【上海属于华东地区】这一关系,可以准确向用户返回上海员工的相关信息。
图3 术语库配置

图4 本体画布优化

图5 解析规则配置

图6 导入图谱名称配置
例如对于AnyShare的用户场景,术语、产品、标签、行业、客户、事件等是用户必要使用的内容,则从AnyShare的文档中抽取这些知识,构建图谱,再结合搜索等认知应用,即可让用户更快更全面的获取知识。当用户询问:内容数据湖有哪些相关文档,则会直接找到《AnyShare Family 7技术白皮书》等文档,且用户也可查看到文档中相关术语及其解释。
图7 私有化大模型答案组织配置
比如在医疗场景下询问:幽门螺杆菌感染会导致胃疼吗?则大模型根据用户输入的提示词,明确回复会引起胃疼,并且可以在子图中查看治疗方式、治疗周期等信息。

图8 私有化大模型答案生成
此外,本次还新增支持用户对所获得的图谱问答子图结果继续进行探索,挖掘更深层次的价值。例如用户还可以接着了解到确诊幽门螺杆菌感染需要做的一些检查。
此版本新增了API文档说明,用户可查看具体的接口信息,并进行接口调试,从而更清晰的调取该数据查询应用。此外,在应用的创建和使用过程中,也新增关联参数配置,用户可以将同一个参数在多个位置复用,提升应用开发效率。
随着AnyDATA Framework 3正式发布,产品核心框架与相关界面也发生了重大变化。此版本主要针对首页进行调整,展示【模型工厂】、【知识网络】和【认知应用】三个模块卡片,点击不同卡片可进入不同的模块进行相应操作。

图1 首页入口
【认知工作台-知识网络】
一、知识网络生成之知识图谱构建
- 概念库中新增术语库

图2 术语库入口
此外,当用户想搜索某公司在华东地区的员工信息时,如果图谱数据中员工地区是上海,则无法理解用户提问的“华东地区”,而有了术语库后,根据术语库中存在【上海属于华东地区】这一关系,可以准确向用户返回上海员工的相关信息。

图3 术语库配置
- 知识图谱构建流程优化
- 此版本对知识图谱构建中创建本体流程进行优化。对于画布中已有的实体类,可直接点击新建一个与之关联的实体类,省去了用户分别新建实体类和关系类的步骤。此外,对实体类、关系类侧边栏也进行了提示优化,例如当用户未添加属性或编辑了错误属性时,用户可以通过提示逐步定位到具体出错的属性,从而及时进行修正。

图4 本体画布优化
- 在图谱构建流程中添加数据进行知识抽取时,若添加的是AnyShare存储的csv,则支持用户根据具体的本体设计和业务场景,进行解析规则配置。当文件中存在分隔符不标准等问题影响了抽取,用户可在线直接修改,而无需重新编辑源文件,极大地提升了文件解析和知识抽取的灵活性。

图5 解析规则配置
- 知识图谱导入流程优化与升级
- 当用户将旧版本图谱的本体和数据导入新版本的AnyDATA时,需要先在图谱配置文件中修改版本号方可导入成功。而在此版本后,旧图谱直接导入新版本即可使用,这一改变简化了导入操作,帮助用户快速实现数据迁移。
- 用户在导入图谱时,可以在导入配置阶段就指定图谱的名称,无需进入构建流程再进行编辑。

图6 导入图谱名称配置
- 支持从文档中抽取信息构建图谱的能力
例如对于AnyShare的用户场景,术语、产品、标签、行业、客户、事件等是用户必要使用的内容,则从AnyShare的文档中抽取这些知识,构建图谱,再结合搜索等认知应用,即可让用户更快更全面的获取知识。当用户询问:内容数据湖有哪些相关文档,则会直接找到《AnyShare Family 7技术白皮书》等文档,且用户也可查看到文档中相关术语及其解释。
【认知工作台-认知应用】
一、认知搜索应用
- 图谱问答结果优化与升级

图7 私有化大模型答案组织配置

图8 私有化大模型答案生成

图9 基于子图结果继续进行探索
二、自定义认知应用:支持大模型进行意图识别
现有的认知搜索应用需要根据具体场景定制化的开发意图识别模型,方可准确地识别用户意图,精准地为用户给出答案。但模型的开发过程复杂繁琐,因此当前版本可以支持在自定义认知应用中,接入大模型,配置提示词,进行问句的意图识别,从而为用户寻找推荐准确的答案,这样极大地减少了模型的开发和配置成本。
图10 大模型意图识别配置
例如某证券公司想要了解北京车易付公司的违规信息,来分析是否有合作风险。当询问其有哪些违法行为时,大模型会识别出用户的意图是想进行企业违规情况查询,因而根据意图进入对应的图分析查询应用进行搜索,返回相应的子图结果。
图11 大模型意图识别结果
三、数据查询应用优化
当前版本的数据查询应用可直接对接第三方数据库,支持用户配置SQL语句调用数据,并基于配置生成应用,提供接口服务,后续用户在不构建图谱的情况下,可以直接调用所需数据进行认知应用的开发。此版本新增了API文档说明,用户可查看具体的接口信息,并进行接口调试,从而更清晰的调取该数据查询应用。此外,在应用的创建和使用过程中,也新增关联参数配置,用户可以将同一个参数在多个位置复用,提升应用开发效率。

图12 数据查询应用优化

图13 关联参数配置
四、图分析应用
- 新增支持力导图布局

图14 力导布局配置
- 图分析服务实体快速搜索功能优化

图15 实体快速搜索推荐
【认知工作台-模型工厂】
一、新增内置模型
模型工厂中新增信息抽取算法模型的部署,用户可通过调用接口进行使用该模型,更快更精准地对于术语、产品、标签、行业、客户、事件等知识进行抽取,构建图谱,后续再结合认知应用,即可让用户充分地将这些知识利用起来。
图16 内置模型部署
【其他优化】
- API文档中,仅保留appid为必填项,简化了认证过程。

图17 appid认证
- AnyDATA Framework 3部署在华为云时,支持直接使用华为云的数据库,从而进一步减少资源消耗。
- 涉及名称的地方统一新增键盘上的特殊字符,并调整最长输入长度,提供更友好规范的交互体验。
赞
点个赞吧!
请就本文对您的益处进行评级: