公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111627289.6 (22)申请日 2021.12.28 (71)申请人 北方工业大 学 地址 100144 北京市石景山区晋元庄路5号 (72)发明人 史运涛 王琦 王力 李书钦  李杰 殷翔 董哲  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 代理人 毛宏宝 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06K 9/62(2022.01) G06N 3/02(2006.01) (54)发明名称 一种基于知识图谱的研讨数据展示方法及 系统 (57)摘要 本发明提供一种基于知识图谱的研讨数据 展示方法及系统, 该方法包括: 获取专家研讨语 音数据, 并对专家研讨语音数据进行语音识别处 理, 得到专家研讨文本数据; 将专家研讨文本数 据输入至训练好的向量提取模型, 得到专家研讨 文本数据对应的知识表示向量; 将知识表示向量 与预设的历史知识图谱进行匹配, 在匹配成功的 情况下, 将匹配到的历史知识图谱进行展示; 在 匹配失败的情况下, 基于专家 研讨文本数据构建 新知识图谱, 将新知识图谱与历史知识图谱进行 融合, 并对新知识图谱进行展示。 本发明能够根 据专家研讨内容提供全面的知识展示, 并根据 专 家的研讨过程形成新的知识, 为专家快速准确地 得到研判结果 提供了数据基础。 权利要求书3页 说明书15页 附图4页 CN 114398464 A 2022.04.26 CN 114398464 A 1.一种基于知识图谱的研讨数据展示方法, 其特 征在于, 包括: 获取专家研讨语音数据, 并对所述专家研讨语音数据进行语音识别处理, 得到专家研 讨文本数据; 将所述专家研讨文本数据输入至训练好的向量提取模型, 得到所述专家研讨文本数据 对应的知识 表示向量; 将所述知识表示向量与预设的历史知识图谱进行匹配, 在匹配成功 的情况下, 将匹配 到的所述历史知识图谱进行展示; 在匹配失败的情况下, 基于所述专家研讨文本数据构建 新知识图谱, 将所述新知识图谱与所述历史知识图谱进行融合, 并对所述新知识图谱进行 展示。 2.根据权利要求1所述的一种基于知识图谱的研讨 数据展示方法, 其特征在于, 所述向 量提取模型包括依次连接的第一自编码语言模型和第一深度学习模型; 所述将所述专家研讨文本数据输入至训练好的向量提取模型, 得到所述专家研讨文本 数据对应的知识 表示向量, 包括: 将所述专家研讨文本数据输入至训练好的所述第 一自编码语言模型, 得到所述专家研 讨文本数据对应的词向量; 将所述词向量输入至训练好的所述第 一深度学习模型, 得到所述专家研讨文本数据对 应的知识 表示向量。 3.根据权利要求2所述的一种基于知识图谱的研讨 数据展示方法, 其特征在于, 所述第 一自编码语言模型的训练, 包括: 获取包括若干个知识图谱样本的预设训练集, 并基于所述若干个知识图谱样本的实体 类型和关系类型对所述若干个知识图谱样本的实体进行 标注, 得到标注样本集; 基于所述标注样本集对所述第 一自编码语言模型进行训练, 以得到训练好的所述第 一 自编码语言模型。 4.根据权利要求3所述的一种基于知识图谱的研讨 数据展示方法, 其特征在于, 所述第 一深度学习模型的训练, 包括: 将所述若干个知识图谱样本输入至图嵌入模型, 得到所述若干个知识图谱样本的知识 表示向量; 获取所述若干个知识图谱样本对应的三元组数据的词向量; 以所述若干个知识图谱样本对应的三元组数据的词向量为输入, 以所述若干个知识图 谱样本的知识表示向量为 目标输出, 对所述第一深度学习模型进行训练, 以得到训练好的 所述第一深度学习模型。 5.根据权利要求1所述的一种基于知识图谱的研讨 数据展示方法, 其特征在于, 所述基 于所述专 家研讨文本数据构建新知识图谱, 包括: 将所述专家研讨文本数据输入至训练好的实体识别模型, 得到所述专家研讨文本数据 对应的命名实体; 基于所述专家研讨文本数据对应的命名实体在预设数据库中进行知识匹配; 其中, 所 述预设数据库中存 储有文本知识; 在知识匹配成功的情况 下, 基于匹配到的所述文本知识构建新知识图谱; 在知识匹配失败的情况下, 基于所述专家研讨文本数据对应的命名实体构建新知识图权 利 要 求 书 1/3 页 2 CN 114398464 A 2谱。 6.根据权利要求5所述的一种基于知识图谱的研讨 数据展示方法, 其特征在于, 所述实 体识别模型包括依次连接的第二自编码语言模型、 第二深度学习模型和判别式模型; 所述将所述专家研讨文本数据输入至训练好的实体识别模型, 得到所述专家研讨文本 数据对应的命名实体, 包括: 将所述专家研讨文本数据输入至训练好的所述第 二自编码语言模型, 得到所述专家研 讨文本数据对应的词向量; 将所述专家研讨文本数据对应的词向量输入至所述第 二深度学习 模型, 得到所述专家 研讨文本数据对应的词向量的实体 类型, 作为初始实体 类型; 将所述初始实体 类型输入至所述判别式模型, 得到修 正实体类型; 基于所述专家研讨文本数据对应的词向量以及相应的所述修正实体类型, 得到所述专 家研讨文本数据对应的命名实体。 7.根据权利要求5所述的一种基于知识图谱的研讨 数据展示方法, 其特征在于, 所述基 于匹配到的所述文本知识构建新知识图谱, 包括: 将所述文本知识输入至训练好的所述实体识别模型, 得到所述文本知识对应的命名实 体; 基于所述文本知识对应的命名实体构建新知识图谱。 8.根据权利要求1所述的一种基于知识图谱的研讨 数据展示方法, 其特征在于, 所述将 所述新知识图谱与所述历史知识图谱进行融合, 包括: 分别对所述历史知识图谱和所述新知识图谱进行知识表示嵌入, 得到所述历史知识图 谱对应的实体向量和所述 新知识图谱 对应的实体向量; 对所述历史知识图谱对应的实体向量和所述新知识图谱对应的实体向量进行相似度 计算; 在所述相似度 大于或等于预设值的情况下, 将所述历史知识图谱对应的实体向量和所 述新知识图谱对应的实体向量作为同一个节点, 以将所述新知识图谱与所述历史知识图谱 进行融合; 在所述相似度小于所述预设值的情况下, 将所述新知识图谱对应的实体向量作为新节 点, 并增加到所述历史知识图谱, 以将所述 新知识图谱与所述历史知识图谱进行融合。 9.一种基于知识图谱的研讨数据展示系统, 其特 征在于, 包括: 数据获取模块, 用于获取专家研讨语音数据, 并对所述专家研讨语音数据进行语音识 别处理, 得到专 家研讨文本数据; 向量提取模块, 用于将所述专家研讨文本数据输入至训练好的向量提取模型, 得到所 述专家研讨文本数据对应的知识 表示向量; 知识图谱展示模块, 用于将所述知识表示向量与预设的历史知识图谱进行匹配, 在匹 配成功的情况下, 将匹配到的所述历史知识图谱进 行展示; 在匹配失败的情况下, 基于所述 专家研讨文本数据构建新知识图谱, 将所述新知识图谱与所述历史知识图谱进行融合, 并 对所述新知识图谱进行展示。 10.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至8任一项所权 利 要 求 书 2/3 页 3 CN 114398464 A 3

.PDF文档 专利 一种基于知识图谱的研讨数据展示方法及系统

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的研讨数据展示方法及系统 第 1 页 专利 一种基于知识图谱的研讨数据展示方法及系统 第 2 页 专利 一种基于知识图谱的研讨数据展示方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:41:32上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。