一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种会话信息抽取方法、系统、电子设备及存储介质与流程

2021-12-07 21:18:00 来源:中国专利 TAG:

技术特征:
1.一种会话信息抽取方法,其特征在于,包括:序列划分标注步骤,对于待抽取对话所述的领域,构建一领域知识图谱,对所述对话进行序列划分,并对所述序列中涉及所述领域知识图谱的内容进行标注;实体属性编码步骤,获取所述序列中的字符实体表示和字符属性表示,并进一步获取所述领域知识图谱的候选实体表示和候选属性表示;嵌入匹配计算步骤,根据所述候选实体表示通过注意力机制对所述字符实体表示计算第一嵌入,并根据所述候选属性表示通过注意力机制对所述字符属性表示计算第二嵌入;嵌入集成交互步骤,将所述第一嵌入和所述第二嵌入进行交互,获取所述对话的最终特征矩阵;模型构建实施步骤,根据所述最终特征矩阵进行打分和模型训练,并通过训练完成的所述模型进行会话信息的抽取。2.根据权利要求1所述的会话信息抽取方法,其特征在于,所述序列划分标注步骤进一步包括:将所述对话切分为若干对话阶段,再通过滑窗方式将每个所述对话阶段划分为所述序列。3.根据权利要求1所述的会话信息抽取方法,其特征在于,所述实体属性编码步骤进一步包括:编码器结构为在双向lstm结构输出的结果之上堆叠自注意力机制层。4.根据权利要求1所述的会话信息抽取方法,其特征在于,所述嵌入集成交互步骤进一步包括:将所述第一嵌入和所述第二嵌入中的每个字符的嵌入向量逐个拼接,获得所述最终特征矩阵。5.一种会话信息抽取系统,其特征在于,包括:序列划分标注模块,对于待抽取对话所述的领域,构建一领域知识图谱,对所述对话进行序列划分,并对所述序列中涉及所述领域知识图谱的内容进行标注;实体属性编码模块,获取所述序列中的字符实体表示和字符属性表示,并进一步获取所述领域知识图谱的候选实体表示和候选属性表示;嵌入匹配计算模块,根据所述候选实体表示通过注意力机制对所述字符实体表示计算第一嵌入,并根据所述候选属性表示通过注意力机制对所述字符属性表示计算第二嵌入;嵌入集成交互模块,将所述第一嵌入和所述第二嵌入进行交互,获取所述对话的最终特征矩阵;模型构建实施模块,根据所述最终特征矩阵进行打分和模型训练,并通过训练完成的所述模型进行会话信息的抽取。6.根据权利要求5所述的会话信息抽取系统,其特征在于,所述序列划分标注模块进一步包括:将所述对话切分为若干对话阶段,再通过滑窗方式将每个所述对话阶段划分为所述序列。7.根据权利要求5所述的会话信息抽取系统,其特征在于,所述实体属性编码模块进一步包括:编码器结构为在双向lstm结构输出的结果之上堆叠自注意力机制层。8.根据权利要求5所述的会话信息抽取系统,其特征在于,所述嵌入集成交互模块进一步包括:将所述第一嵌入和所述第二嵌入中的每个字符的嵌入向量逐个拼接,获得所述最终特征矩阵。9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上
运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的会话信息抽取方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4中任一项所述的会话信息抽取方法。

技术总结
本发明提出一种会话信息抽取方法、系统、电子设备及存储介质,其方法技术方案包括对于待抽取对话的领域,构建一领域知识图谱,对对话进行序列划分,并对序列中涉及领域知识图谱的内容进行标注;获取序列中的字符实体表示和字符属性表示,并进一步获取领域知识图谱的候选实体表示和候选属性表示;根据候选实体表示通过注意力机制对字符实体表示计算第一嵌入,并根据候选属性表示通过注意力机制对字符属性表示计算第二嵌入;将第一嵌入和第二嵌入进行交互,获取对话的最终特征矩阵;根据最终特征矩阵进行打分和模型训练,并通过训练完成的模型进行会话信息的抽取。本申请解决了现有方法灵活度低、难以应对复杂结构和高专业度对话的问题。的问题。的问题。


技术研发人员:付骁弈 吴信东 黄艳香
受保护的技术使用者:上海明略人工智能(集团)有限公司
技术研发日:2021.09.09
技术公布日:2021/12/6
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献