一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用于知识图谱语义搜索的文本理解的方法与流程

2021-11-25 00:29:00 来源:中国专利 TAG:

技术特征:
1.一种用于知识图谱语义搜索的文本理解的方法,其特征在于,针对输入的待理解的文本,所述方法包括如下步骤:通过大规模预训练模型获得文本中每个词元的语义信息,生成语义向量;基于所述语义向量,通过卷积神经网络、实体分类用的第一softmax分类器和关系分类用的第二softmax分类器,识别出实体类型和关系类型;基于所述语义向量,通过crf进行序列标注,抽取出实体;基于所述语义向量,通过bi

lstm模型和问句分类用的第三softmax分类器,将文本进行分类;基于识别出的实体类型和关系类型、抽取出的实体、文本的分类结果,检索知识图谱获取信息作为反馈。2.根据权利要求1所述的用于知识图谱语义搜索的文本理解的方法,其特征在于,所述大规模预训练模型使用bert、roberta、erine、albert、gpt中的一种。3.根据权利要求1所述的用于知识图谱语义搜索的文本理解的方法,其特征在于,所述将文本的分类结果包括事实类、统计类、是非类和关系类。4.一种计算机存储介质,其特征在于,所述存储介质中存储有计算机程序,所述计算机程序被执行时实现权利要求1

3中任一所述的方法。5.一种用于知识图谱语义搜索的文本理解的系统,其特征在于,所述系统包括:语义获取模块,用来通过大规模预训练模型获得文本中每个词元的语义信息,生成语义向量;实体分类模块,用来基于所述语义向量,通过卷积神经网络和实体分类用的第一softmax分类器,识别出实体类型;关系分类模块,用来基于所述语义向量,通过卷积神经网络和关系分类用的第二softmax分类器,识别出关系类型;实体抽取模块,用来基于所述语义向量,通过crf进行序列标注,抽取出实体;问句分类模块,用来基于所述语义向量,通过bi

lstm模型和问句分类用的第三softmax分类器,将文本进行分类;检索反馈模块,用来基于识别出的实体类型和关系类型、抽取出的实体、文本的分类结果,检索知识图谱获取信息作为反馈。

技术总结
本发明公开了一种用于知识图谱语义搜索的文本理解的方法,针对输入的待理解的文本,所述方法包括如下步骤:通过大规模预训练模型获得文本中每个词元的语义信息,生成语义向量;基于所述语义向量,通过卷积神经网络、实体分类用的第一softmax分类器和关系分类用的第二softmax分类器,识别出实体类型和关系类型;基于所述语义向量,通过CRF进行序列标注,抽取出实体;基于所述语义向量,通过Bi


技术研发人员:陈运文 王文广 贺梦洁 纪达麒 桂洪冠 金克 冯佳妮 纪传俊
受保护的技术使用者:达观数据(苏州)有限公司
技术研发日:2021.07.30
技术公布日:2021/11/24
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献