一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

人物性别识别方法、装置、电子设备及存储介质与流程

2022-12-07 09:18:42 来源:中国专利 TAG:

技术特征:
1.一种人物性别识别方法,其特征在于,包括:确定第一目标语料,所述第一目标语料中包括至少一个人物姓名;对所述第一目标语料中包括的各人物姓名进行人物性别预标注,获得第二目标语料;将所述第二目标语料输入至训练完成的人物性别识别模型,获得所述人物性别识别模型输出的预测结果;基于所述预测结果,确定所述第一目标语料中包括的各人物姓名分别对应的人物性别。2.根据权利要求1所述的人物性别识别方法,其特征在于,在所述将所述第二目标语料输入至训练完成的人物性别识别模型,获得所述人物性别识别模型输出的预测结果之前,所述方法还包括:提取第一样本语料中包括的各人物姓名分别对应的性别分类特征;基于所述第一样本语料和所述性别分类特征生成训练语料,所述训练语料中携带有样本标签;基于所述训练语料训练人物性别识别模型,获得所述训练完成的人物性别识别模型;其中,所述性别分类特征包括男性、女性和未知性别。3.根据权利要求2所述的人物性别识别方法,其特征在于,所述基于所述训练语料训练人物性别识别模型,获得所述训练完成的人物性别识别模型,包括:基于所述训练语料和逻辑回归模型训练人物性别识别模型,获得所述训练完成的人物性别识别模型。4.根据权利要求2所述的人物性别识别方法,其特征在于,所述提取第一样本语料中包括的各人物姓名分别对应的性别分类特征,包括:基于预训练语言模型提取第一样本语料中包括的各人物姓名分别对应的性别分类特征。5.根据权利要求4所述的人物性别识别方法,其特征在于,所述预训练语言模型为bert模型。6.根据权利要求2-5任一项所述的人物性别识别方法,其特征在于,在所述提取第一样本语料中包括的各人物姓名分别对应的性别分类特征之前,所述方法还包括:确定第二样本语料,所述第二样本语料中包括至少一个人物姓名和所述至少一个人物姓名对应的人物性别特征;获取对所述第二样本语料进行人工标注后的所述第一样本语料,所述第一样本语料中包括的各人物姓名具有对应的性别分类特征;其中,所述人物性别特征包括人物关系称谓或人称代词。7.一种人物性别识别装置,其特征在于,包括:第一确定模块,用于确定第一目标语料,所述第一目标语料中包括至少一个人物姓名;标注模块,用于对所述第一目标语料中包括的各人物姓名进行人物性别预标注,获得第二目标语料;识别模块,用于将所述第二目标语料输入至训练完成的人物性别识别模型,获得所述人物性别识别模型输出的预测结果;第二确定模块,用于基于所述预测结果,确定所述第一目标语料中包括的各人物姓名
分别对应的人物性别。8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述人物性别识别方法。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述人物性别识别方法。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述人物性别识别方法。

技术总结
本发明提供一种人物性别识别方法、装置、电子设备及存储介质,涉及数据处理技术领域,所述方法包括:确定第一目标语料,所述第一目标语料中包括至少一个人物姓名;对所述第一目标语料中包括的各人物姓名进行人物性别预标注,获得第二目标语料;将所述第二目标语料输入至训练完成的人物性别识别模型,获得所述人物性别识别模型输出的预测结果;基于所述预测结果,确定所述第一目标语料中包括的各人物姓名分别对应的人物性别。本发明通过对第一目标语料中包括的人物姓名进行人物性别预标注获得第二目标语料,并将第二目标语料输入至人物性别识别模型以进行人物性别预测,从而实现对待翻译文档中涉及的人物进行自动化地人物性别识别。别识别。别识别。


技术研发人员:毛红保
受保护的技术使用者:语联网(武汉)信息技术有限公司
技术研发日:2022.10.12
技术公布日:2022/12/6
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献