一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种诈骗文本命名实体识别方法及系统与流程

2021-11-15 15:36:00 来源:中国专利 TAG:

技术特征:
1.一种诈骗文本命名实体识别方法,其特征在于,所述方法包括:收集诈骗文本,对诈骗文本进行类别标记;使用诈骗文本和类别标记过的诈骗文本进行诈骗文本模型训练,生成诈骗文本命名实体判断模型;接收新通信文本,使用诈骗文本命名实体判断模型对新通信文本进行分析,获取新通信文本中的命名实体及类别。2.根据权利要求1所述的识别方法,其特征在于,所述对诈骗文本进行类别标记包括:使用命名实体类别,对诈骗文本中包含的命名实体进行类别标记。3.根据权利要求2所述的识别方法,其特征在于,所述命名实体类别包括人名、地名、机构、组织、金额、联系方式中的一种或多种。4.根据权利要求1所述的识别方法,其特征在于,所述使用诈骗文本和类别标记过的诈骗文本进行诈骗文本模型训练,生成诈骗文本命名实体判断模型包括:建立bilstm-crf模型;使用诈骗文本和类别标记过的诈骗文本在所述模型中训练,生成诈骗文本命名实体判断模型。5.根据权利要求1所述的识别方法,其特征在于,所述方法还包括自动更新诈骗文本命名实体判断模型;所述自动更新诈骗文本命名实体判断模型包括:周期性收集多条新的诈骗文本,对新的诈骗文本进行类别标记;使用新的诈骗文本和类别标记过的新的诈骗文本进行诈骗文本模型训练,生成新的诈骗文本命名实体判断模型。6.一种诈骗文本命名实体识别系统,其特征在于,所述系统包括:数据查询管理模块,用于收集诈骗文本,对诈骗文本进行类别标记;模型自学习模块,用于使用诈骗文本和类别标记过的诈骗文本进行诈骗文本模型训练,生成诈骗文本命名实体判断模型;实时检测模块,用于接收新通信文本,使用诈骗文本命名实体判断模型对新通信文本进行分析,获取新通信文本中的命名实体及类别。7.根据权利要求6所述的识别系统,其特征在于,所述对诈骗文本进行类别标记包括:使用命名实体类别,对诈骗文本中包含的命名实体进行类别标记。8.根据权利要求7所述的识别系统,其特征在于,所述命名实体类别包括人名、地名、机构、组织、金额、联系方式中的一种或多种。9.根据权利要求6所述的识别系统,其特征在于,所述模型自学习模块包括:建立组件,用于建立bilstm-crf模型;训练组件,用于使用诈骗文本和类别标记过的诈骗文本在所述模型中训练;
生成组件,用于生成诈骗文本命名实体判断模型。10.根据权利要求6所述的识别系统,其特征在于,所述系统还包括:模型自更新模块,所述模型自更新模块用于周期性收集多条新的诈骗文本,对新的诈骗文本进行类别标记;使用新的诈骗文本和类别标记过的新的诈骗文本进行诈骗文本模型训练,生成新的诈骗文本命名实体判断模型。

技术总结
本发明提出一种诈骗文本命名实体识别方法,包括:收集诈骗文本,对诈骗文本进行类别标记;使用诈骗文本和类别标记过的诈骗文本进行诈骗文本模型训练,生成诈骗文本命名实体判断模型;接收新通信文本,使用诈骗文本命名实体判断模型对新通信文本进行分析,获取新通信文本中的命名实体及类别。本发明针对诈骗文本手段不断变化,收集大量的历史诈骗文本,构建诈骗文本命名实体判断模型,周期性收集多条历史诈骗文本的相关数据对诈骗文本命名实体判断模型进行自回溯验证,对新通讯文本命名实体识别进行实时验证,实现系统自动化分析处理与人工校准相结合,有效识别新型诈骗文本中的命名实体,通过自动验证不断完善系统模型,实现系统自动化。统自动化。统自动化。


技术研发人员:张震 刘发强 孙旭东 刘志会 曹勇 高欢
受保护的技术使用者:天津市国瑞数码安全系统股份有限公司
技术研发日:2020.04.27
技术公布日:2021/11/14
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献