一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用户标签信息的分类方法、系统及介质与流程

2022-12-13 21:07:45 来源:中国专利 TAG:

技术特征:
1.一种用户标签信息的分类方法,其特征在于,包括:获取目标对象的标签文本;对所述标签文本进行清洗及序列化处理,得到词向量矩阵;将所述词向量矩阵中的各个词向量依次输入lstm分类器,结合训练集进行迭代分类预测,得到分类标签信息;输出保存符合预设条件的分类标签信息。2.根据权利要求1所述的一种用户标签信息的分类方法,其特征在于,所述标签文本包括第一标签文本和第二标签文本,所述获取目标对象的标签文本,包括:获取目标对象的注册数据中信息标签字段下的第一标签文本和文本描述数据中的第二标签文本;通过预设数据表整理汇总所述第一标签文本和所述第二标签文本。3.根据权利要求1所述的一种用户标签信息的分类方法,其特征在于,所述对所述标签文本进行清洗及序列化处理,得到词向量矩阵,包括:通过正则匹配方式对所述标签文本进行规范化处理,清洗所述标签文本;对清洗完成的标签文本进行分词处理,结合加权算法构建得到文本特征向量集;通过编解码模型对所述文本特征向量集进行序列化操作,得到词向量矩阵。4.根据权利要求3所述的一种用户标签信息的分类方法,其特征在于,所述对清洗完成的标签文本进行分词处理,结合加权算法构建得到文本特征向量集,包括:通过jieba分词器对清洗完成的标签文本进行分词处理,结合tf-idf算法构建得到文本特征向量集。5.根据权利要求3所述的一种用户标签信息的分类方法,其特征在于,所述编解码模型包括编码器和解码器,所述通过编解码模型对所述文本特征向量集进行序列化操作,得到词向量矩阵,包括:通过所述编码器和所述解码器对所述文本特征向量集进行编解码处理;通过seq2seq嵌入方法对所述编解码处理后的文本特征向量集进行迭代循环,得到词向量矩阵。6.根据权利要求1所述的一种用户标签信息的分类方法,其特征在于,所述将所述词向量矩阵中的各个词向量依次输入lstm分类器,结合训练集进行迭代分类预测,得到分类标签信息,包括:以所述词向量矩阵中的第一个词向量作为当前词向量;输入当前词向量至lstm分类器,通过所述lstm分类器对当前词向量进行分类预测,得到分类标签信息;通过余弦相似度计算原理,计算得到所述分类标签信息中各个标签的相关系数;将相关系数小于预设阈值的标签放入训练集训练得到训练词向量;将所述训练词向量嵌入下一个词向量做为当前词向量,然后返回所述输入当前词向量至lstm分类器,通过所述lstm分类器对当前词向量进行分类预测,得到分类标签信息这一步骤,直至所述词向量矩阵完成分类预测。7.根据权利要求6所述的一种用户标签信息的分类方法,其特征在于,所述输出保存符合预设条件的分类标签信息,包括:
输出相关系数大于预设阈值的标签数据至业务对象;或,保存相关系数大于预设阈值的标签数据至标签库。8.一种用户标签信息的分类系统,其特征在于,包括:第一模块,用于获取目标对象的标签文本;第二模块,用于对所述标签文本进行清洗及序列化处理,得到词向量矩阵;第三模块,用于将所述词向量矩阵中的各个词向量依次输入lstm分类器,结合训练集进行迭代分类预测,得到分类标签信息;第四模块,用于输出保存符合预设条件的分类标签信息。9.一种电子设备,包括处理器以及存储器;所述存储器用于存储程序;所述处理器执行所述程序实现如权利要求1至7中任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至7中任一项所述的方法。

技术总结
本发明公开了一种用户标签信息的分类方法、系统及介质,方法包括:获取目标对象的标签文本;对所述标签文本进行清洗及序列化处理,得到词向量矩阵;将所述词向量矩阵中的各个词向量依次输入LSTM分类器,结合训练集进行迭代分类预测,得到分类标签信息;输出保存符合预设条件的分类标签信息。本发明通过对标签文本的清洗及序列化处理,方便数据的规模化/量化处理;进而使用LSTM分类器,通过训练集进行迭代分类预测,能够高效计算输入标签与模型内标签匹配度,进而筛选符合预设条件的分类标签信息,提高了基于标签信息的数据挖掘和分析的准确性,可广泛应用于信息数据处理技术领域。可广泛应用于信息数据处理技术领域。可广泛应用于信息数据处理技术领域。


技术研发人员:刘敏 李创林 许东武
受保护的技术使用者:广东万丈金数信息技术股份有限公司
技术研发日:2022.08.26
技术公布日:2022/12/12
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献