一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信息分类方法、装置、电子设备及可读存储介质与流程

2021-11-09 23:01:00 来源:中国专利 TAG:

技术特征:
1.一种信息分类方法,其特征在于,所述方法包括:获取待识别用户信息,将所述待识别用户信息划分为数值型用户信息及字符型用户信息;将所述数值型用户信息进行归一化及向量构建处理,得到用户数值特征向量;获取所述字符型用户信息中的所有用户特征,将所述用户特征进行组合,得到用户字符特征文本;对所述用户字符特征文本进行分词处理,得到特征词语集;根据所述特征词语集中每个特征词语在所述用户字符特征文本中的位置,对每个特征词语进行位置向量转化,得到位置向量集;将所述用户数值特征向量与所述位置向量集中的每个位置向量融合,得到融合向量集;对所述融合向量集中的所有融合向量进行累加,得到累加向量;利用预构建的分类模型对所述累加向量进行分类识别,得到分类结果。2.如权利要求1所述的信息分类方法,其特征在于,所述将所述数值型用户信息进行归一化及向量构建处理,得到用户数值特征向量,包括:获取所述数值型用户信息中的每个用户特征,得到用户数值特征值;将每个所述用户数值特征值进行归一化,得到特征标准值;将所有所述特征标准值组合为预设维度的向量,得到所述用户数值特征向量。3.如权利要求1所述的信息分类方法,其特征在于,所述根据所述特征词语集中每个特征词语在所述用户字符特征文本中的位置,对每个特征词语进行位置向量转化,得到位置向量集,包括:根据所述特征词语集中每个特征词语在所述用户字符特征文本中先后顺序进行组合,得到组合词语集;根据预设的位置截断数,截断所述组合词语集得到截断词语集;将所述截断词语集作为预构建的word2vec模型的词袋,利用所述word2vec模型及所述词袋,对每个所述特征词语执行位置向量转化,得到所述位置向量集。4.如权利要求3所述的信息分类方法,其特征在于,所述根据预设的位置截断数,截断所述组合词语集得到截断词语集,包括:从所述组合词语集选择其中一个组合词语;判断在所述组合词语的左边的总词语个数及右边的总词语个数,是否均大于所述位置截断数;当所述左边的总词语个数或所述右边的总词语个数,存在小于所述位置截断数时,利用预设的填补符号执行填补操作,直到所述左边的总词语个数及所述右边的总词语个数均大于所述位置截断数时,分别从所述组合词语的左边及右边截取与所述位置截断数相同数量的词语,得到截断词语,并汇总每个截断词语及选择的所述组合词语,得到所述截断词语集。5.如权利要求4所述的信息分类方法,其特征在于,所述利用所述word2vec模型及所述词袋,对每个所述特征词语执行位置向量转化,得到所述位置向量集,包括:利用所述word2vec模型将所述词袋中每个截断词语进行向量化,得到词袋特征向量;
将每个所述词袋对应的所有词袋特征向量进行拼接得到位置向量;汇总所有所述位置向量,得到所述位置向量集。6.如权利要求1所述的信息分类方法,其特征在于,所述将所述用户数值特征向量与所述位置向量集中的每个位置向量融合,得到融合向量集,包括:将每个所述位置向量与所述用户特征向量,按照维度交叉的方法融合得到融合向量;计算所述位置向量对应的所述特征词语在用户字符特征文本中的位置,得到向量位置;根据所述向量位置将每个所述位置向量对应的融合向量依次组合,得到所述融合向量集。7.如权利要求1至6中任意一项所述的信息分类方法,其特征在于,所述利用预构建的分类模型对所述累加向量进行分类识别,得到分类结果,包括:利用所述分类模型对所述累加向量进行分类识别,得到分类概率值;判断所述分类概率值是否小于预设分类阈值,若所述分类概率值大于或等于预设的分类阈值,则分类结果为高风险信息;若所述分类概率值小于所述分类阈值,则所述分类结果为低风险信息。8.一种信息分类装置,其特征在于,包括:特征转换模块,用于获取待识别用户信息,将所述待识别用户信息划分为数值型用户信息及字符型用户信息;将所述数值型用户信息进行归一化及向量构建处理,得到用户数值特征向量,得到用户数值特征向量;获取所述字符型用户信息中的所有用户特征进行组合,得到用户字符特征文本;对所述用户字符特征文本进行分词处理,得到特征词语集;根据所述特征词语集中每个特征词语在所述用户字符特征文本中的位置,对每个特征词语进行位置向量转化,得到位置向量集;特征融合模块,用于将所述用户数值特征向量与所述位置向量集中的每个位置向量融合,得到融合向量集;对所述融合向量集中的所有融合向量进行累加,得到累加向量;信息分类模块,用于利用预构建的分类模型对所述累加向量进行分类识别,得到分类结果。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的信息分类方法。10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的信息分类方法。

技术总结
本发明涉及人工智能技术,揭露一种信息分类方法,包括:获取数值型用户信息及字符型用户信息;将数值型用户信息进行向量转化,得到用户数值特征向量;将字符型用户信息中的用户特征进行组合,得到用户字符特征文本;对用户字符特征文本进行分词,得到特征词语集;对特征词语集中每个特征词语进行位置向量转化,得到位置向量集;将用户数值特征向量与位置向量集中的向量融合,得到融合向量集;对融合向量集中所有融合向量进行累加,得到累加向量;对累加向量进行分类,得到分类结果。本发明还涉及一种区块链技术,所述字符型用户信息可以存储在区块链节点中。本发明还提出一种信息分类装置、设备以及介质。本发明可以提高信息分类的准确率。的准确率。的准确率。


技术研发人员:严杨扬
受保护的技术使用者:中国平安财产保险股份有限公司
技术研发日:2021.08.31
技术公布日:2021/11/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献