一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

特征编码模型训练方法及装置、媒体对象推荐方法及装置与流程

2023-01-15 11:05:35 来源:中国专利 TAG:

技术特征:
1.一种特征编码模型训练方法,其特征在于,所述方法包括:构建待训练的特征编码模型,以及获取目标样本、正样本、负样本和对比样本的初始向量;根据所述特征编码模型对所述目标样本、所述正样本和所述负样本各自的初始向量进行特征编码,获得各样本的编码向量,并计算各样本的编码向量分别与预设用户兴趣群体矩阵之间的关联性向量;计算所述目标样本对应的关联性向量与所述正样本对应的关联性向量之间的第一相似度值,以及计算所述目标样本对应的关联性向量与所述负样本对应的关联性向量之间的第二相似度值,根据所述第一相似度值和所述第二相似度值计算第一损失值;将所述对比样本的初始向量中包含的多个特征分别对应的特征向量进行分组,得到所述对比样本对应的多个特征向量组,并对所述多个特征向量组进行不同的特征掩码处理,得到对应的多个掩码向量,根据所述特征编码模型对所述多个掩码向量分别进行特征编码,获得所述对比样本对应的多个编码向量;计算同一对比样本的多个编码向量之间的第三相似度值,以及计算不同对比样本的编码向量之间的第四相似度值,根据所述第三相似度值和所述第四相似度值计算第二损失值;基于所述第一损失值和所述第二损失值对所述特征编码模型进行联合训练。2.根据权利要求1所述的方法,其特征在于,所述将所述对比样本的初始向量中包含的多个特征分别对应的特征向量进行分组,得到所述对比样本对应的多个特征向量组,包括:根据所述对比样本的初始向量计算对应的特征关联矩阵;从所述对比样本的初始向量中采样得到种子特征,并基于所述种子特征和所述特征关联矩阵对所述初始向量中包含的多个特征对应的特征向量进行分组,以得到所述对比样本对应的多个特征向量组。3.根据权利要求2所述的方法,其特征在于,所述根据对比样本的初始向量计算对应的特征关联矩阵,包括:对所述对比样本的初始向量中包含的任意两个特征对应的特征向量计算关联性,并根据所述任意两个特征对应的特征向量之间的关联性构建初始关联矩阵;根据当前对应的训练步数对所述初始关联矩阵中的各元素进行动态更新,以得到所述特征关联矩阵。4.根据权利要求1所述的方法,其特征在于,所述对所述多个特征向量组进行不同的特征掩码处理,得到对应的多个掩码向量,包括:从预设的数据增强操作符集合中随机采样多个数据增强操作符;基于采样得到的多个数据增强操作符分别对所述多个特征向量组进行特征掩码处理,以得到对应的多个掩码向量。5.根据权利要求1所述的方法,其特征在于,所述基于所述第一损失值和所述第二损失值对所述特征编码模型进行联合训练,包括:获取所述特征编码模型对应的参数正则化强度值;计算所述参数正则化强度值和所述第二损失值之间的权重和,并计算所述权重和与所述第一损失值之间的总和值;
将所述总和值作为所述训练损失总值对所述特征编码模型进行训练。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取媒体对象推荐数据日志和媒体对象元数据,所述媒体对象推荐数据日志中含有媒体对象到媒体对象的召回信息;根据所述媒体对象推荐数据日志计算媒体对象到媒体对象的召回成功率,以及从所述媒体对象元数据中提取出多个特征;将召回成功率大于预设全局概率的媒体对象组中的参照媒体对象和推荐媒体对象分别确定为目标样本和正样本,并对确定出的正样本进行负采样得到对应的多个负样本,以及对所述媒体对象推荐数据日志进行采样以得到对比样本。7.一种媒体对象推荐方法,其特征在于,所述方法包括:获取待推荐媒体对象的初始向量,并采用如权利要求1-6中任一项所述的方法训练得到的特征编码模型根据所述初始向量计算所述待推荐媒体对象的编码向量;计算所述编码向量与预设用户兴趣群体矩阵之间的关联性向量;在向量池中查询与所述待推荐媒体对象的关联性向量近似的多个目标媒体对象,所述向量池用于存储预收集的媒体对象的关联性向量,并且所述预收集的媒体对象的关联性向量是通过所述特征编码模型获得对应的编码向量后,基于所述预设用户兴趣群体矩阵计算出的;根据各目标媒体对象的关联性向量与所述待推荐媒体对象的关联性向量之间的近似度数值,对所述多个目标媒体对象进行排序,并基于排序结果将所述待推荐媒体对象推荐至所述目标媒体对象关联的用户。8.一种特征编码模型训练装置,其特征在于,所述装置包括:构建模块,配置为构建待训练的特征编码模型,以及获取目标样本、正样本、负样本和对比样本的初始向量;第一提取模块,配置根据所述特征编码模型对所述目标样本、所述正样本和所述负样本各自的初始向量进行特征编码,获得各样本的编码向量,并计算各样本的编码向量分别与预设用户兴趣群体矩阵之间的关联性向量;第一计算模块,配置为计算所述目标样本对应的关联性向量与所述正样本对应的关联性向量之间的第一相似度值,以及计算所述目标样本对应的关联性向量与所述负样本对应的关联性向量之间的第二相似度值,根据所述第一相似度值和所述第二相似度值计算第一损失值;第二提取模块,配置为将所述对比样本的初始向量中包含的多个特征分别对应的特征向量进行分组,得到所述对比样本对应的多个特征向量组,并对所述多个特征向量组进行不同的特征掩码处理,得到对应的多个掩码向量,根据所述特征编码模型对所述多个掩码向量分别进行特征编码,获得所述对比样本对应的多个编码向量;第二计算模块,配置为计算同一对比样本的多个编码向量之间的第三相似度值,以及计算不同对比样本的编码向量之间的第四相似度值,根据所述第三相似度值和所述第四相似度值计算第二损失值;联合训练模块,配置为基于所述第一损失值和所述第二损失值对所述特征编码模型进行联合训练。
9.一种媒体对象推荐装置,其特征在于,所述装置包括:获取模块,配置为获取待推荐媒体对象的初始向量,并采用如权利要求1-6中任一项所述的方法训练得到的特征编码模型根据所述初始向量计算所述待推荐媒体对象的编码向量;计算模块,配置为计算所述编码向量与预设用户兴趣群体矩阵之间的关联性向量;召回模块,配置为在向量池中查询与所述待推荐媒体对象的关联性向量近似的多个目标媒体对象,所述向量池用于存储预收集的媒体对象的关联性向量,并且所述预收集的媒体对象的关联性向量是通过所述特征编码模型获得对应的编码向量后,基于所述预设用户兴趣群体矩阵计算出的;推荐模块,配置为根据各目标媒体对象的关联性向量与所述待推荐媒体对象的关联性向量之间的近似度数值,对所述多个目标媒体对象进行排序,并基于排序结果将所述待推荐媒体对象推荐至所述目标媒体对象关联的用户。10.一种电子设备,其特征在于,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1-7中任意一项所述的方法。

技术总结
本公开的实施方式提供了一种特征编码模型训练方法及装置、媒体对象推荐方法及装置,涉及人工智能技术领域。媒体对象推荐方法包括:获取待推荐媒体对象的初始向量,并采用基于特征编码模型训练方法训练得到的特征编码模型根据所述初始向量计算所述待推荐媒体对象的编码向量;计算所述编码向量与预设用户兴趣群体矩阵之间的关联性向量;在向量池中查询与所述待推荐媒体对象的关联性向量近似的多个目标媒体对象;根据各目标媒体对象的关联性向量与所述待推荐媒体对象的关联性向量之间的近似度数值,对所述多个目标媒体对象进行排序,并基于排序结果将所述待推荐媒体对象推荐至所述目标媒体对象关联的用户。本公开能够解决音乐冷启动的问题。决音乐冷启动的问题。决音乐冷启动的问题。


技术研发人员:赵鑫萍 章莺 肖强 李勇
受保护的技术使用者:杭州网易云音乐科技有限公司
技术研发日:2022.10.24
技术公布日:2023/1/13
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献