推荐系统排序方法、参数预测模型训练方法及装置与流程

2022-04-30 17:22:17 来源：中国专利 TAG：

技术特征：
1.一种推荐系统内容排序方法，包括：响应于接收到的搜索请求，获取召回的待排序内容集合；获取所述待排序内容集合中各待排序内容各自的推荐指标数据；获取与所述搜索请求对应的场景特征信息；根据所述场景特征信息，获取多项式多目标排序公式的多个目标可调参数；基于所述多项式多目标排序公式，根据所述推荐指标数据和所述多个目标可调参数对所述待排序内容集合中的待排序内容进行排序。2.根据权利要求1所述的方法，其中，所述根据所述场景特征信息，获取多项式多目标排序公式的多个目标可调参数，包括：将所述场景特征信息输入至预设的参数预测模型，获得所述参数预测模型输出的所述多项式多目标排序公式的多个目标可调参数；其中，所述参数预测模型已经学习得到场景特征信息与多项式多目标排序公式的参数之间的映射关系。3.根据权利要求2所述的方法，其中，所述参数预测模型包括嵌入层、拼接层和全连接层；所述将所述场景特征信息输入至预设的参数预测模型，获得所述参数预测模型输出的所述多项式多目标排序公式的多个目标可调参数，包括：基于所述嵌入层分别对所述场景特征信息中各特征进行编码，获得所述各特征的各自向量编码；基于所述拼接层将所述各特征的各自向量编码进行拼接，将拼接后得到的向量编码确定为所述场景特征信息的向量编码；将所述场景特征信息的向量编码输入至所述全连接层，获得所述多项式多目标排序公式的多个目标可调参数。4.根据权利要求2或3所述的方法，还包括：基于扰动模型进行离线异步训练，并基于所述离线异步训练的结果，更新部署在线上的所述参数预测模型的模型参数。5.根据权利要求4所述的方法，其中，所述基于扰动模型进行离线异步训练，并基于所述离线异步训练的结果，更新部署在线上的所述参数预测模型的模型参数，包括：获取部署在线上的所述参数预测模型的日志信息；对所述日志信息进行解析，获得每次搜索请求的搜索特征和对应的扰动模型的随机种子key；根据所述扰动模型的随机种子key还原扰动后的模型参数；根据所述每次搜索请求的搜索特征和所述随机种子key对应的样本数量，计算评估扰动后的模型参数的表现效果值；采用进化策略算法，根据所述扰动模型的随机种子key和所述表现效果值，更新部署在线上的所述参数预测模型的模型参数。6.根据权利要求1所述的方法，其中，所述基于所述多项式多目标排序公式，根据所述推荐指标数据和所述多个目标可调参数对所述待排序内容集合中的待排序内容进行排序，包括：将每个所述待排序内容的推荐指标数据和所述多个目标可调参数，带入所述多项式多
目标排序公式，计算每个所述待排序内容的推荐排序得分；基于所述推荐排序得分对所述待排序内容集合中的待排序内容进行排序。7.根据权利要求6所述的方法，其中，所述多项式多目标排序公式的表示如下：其中，w
ij
为所述多个目标可调参数；ctr、dlctr及cpm均为所述推荐指标数据；w
cpm
为固定系数。8.一种参数预测模型训练方法，其中，所述参数预测模型用于推荐系统内容排序场景，所述方法包括：获取搜索场景数据和所述搜索场景数据的标签数据；其中，所述标签数据为应用于所述搜索场景数据的多项式多目标排序公式中各可调参数的标签值；提取所述搜索场景数据中的场景特征信息；将所述场景特征信息输入至初始模型，获得所述多项式多目标排序公式中各可调参数的预测值；根据所述各可调参数的预测值和所述各可调参数的标签值，生成损失值；根据所述损失值对所述初始模型进行训练，获得模型参数，并根据所述模型参数生成参数预测模型。9.根据权利要求8所述的方法，其中，所述初始模型包括嵌入层、拼接层和全连接层；所述将所述场景特征信息输入至初始模型，获得所述多项式多目标排序公式中各可调参数的预测值，包括：基于所述嵌入层分别对所述场景特征信息中各特征进行编码，获得所述各特征的各自向量编码；基于所述拼接层将所述各特征的各自向量编码进行拼接，将拼接后得到的向量编码确定为所述场景特征信息的向量编码；将所述场景特征信息的向量编码输入至所述全连接层，获得所述多项式多目标排序公式中各可调参数的预测值。10.根据权利要求8或9所述的方法，还包括：基于扰动模型进行离线异步训练，并基于所述离线异步训练的结果，更新部署在线上的所述参数预测模型的模型参数。11.根据权利要求10所述的方法，其中，所述基于扰动模型进行离线异步训练，并基于所述离线异步训练的结果，更新部署在线上的所述参数预测模型的模型参数，包括：获取部署在线上的所述参数预测模型的日志信息；对所述日志信息进行解析，获得每次搜索请求的搜索特征和对应的扰动模型的随机种子key；根据所述扰动模型的随机种子key还原扰动后的模型参数；根据所述每次搜索请求的搜索特征和所述随机种子key对应的样本数量，计算评估扰动后的模型参数的表现效果值；采用进化策略算法，根据所述扰动模型的随机种子key和所述表现效果值，更新部署在
线上的所述参数预测模型的模型参数。12.一种推荐系统内容排序装置，包括：第一获取模块，用于响应于接收到的搜索请求，获取召回的待排序内容集合；第二获取模块，用于获取所述待排序内容集合中各待排序内容各自的推荐指标数据；第三获取模块，用于获取与所述搜索请求对应的场景特征信息；第四获取模块，用于根据所述场景特征信息，获取多项式多目标排序公式的多个目标可调参数；第一处理模块，用于基于所述多项式多目标排序公式，根据所述推荐指标数据和所述多个目标可调参数对所述待排序内容集合中的待排序内容进行排序。13.根据权利要求12所述的装置，其中，所述第四获取模块具体用于：将所述场景特征信息输入至预设的参数预测模型，获得所述参数预测模型输出的所述多项式多目标排序公式的多个目标可调参数；其中，所述参数预测模型已经学习得到场景特征信息与多项式多目标排序公式的参数之间的映射关系。14.根据权利要求13所述的装置，其中，所述参数预测模型包括嵌入层、拼接层和全连接层；所述第四获取模块具体用于：基于所述嵌入层分别对所述场景特征信息中各特征进行编码，获得所述各特征的各自向量编码；基于所述拼接层将所述各特征的各自向量编码进行拼接，将拼接后得到的向量编码确定为所述场景特征信息的向量编码；将所述场景特征信息的向量编码输入至所述全连接层，获得所述多项式多目标排序公式的多个目标可调参数。15.根据权利要求13或14所述的装置，还包括：第二处理模块，用于基于扰动模型进行离线异步训练，并基于所述离线异步训练的结果，更新部署在线上的所述参数预测模型的模型参数。16.根据权利要求15所述的装置，所述第二处理模块具体用于：获取部署在线上的所述参数预测模型的日志信息；对所述日志信息进行解析，获得每次搜索请求的搜索特征和对应的扰动模型的随机种子key；根据所述扰动模型的随机种子key还原扰动后的模型参数；根据所述每次搜索请求的搜索特征和所述随机种子key对应的样本数量，计算评估扰动后的模型参数的表现效果值；采用进化策略算法，根据所述扰动模型的随机种子key和所述表现效果值，更新部署在线上的所述参数预测模型的模型参数。17.根据权利要求12所述的装置，其特征在于，所述第一处理模块具体用于：将每个所述待排序内容的推荐指标数据和所述多个目标可调参数，带入所述多项式多目标排序公式，计算每个所述待排序内容的推荐排序得分；基于所述推荐排序得分对所述待排序内容集合中的待排序内容进行排序。18.根据权利要求17所述的装置，所述多项式多目标排序公式的表示如下：
其中，w
ij
为所述多个目标可调参数；ctr、dlctr及cpm均为所述推荐指标数据；w
cpm
为固定系数。19.一种参数预测模型训练装置，其中，所述参数预测模型用于推荐系统内容排序场景，所述装置包括：获取模块，用于获取搜索场景数据和所述搜索场景数据的标签数据；其中，所述标签数据为应用于所述搜索场景数据的多项式多目标排序公式中各可调参数的标签值；第一处理模块，用于提取所述搜索场景数据中的场景特征信息；第二处理模块，用于将所述场景特征信息输入至初始模型，获得所述多项式多目标排序公式中各可调参数的预测值；生成模块，用于根据所述各可调参数的预测值和所述各可调参数的标签值，生成损失值；第三处理模块，用于根据所述损失值对所述初始模型进行训练，获得模型参数，并根据所述模型参数生成参数预测模型。20.根据权利要求19所述的装置，其中，所述初始模型包括嵌入层、拼接层和全连接层，所述第二处理模块具体用于：基于所述嵌入层分别对所述场景特征信息中各特征进行编码，获得所述各特征的各自向量编码；基于所述拼接层将所述各特征的各自向量编码进行拼接，将拼接后得到的向量编码确定为所述场景特征信息的向量编码；将所述场景特征信息的向量编码输入至所述全连接层，获得所述多项式多目标排序公式中各可调参数的预测值。21.根据权利要求19或20所述的装置，还包括：第四处理模块，用于基于扰动模型进行离线异步训练，并基于所述离线异步训练的结果，更新部署在线上的所述参数预测模型的模型参数。22.根据权利要求21所述的装置，其中，所述第四处理模块具体用于：获取部署在线上的所述参数预测模型的日志信息；对所述日志信息进行解析，获得每次搜索请求的搜索特征和对应的扰动模型的随机种子key；根据所述扰动模型的随机种子key还原扰动后的模型参数；根据所述每次搜索请求的搜索特征和所述随机种子key对应的样本数量，计算评估扰动后的模型参数的表现效果值；采用进化策略算法，根据所述扰动模型的随机种子key和所述表现效果值，更新部署在线上的所述参数预测模型的模型参数。23.一种推荐系统，包括：内容排序装置，用于响应于接收到的搜索请求，获取召回的待排序内容集合，并获取所述待排序内容集合中各待排序内容各自的推荐指标数据；
特征处理模块，用于获取与所述搜索请求对应的场景特征信息；在线预测模块，用于根据所述场景特征信息，获取多项式多目标排序公式的多个目标可调参数；所述内容排序装置，还用于基于所述多项式多目标排序公式，根据所述推荐指标数据和所述多个目标可调参数对所述待排序内容集合中的待排序内容进行排序。24.根据权利要求23所述的推荐系统，其中，所述在线预测模块具体用于：将所述场景特征信息输入至预设的参数预测模型，获得所述参数预测模型输出的所述多项式多目标排序公式的多个目标可调参数；其中，所述参数预测模型已经学习得到场景特征信息与多项式多目标排序公式的参数之间的映射关系。25.根据权利要求24所述的推荐系统，还包括：离线异步训练模块，用于基于扰动模型进行离线异步训练，并基于所述离线异步训练的结果，更新部署在线上的所述参数预测模型的模型参数。26.根据权利要求25所述的推荐系统，其中，所述离线异步训练模块具体用于：获取部署在线上的所述参数预测模型的日志信息；对所述日志信息进行解析，获得每次搜索请求的搜索特征和对应的扰动模型的随机种子key；根据所述扰动模型的随机种子key还原扰动后的模型参数；根据所述每次搜索请求的搜索特征和所述随机种子key对应的样本数量，计算评估扰动后的模型参数的表现效果值；采用进化策略算法，根据所述扰动模型的随机种子key和所述表现效果值，更新部署在线上的所述参数预测模型的模型参数。27.根据权利要求23至26中任一项所述的推荐系统，其中，所述内容排序装置具体用于：将每个所述待排序内容的推荐指标数据和所述多个目标可调参数，带入所述多项式多目标排序公式，计算每个所述待排序内容的推荐排序得分；基于所述推荐排序得分对所述待排序内容集合中的待排序内容进行排序。28.根据权利要求27所述的推荐系统，其中，所述多项式多目标排序公式的表示如下：其中，w
ij
为所述多个目标可调参数；ctr、dlctr及cpm均为所述推荐指标数据；w
cpm
为固定系数。29.一种电子设备，其特征在于，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7，或权利要求8-11中任一项所述的方法。
30.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-7，或权利要求8-11中任一项所述的方法。31.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现权利要求1-7，或权利要求8-11中任一项所述方法的步骤。

技术总结
本申请公开了一种推荐系统排序方法、参数预测模型训练方法及装置，涉及数据处理技术领域，尤其涉及大数据及深度学习领域。具体实现方案为：响应于接收到的搜索请求，获取召回的待排序内容集合；获取待排序内容集合中各待排序内容各自的推荐指标数据；获取与搜索请求对应的场景特征信息；根据场景特征信息，获取多项式多目标排序公式的多个目标可调参数；基于多项式多目标排序公式，根据推荐指标数据和多个目标可调参数对待排序内容集合中的待排序内容进行排序。通过本申请的技术方案，可在用户同意的情况下，基于待排序内容的多种特征生成目标可调参数参数，以对待排序内容进行排序，从而实现同时对多个排序目标的优化，提升排序结果准确度。排序结果准确度。排序结果准确度。

技术研发人员：李科浇周波王凡何径舟
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：2021.12.30
技术公布日：2022/4/29

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：图像分类识别模型训练方法、装置及计算机设备与流程

推荐系统排序方法、参数预测模型训练方法及装置与流程

相关文献

最热文献