一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于维度模型的数据评估方法和计算机程序产品与流程

2021-10-30 02:47:00 来源:中国专利 TAG:维度 人工智能 模型 评估 公开

技术特征:
1.一种基于维度模型的数据评估方法,其特征在于,包括:获取经纪人的至少一种维度类型的数据,得到至少一个数据;基于所述至少一个数据中的每个数据的维度类型在评分卡中查找确定每个所述数据对应的所述维度类型;其中,所述评分卡中包括对应多种所述维度类型的多个分值,所述评分卡中的每种所述维度类型对应至少一个分值;基于每个所述数据的取值在所述维度类型对应的至少一个分值中查找,得到所述至少一个数据中每个数据对应的分值;累加所述至少一个数据对应的至少一个分值,得到所述经纪人的评分值。2.根据权利要求1所述的方法,其特征在于,在基于所述至少一个数据中的每个数据的维度类型在评分卡中查找确定每个所述数据对应的所述维度类型之前,还包括:基于第一样本集合建立所述评分卡;其中,所述第一样本集合中包括多个第一样本经纪人。3.根据权利要求2所述的方法,其特征在于,所述基于第一样本集合建立所述评分卡,包括:获得所述第一样本集合中多个第一样本经纪人中每个第一样本经纪人的多个数据;其中,每个所述第一样本经纪人对应多种维度类型的数据;对每种所述维度类型对应的多个数据执行编码,得到多个编码值;其中,每种所述维度类型的数据对应至少一个所述编码值;将所述多个编码值分别输入预训练的神经网络模型,得到多个分值;基于所述多种维度类型的多个数据对应的多个分值,建立评分卡。4.根据权利要求3所述的方法,其特征在于,所述对每种所述维度类型对应的多个数据执行编码,得到多个编码值,包括:对每种所述维度类型对应的多个数据执行分箱操作,得到每种所述维度类型对应的多个数据区间;其中,每个所述数据区间包括起始值数据到终止值数据之间的所有数据;对所述多个数据区间中的每个数据区间内的所有数据执行编码,得到所述多个编码值。5.根据权利要求4所述的方法,其特征在于,每个所述第一样本经纪人具有标注信息表明所述第一样本经纪人是正样本或负样本;所述对所述多个数据区间中的每个数据区间内的所有数据执行编码,得到所述多个编码值,包括:针对每个所述数据区间,基于所述数据区间包括的正样本数量和负样本数量,以及所述第一样本集合中包括的正样本数量和负样本数量,确定所述数据区间对应的编码值。6.根据权利要求4或5所述的方法,其特征在于,所述将所述多个编码值分别输入预训练的神经网络模型,得到多个分值,包括:将所述多个编码值中每个编码值分别输入预训练的神经网络模型,分别获取对应每个所述编码值的预测概率值;分别对所述多个预测概率值中的每个预测概率值进行计算,得到所述多个分值;其中,所述多个分值中的每个所述分值对应一个所述编码值。7.根据权利要求3

6任一所述的方法,其特征在于,在将所述多个编码值分别输入预训
练的神经网络模型,得到多个分值之前,还包括:基于第二样本集合训练所述神经网络模型;其中,所述第二样本集合包括多个具有标注信息的第二样本经纪人,所述标注信息表示所述第二样本经纪人是正样本或负样本。8.根据权利要求7所述的方法,其特征在于,所述基于第二样本集合训练所述神经网络模型,包括:将所述第二样本经纪人对应的多个数据进行编码,得到多个样本编码值;将所述多个样本编码值分别输入所述神经网络模型,得到多个预测概率值;分别确定所述多个预测概率值中每个预测概率值与所述标注信息之间的差异,基于所述差异确定网络损失,基于所述网络损失训练所述神经网络模型。9.根据权利要求3

8任一所述的方法,其特征在于,在对每种所述维度类型对应的多个数据执行编码,得到多个编码值之前,还包括:对所述多个数据进行预处理;其中,所述预处理包括以下至少一种:去重处理、缺失值删除处理、异常值检测处理、相关度确定处理;和/或,在将所述多个编码值分别输入预训练的神经网络模型,得到多个分值之前,还包括:对所述至少一个编码值中的每个所述编码值计算信息量,得到至少一个信息量值;其中,每个所述信息量值对应一个所述编码值;基于所述至少一个信息量值对所述至少一个编码值进行筛选,得到筛选后的至少一个编码值;所述将所述至少一个编码值分别输入神经网络模型,得到所述多个数据对应的多个分值,包括:将所述筛选后的至少一个编码值分别输入神经网络模型,得到所述多个数据对应的多个分值。10.一种计算机程序产品,所述计算机程序产品包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1

9中任一项所述的基于维度模型的数据评估方法的步骤。

技术总结
本公开实施例公开了一种基于维度模型的数据评估方法和计算机程序产品,其中,方法包括:获取经纪人的至少一种维度类型的数据,得到至少一个数据;基于所述至少一个数据中的每个数据的维度类型在评分卡中查找确定每个所述数据对应的所述维度类型;基于每个所述数据的取值在所述维度类型对应的至少一个分值中查找,得到所述至少一个数据中每个数据对应的分值累加所述至少一个数据对应的至少一个分值,得到所述经纪人的评分值;本实施例通过以经纪人对应的多种维度类型的数据在评分卡中进行查询,实现快速获取经纪人的评分值,并且,克服了人为评分主观因素影响分值的问题,得到的经纪人评分值更客观,可参考性更强。可参考性更强。可参考性更强。


技术研发人员:燕江弟 周家生 马敬伟
受保护的技术使用者:北京房江湖科技有限公司
技术研发日:2021.07.30
技术公布日:2021/10/29
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜