一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于大数据的用户画像挖掘方法及云计算服务器与流程

2022-06-12 01:48:27 来源:中国专利 TAG:

技术特征:
1.一种基于大数据的用户画像挖掘方法,其特征在于,应用于云计算服务器,所述云计算服务器与用户端设备以及服务商平台通信,所述方法包括:响应服务商平台上传的调用请求,其中,所述调用请求用于请求调用待分析业务数据以及数据应用场景的识别结果;基于所述调用请求以及所述数据应用场景的识别结果,对所述待分析业务数据进行数据防护处理,得到目标业务数据;其中,所述数据防护处理包括隐藏、删除或者修改待分析业务数据中的部分数据;将所述目标业务数据以及所述数据应用场景的识别结果下发至所述服务商平台,以供所述服务商平台基于所述目标业务数据进行用户画像挖掘。2.根据权利要求1所述的方法,其特征在于,在响应服务商平台上传的调用请求的步骤之前,所述方法还包括:从获取的包含业务交互事件标识的待分析业务数据中提取出业务交互事件标识对应的关联业务数据;通过预先完成训练的业务数据解析模型对所述业务交互事件标识对应的关联业务数据进行数据分析和场景识别,得到i种数据应用场景的识别结果;其中,所述数据应用场景的识别结果用于指示所述服务商平台进行用户画像挖掘,以实现服务产品的优化。3.根据权利要求2所述的方法,其特征在于,所述待分析业务数据为具有时效性的数据流。4.根据权利要求2所述的方法,其特征在于,通过预先完成训练的业务数据解析模型对所述业务交互事件标识对应的关联业务数据进行数据分析和场景识别,得到i种数据应用场景的识别结果,包括:通过业务数据解析模型从所述业务交互事件标识对应的关联业务数据中提取出局部业务数据特征内容和全局业务数据特征内容,其中,所述局部业务数据特征内容包括所述业务交互事件标识对应的关联业务数据中交互事件标签的画像信息以及每一个数据片段关联度的检测结果,所述全局业务数据特征内容包括所述业务交互事件标识对应的关联业务数据中交互事件状态的变化情况;通过所述业务数据解析模型对提取的业务数据特征内容进行拼接,并根据所述业务数据解析模型中通过样本训练得到的场景识别网络对拼接后的业务数据特征内容进行场景识别,以得到i种数据应用场景的识别结果,i为大于1的正整数;其中,所述业务数据解析模型是通过多个业务交互事件标识对应的训练样本集进行样本训练获得的,每一个业务交互事件标识对应的训练样本集中预先标记了i种数据应用场景的识别结果。5.根据权利要求1所述的方法,其特征在于,基于所述调用请求以及所述数据应用场景的识别结果,对所述待分析业务数据进行数据防护处理,得到目标业务数据,包括:根据所述调用请求对应的请求事项消息以及所述数据应用场景的识别结果的应用场景标签信息,确定待分析业务数据对应的第一用户属性信息,确定参考业务数据对应的第二用户属性信息,所述第一用户属性信息和所述第二用户属性信息分别包括多个不同属性隐私等级的属性内容块,所述参考业务数据用于对待分析业务数据进行匿名化处理分析;提取所述待分析业务数据在所述第一用户属性信息的任一属性内容块的原始用户属性标签,将所述第二用户属性信息中具有最小属性隐私等级的属性内容块确定为目标属性
内容块;根据预设匿名化处理指标和数据调用记录将所述原始用户属性标签映射到所述目标属性内容块,在所述目标属性内容块中得到原始映射标签,并根据所述原始用户属性标签、所述原始映射标签,生成所述待分析业务数据和所述参考业务数据之间的数据配对指示信息;以所述原始映射标签为参考标签在所述目标属性内容块中获取敏感用户属性片段,根据所述数据配对指示信息对应的逆数据配对指示信息,将所述敏感用户属性片段映射到所述原始用户属性标签所在属性内容块,在所述原始用户属性标签所在属性内容块中得到所述敏感用户属性片段对应的目标用户属性片段,并确定所述目标用户属性片段的参考标签为目标用户属性标签;获取所述原始用户属性标签映射到所述目标属性内容块中的属性标签匹配结果;根据所述目标用户属性片段与所述属性标签匹配结果上的多个待匹配数据安全事项对应的候选用户属性片段之间的隐私相关度,在所述第二用户属性信息中遍历所述目标用户属性标签对应的目标属性内容特征,直至获取到的所述目标属性内容特征所在属性内容块的隐私风险指数与所述目标用户属性标签在所述第一用户属性信息中的隐私风险指数一致时,停止获取下一属性内容块中的目标属性内容特征,并根据所述目标用户属性标签与最后一次获取到的目标属性内容特征之间的属性匹配结果对所述待分析业务数据进行匿名化处理,得到目标业务数据。6.根据权利要求5所述的方法,其特征在于,所述确定待分析业务数据对应的第一用户属性信息,确定参考业务数据对应的第二用户属性信息,包括:根据属性隐私等级阈值确定所述待分析业务数据对应的所述第一用户属性信息,所述第一用户属性信息中任意不间断的两个属性内容块之间的用户属性的属性隐私等级均值为所述属性隐私等级阈值;根据属性隐私等级阈值确定所述参考业务数据对应的所述第二用户属性信息,所述第二用户属性信息中任意不间断的两个属性内容块之间的用户属性的属性隐私等级均值为所述属性隐私等级阈值。7.一种云计算服务器,其特征在于,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行权利要求1-6任一项所述的方法。

技术总结
本申请公开了基于大数据的用户画像挖掘方法及云计算服务器,在实施该方法时,由于是基于参考业务数据对待分析业务数据进行匿名化处理的,因此,能够考虑属性隐私等级以及隐私风险指数(用户信息被窃取之后所产生的负面影响程度),这样在进行匿名化处理时,能够将待分析业务数据拆分为用户属性信息进行相应处理,不仅能够确保用户隐私不被泄露,还能够确保最大程度地通过匿名化处理后的业务数据反应大部分用户的群体属性,这样既保护和用户的个体隐私,也能够满足服务商平台的用户画像挖掘需求。掘需求。掘需求。


技术研发人员:龚世燕
受保护的技术使用者:龚世燕
技术研发日:2021.01.26
技术公布日:2022/6/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献