一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

应用人工智能分析的大数据去噪优化方法及大数据系统与流程

2022-08-13 12:36:03 来源:中国专利 TAG:


1.本发明涉及大数据采集技术领域,具体而言,涉及应用人工智能分析的大数据去噪优化方法及大数据系统。


背景技术:

2.人工智能模型训练需要大量的数据样本支持,相关技术中,可以通过搜集大量针对用户在使用互联网业务过程中的行为大数据样本,进而为人工智能模型提供大量的可学习特征,进而利用训练好的人工智能模型实现各种用户特征预测,如用户兴趣特征预测,用户意图特征预测,用户偏好特征预测,用户需求特征预测等等。值得注意的是,人工智能模型训练的效果也取决于这些行为大数据样本的特征准确性,也即,取决于这些行为大数据样本的噪声数量,只有在噪声数量较少时,才能保证较高的特征准确性。因此,在大数据样本的采集阶段,需要严格控制采集噪声。然而,相关技术中,在针对某个特定业务板块进行初步的噪声分析后直接进行大数据采集优化的部署,此种方式无法较好保证大数据样本采集的精准性,进而也会影响后续的人工智能模型训练精度。


技术实现要素:

3.为了至少克服现有技术中的上述不足,本发明的目的在于提供一种应用人工智能分析的大数据去噪优化方法及大数据系统。
4.第一方面,本技术提供一种应用人工智能分析的大数据采集优化方法,应用于大数据系统,所述大数据系统与多个大数据采集进程进行数据交互,所述方法包括:从大数据采集服务数据库中提取对大数据采集进程的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并在基于所述第一噪声特征点图谱进行大数据采集流程更新后,分析到需要调整所述第一噪声特征点图谱时,从所述第一噪声特征点图谱中获取与预设业务上线时段所对应的业务更新活动关联的目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系;基于目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系重构对应的第二噪声特征点图谱;基于所述第二噪声特征点图谱进行遍历大数据采集流程更新。
5.在第一方面的一种可能的实施方式中,所述从大数据采集服务数据库中提取对大数据采集进程的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并在基于所述第一噪声特征点图谱进行大数据采集流程更新后,分析到需要调整所述第一噪声特征点图谱时,从所述第一噪声特征点图谱中获取与预设业务上线时段所对应的业务更新活动关联的目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系的步骤,包括:从大数据采集服务数据库中提取对大数据采集进程的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并依据所述第一噪声特征点图谱对所述大数
据采集进程配置目标大数据采集流程更新信息,监测所述大数据采集进程的大数据采集更新部署数据,所述大数据采集更新部署数据为依据大数据采集流程更新信息进行大数据采集流程更新后所进行遍历大数据采集生成的大数据采集日志;获取所述大数据采集流程更新信息的估计大数据采集结论指标和所述大数据采集更新部署数据的真实大数据采集结论指标;依据所述估计大数据采集结论指标和所述真实大数据采集结论指标,输出所述大数据采集流程更新信息和所述大数据采集更新部署数据之间的噪声挖掘效果指标;如果分析到所述噪声挖掘效果指标不小于第一效果指标,则将所述目标大数据采集流程更新信息加载至样本大数据采集活动;如果分析到所述噪声挖掘效果指标小于所述第一效果指标,则确定需要调整所述第一噪声特征点图谱,从所述第一噪声特征点图谱中获取与预设业务上线时段所对应的业务更新活动关联的目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系。
6.在第一方面的一种可能的实施方式中,所述依据所述估计大数据采集结论指标和所述真实大数据采集结论指标,输出所述大数据采集流程更新信息和所述大数据采集更新部署数据之间的噪声挖掘效果指标的步骤之前,所述方法还包括:获取所述大数据采集流程更新信息的重点估计大数据采集事件和所述大数据采集更新部署数据的重点真实大数据采集事件,其中,重点估计大数据采集事件被配置于表达对应大数据采集流程更新信息的不同流程更新标签的估计大数据采集事件中采集跨度存在变化且采集跨度变化值大于目标变化值的估计大数据采集事件,重点真实大数据采集事件被配置于表达对应大数据采集更新部署数据的不同流程更新标签的真实大数据采集事件中采集跨度存在变化且采集跨度变化值大于目标变化值的真实大数据采集事件;依据所述重点估计大数据采集事件的第一大数据采集变量分布和所述重点真实大数据采集事件的第二大数据采集变量分布,输出所述大数据采集流程更新信息和所述大数据采集更新部署数据的第一挖掘连通度;所述依据所述估计大数据采集结论指标和所述真实大数据采集结论指标,输出所述大数据采集流程更新信息和所述大数据采集更新部署数据之间的噪声挖掘效果指标,具体包括:分析获得所述估计大数据采集结论指标和所述真实大数据采集结论指标的第二挖掘连通度,对所述第一挖掘连通度和所述第二挖掘连通度加权输出所述噪声挖掘效果指标。
7.在第一方面的一种可能的实施方式中,所述大数据采集更新部署数据还携带所述大数据采集流程更新信息相关的第一采集知识点部署数据和所述大数据采集更新部署数据相关的第二采集知识点部署数据,所述依据所述估计大数据采集结论指标和所述真实大数据采集结论指标,输出所述大数据采集流程更新信息和所述大数据采集更新部署数据之间的噪声挖掘效果指标的步骤之前,所述方法还包括:依据所述第一采集知识点部署数据与所述第二采集知识点部署数据,输出所述大数据采集流程更新信息与所述大数据采集更新部署数据的第三挖掘连通度;所述依据所述估计大数据采集结论指标和所述真实大数据采集结论指标,输出所
述大数据采集流程更新信息和所述大数据采集更新部署数据之间的噪声挖掘效果指标,具体包括:分析获得所述估计大数据采集结论指标和所述真实大数据采集结论指标的第二挖掘连通度,对所述挖掘连通度和所述第三挖掘连通度加权输出所述噪声挖掘效果指标。
8.在第一方面的一种可能的实施方式中,所述获取所述大数据采集流程更新信息的估计大数据采集结论指标和所述大数据采集更新部署数据的真实大数据采集结论指标的步骤之前,所述方法还包括:获取所述大数据采集流程更新信息和所述大数据采集更新部署数据的冲突信息占比;如果分析到所述大数据采集流程更新信息和所述大数据采集更新部署数据的冲突信息占比不大于目标冲突信息占比,则执行获取所述大数据采集流程更新信息的估计大数据采集结论指标和所述大数据采集更新部署数据的真实大数据采集结论指标的步骤,如果分析到所述大数据采集流程更新信息和所述大数据采集更新部署数据中任一项的冲突信息占比大于所述目标冲突信息占比,则结束步骤。
9.在第一方面的一种可能的实施方式中,所述从大数据采集服务数据库中提取对所述大数据采集进程的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并依据所述第一噪声特征点图谱对所述大数据采集进程配置目标大数据采集流程更新信息,具体包括:获取所述大数据采集进程的标的大数据采集日志,对所述标的大数据采集日志进行噪声情报挖掘,确定所述标的大数据采集日志对应的标的噪声情报;获取所述标的大数据采集日志对应的第一标的协同大数据采集日志及标的噪声情报对应的第二标的协同大数据采集日志,并获取所述大数据采集进程的协同采集进程,所述协同采集进程中配置有多个第一在先大数据采集日志及所述多个第一在先大数据采集日志分别对应的协同采集日志,所述协同采集日志中包括与所述第一在先大数据采集日志对应的第一协同大数据采集日志;将所述标的大数据采集日志、标的噪声情报、第一标的协同大数据采集日志和第二标的协同大数据采集日志分别与所述协同采集进程中的第一在先大数据采集日志及第一协同大数据采集日志进行匹配,输出与所述标的大数据采集日志、标的噪声情报和第一标的协同大数据采集日志及第二标的协同大数据采集日志所匹配的所述第一在先大数据采集日志及第一协同大数据采集日志;基于匹配的第一在先大数据采集日志及第一协同大数据采集日志对所述标的大数据采集日志进行日志整合;获取所述标的大数据采集日志以及与所述标的大数据采集日志进行日志整合的附加大数据采集日志,将所述标的大数据采集日志和所述附加大数据采集日志输出为目标大数据采集日志;获取所述目标大数据采集日志在第一ai训练流程内各ai训练采集任务对应的训练样本数据簇,所述第一ai训练流程包含至少两个ai训练采集任务,各所述ai训练采集任务对应的训练样本数据簇包含所述目标大数据采集日志中的训练样本采集活动在对应的ai训练采集任务中采集的目标训练样本模板特征的采集大数据;
分析获得所述第一ai训练流程内各ai训练采集任务对应的训练样本数据簇之间的训练样本数据图谱;基于所述第一ai训练流程内各ai训练采集任务对应的训练样本数据簇之间的训练样本数据图谱,输出所述目标大数据采集日志在所述第一ai训练流程内的噪声特征点连通信息;基于所述噪声特征点连通信息分析获得所述目标大数据采集日志在所述第一ai训练流程内的噪声特征点关系信息;基于所述噪声特征点关系信息获得的第一噪声特征点图谱对所述大数据采集进程配置目标大数据采集流程更新信息。
10.在第一方面的一种可能的实施方式中,所述方法还包括:获取基于大数据采集流程更新后获取到的用于进行用户兴趣挖掘模型训练的待学习用户行为大数据,并调度用于作为用户兴趣挖掘模型训练的初始用户兴趣挖掘模型和协同训练模型,所述初始用户兴趣挖掘模型包括多个待进行模型参数层调优和选取的第一基础兴趣学习单元,所述协同训练模型包括多个已进行模型参数层调优和选取的第二基础兴趣学习单元;对所述待学习用户行为大数据进行数据分治,提取与所述待学习用户行为大数据相对应的用户前置行为活动和用户触发行为活动;基于所述用户前置行为活动、所述用户触发行为活动和与所述用户触发行为活动相对应的用户活动兴趣点生成兴趣学习数据序列,并且,基于所述用户触发行为活动和所述用户活动兴趣点生成兴趣区别学习数据序列;基于所述第一基础兴趣学习单元并依据所述兴趣学习数据序列中的兴趣学习数据确定第一兴趣学习变量;基于对应的第二基础兴趣学习单元并依据所述兴趣区别学习数据序列中的兴趣区别学习数据确定第二兴趣学习变量;基于所述第一兴趣学习变量与所述第二兴趣学习变量或所述用户触发行为活动的学习代价信息对所述第一基础兴趣学习单元的模型参数层进行调优和选取,输出已进行模型参数层调优和选取的最终用户兴趣挖掘模型。
11.基于以上步骤,基于待进行模型参数层调优和选取的初始用户兴趣挖掘模型并依据兴趣学习数据确定第一兴趣学习变量,基于已进行模型参数层调优和选取的协同训练模型并依据兴趣区别学习数据确定第二兴趣学习变量,基于第一兴趣学习变量与第二兴趣学习变量或用户触发行为活动的学习代价信进行模型参数层调优和选取,能够获得已进行模型参数层调优和选取的、基于用户前置行为驱动的初始用户兴趣挖掘模型并依据此初始用户兴趣挖掘模型生成模糊兴趣热力图,基于已进行模型参数层调优和选取的协同训练模型在模型训练过程中生成训练依据信息,进而提高模型训练的可靠性。
12.在第一方面的一种可能的实施方式中,所述方法还包括:配置所述第一基础兴趣学习单元与所述第二基础兴趣学习单元的学习协同关系;依据所述学习协同关系在所述兴趣学习数据序列中确定与所述第一基础兴趣学习单元相对应的兴趣学习数据,并在所述兴趣区别学习数据序列中确定与所述第二基础兴趣学习单元相对应的兴趣区别学习数据。
13.在第一方面的一种可能的实施方式中,所述第一基础兴趣学习单元包括:第一显式兴趣特征学习子单元,所述第二基础兴趣学习单元包括:第二显式兴趣特征学习子单元;所述兴趣学习数据包括:用户前置行为活动学习数据,所述兴趣区别学习数据包括:与所述用户前置行为活动学习数据相对应的用户触发行为活动学习数据;所述基于所述第一基础兴趣学习单元并依据所述兴趣学习数据序列中的兴趣学习数据确定第一兴趣学习变量包括:基于所述第一显式兴趣特征学习子单元并依据所述用户前置行为活动学习数据获得第一显式兴趣特征信息;所述基于对应的第二基础兴趣学习单元并依据所述兴趣区别学习数据序列中的兴趣区别学习数据确定第二兴趣学习变量包括:基于所述第二显式兴趣特征学习子单元并依据所述用户触发行为活动学习数据获得第二显式兴趣特征信息;所述基于所述第一兴趣学习变量与所述第二兴趣学习变量或所述用户触发行为活动的学习代价信息对所述第一基础兴趣学习单元的模型参数层进行调优和选取包括:基于所述第一显式兴趣特征信息和所述第二显式兴趣特征信息的学习代价信息计算第一训练损失函数值;基于所述第一训练损失函数值对所述第一显式兴趣特征学习子单元的模型参数层进行调优和选取。
14.譬如在第一方面的一种可能的实施方式中,所述第一基础兴趣学习单元包括:隐式兴趣特征学习子单元,所述第二基础兴趣学习单元包括:第一隐式兴趣点显性转换子单元;所述兴趣学习数据包括:用户前置行为活动学习数据,所述兴趣区别学习数据包括:与所述用户前置行为活动学习数据相对应的用户触发行为活动学习数据;所述基于所述第一基础兴趣学习单元并依据所述兴趣学习数据序列中的兴趣学习数据确定第一兴趣学习变量包括:基于所述隐式兴趣特征学习子单元并依据所述用户前置行为活动学习数据获得隐式兴趣特征信息;所述基于对应的第二基础兴趣学习单元并依据所述兴趣区别学习数据序列中的兴趣区别学习数据确定第二兴趣学习变量包括:基于所述第一隐式兴趣点显性转换子单元并依据所述用户触发行为活动学习数据获得第一隐式兴趣点显性转换特征信息;所述基于所述第一兴趣学习变量与所述第二兴趣学习变量或所述用户触发行为活动的学习代价信息对所述第一基础兴趣学习单元的模型参数层进行调优和选取包括:基于所述隐式兴趣特征信息获取第二隐式兴趣点显性转换特征信息;基于所述第一隐式兴趣点显性转换特征信息和所述第二隐式兴趣点显性转换特征信息的学习代价信息计算第二训练损失函数值;基于所述第二训练损失函数值对所述隐式兴趣特征学习子单元的模型参数层进行调优和选取。
15.譬如在第一方面的一种可能的实施方式中,所述第二基础兴趣学习单元还包括:第二隐式兴趣点显性转换子单元;所述兴趣区别学习数据包括:与所述用户触发行为活动
学习数据相对应的范例用户活动兴趣点;所述基于所述隐式兴趣特征信息获取第二隐式兴趣点显性转换特征信息包括:基于所述第二隐式兴趣点显性转换子单元并依据所述范例用户活动兴趣点获得显性兴趣点特征;基于所述显性兴趣点特征与所述隐式兴趣特征信息进行显性转换,生成所述第二隐式兴趣点显性转换特征信息。
16.譬如在第一方面的一种可能的实施方式中,所述第一基础兴趣学习单元包括:第一预测子单元,所述第二基础兴趣学习单元包括:意图概率分布矩阵输出单元;所述兴趣学习数据包括:用户触发行为活动学习数据和范例用户活动兴趣点,所述兴趣区别学习数据包括用户触发行为活动学习数据;所述基于所述第一基础兴趣学习单元并依据所述兴趣学习数据序列中的兴趣学习数据确定第一兴趣学习变量包括:基于所述用户触发行为活动学习数据获取第三隐式兴趣点显性转换特征信息;基于所述第一预测子单元并依据所述第三隐式兴趣点显性转换特征信息和所述范例用户活动兴趣点获得第一意图概率分布矩阵;所述基于对应的第二基础兴趣学习单元并依据所述兴趣区别学习数据序列中的兴趣区别学习数据确定第二兴趣学习变量包括:基于所述意图概率分布矩阵输出单元并依据所述用户触发行为活动学习数据获得第二意图概率分布矩阵;所述基于所述第一兴趣学习变量与所述第二兴趣学习变量或所述用户触发行为活动的学习代价信息对所述第一基础兴趣学习单元的模型参数层进行调优和选取包括:基于所述第一意图概率分布矩阵和所述第二意图概率分布矩阵的学习代价信息计算第三训练损失函数值;基于所述第三训练损失函数值对所述第一预测子单元的模型参数层进行调优和选取。
17.譬如在第一方面的一种可能的实施方式中,所述第二基础兴趣学习单元还包括:第三隐式兴趣点显性转换子单元;所述基于所述用户触发行为活动学习数据获取第三隐式兴趣点显性转换特征信息的步骤,包括:基于所述第三隐式兴趣点显性转换子单元并依据所述用户触发行为活动学习数据获得所述第三隐式兴趣点显性转换特征信息。
18.譬如在第一方面的一种可能的实施方式中,所述第一基础兴趣学习单元包括:第二预测子单元,所述兴趣学习数据包括所述用户触发行为活动学习数据和范例用户活动兴趣点;所述基于所述第一基础兴趣学习单元并依据所述兴趣学习数据序列中的兴趣学习数据确定第一兴趣学习变量包括:获取与所述用户触发行为活动学习数据相对应的第三意图概率分布矩阵;基于所述第二预测子单元并依据所述第三意图概率分布矩阵和所述范例用户活动兴趣点获得模糊兴趣热力图;
所述基于所述第一兴趣学习变量与所述第二兴趣学习变量或所述用户触发行为活动的学习代价信息对所述第一基础兴趣学习单元的模型参数层进行调优和选取包括:基于所述模糊兴趣热力图和所述用户触发行为活动学习数据的学习代价信息计算第四训练损失函数值;基于所述第四训练损失函数值对所述第二预测子单元的模型参数层进行调优和选取。
19.譬如在第一方面的一种可能的实施方式中,所述获取与所述用户触发行为活动学习数据相对应的第三意图概率分布矩阵包括:基于所述第三隐式兴趣点显性转换子单元并依据所述用户触发行为活动学习数据获得所述第三显性兴趣点特征;基于所述第一预测子单元并依据所述第三隐式兴趣点显性转换特征信息获得所述第三意图概率分布矩阵。
20.第二方面,本技术实施例还提供一种应用人工智能分析的大数据采集优化系统,所述应用人工智能分析的大数据采集优化系统包括大数据系统以及与所述大数据系统通信连接的多个大数据采集进程;所述大数据系统,用于:从大数据采集服务数据库中提取对大数据采集进程的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并在基于所述第一噪声特征点图谱进行大数据采集流程更新后,分析到需要调整所述第一噪声特征点图谱时,从所述第一噪声特征点图谱中获取与预设业务上线时段所对应的业务更新活动关联的目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系;基于目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系重构对应的第二噪声特征点图谱;基于所述第二噪声特征点图谱进行遍历大数据采集流程更新。
21.第二方面,本技术实施例还提供一种大数据系统,所述大数据系统包括处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行第一方面或者第一方面中任意一种可能的实施方式所述的应用人工智能分析的大数据采集优化方法。
22.采用以上任意方面的实施方式,在从大数据采集服务数据库中提取对大数据采集进程的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并在基于第一噪声特征点图谱进行大数据采集流程更新后,当需要调整第一噪声特征点图谱时,从第一噪声特征点图谱中获取与预设业务上线时段所对应的业务更新活动关联的目标噪声特征点序列以及目标噪声特征点序列对应于业务更新活动的噪声特征点关系,并由此重构对应的第二噪声特征点图谱,基于第二噪声特征点图谱进行遍历大数据采集流程更新,实现噪声特征点图谱的不断重构优化,由此进行遍历大数据采集流程更新,可以提高后续大数据样本采集的精准性。
附图说明
23.图1为本发明实施例提供的应用ai和大数据分析的用户需求决策方法的流程示意
图;图2为本发明实施例提供的用于实现上述的应用ai和大数据分析的用户需求决策方法的互联网系统的结构示意框图。
具体实施方式
24.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及它们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
25.下面介绍本发明一种实施例提供的应用ai和大数据分析的用户需求决策系统10的架构,该应用ai和大数据分析的用户需求决策系统10可以包括互联网系统100以及与互联网系统100通信连接的大数据采集进程200。其中,应用ai和大数据分析的用户需求决策系统10中的互联网系统100和大数据采集进程200可以通过配合执行以下方法实施例所描述的应用ai和大数据分析的用户需求决策方法,具体互联网系统100和大数据采集进程200的执行步骤部分可以参照以下方法实施例的详细描述。
26.本实施例提供的应用ai和大数据分析的用户需求决策方法可以由互联网系统100执行,下面结合图1对该应用ai和大数据分析的用户需求决策方法进行详细介绍。
27.process100,从大数据采集服务数据库中提取对大数据采集进程的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并在基于所述第一噪声特征点图谱进行大数据采集流程更新后,分析到需要调整所述第一噪声特征点图谱时,从所述第一噪声特征点图谱中获取与预设业务上线时段所对应的业务更新活动关联的目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系。
28.本实施例中,第一噪声特征点图谱可以表示不同噪声特征点所对应的特征字段信息,以及不同噪声特征点之间的关联关系,由此不仅考虑到了噪声特征点本身,也考虑了与其它噪声特征点之间的关联关系,由此可以进行对应的大数据采集流程更新,具体更新方式例如可以是在大数据采集模板中过滤噪声特征点所对应的特征字段信息,以及与其它噪声特征点之间的关联关系所对应的特征字段信息。
29.然而,发明人研究发现,在基于第一噪声特征点图谱进行大数据采集流程更新后,可能由于该第一噪声特征点图谱不够完全准确,所采集的大数据样本仍旧可能存在相关联的噪声信息,究其原因之一,主要来自于新上线业务中存在的业务更新活动,导致原本挖掘的第一噪声特征点图谱存在误差,因此本实施例可以进一步从所述第一噪声特征点图谱中获取与预设业务上线时段所对应的业务更新活动(如业务更新活动所对应的业务更新字段分布)关联的目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系。
30.process200,基于目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系重构对应的第二噪声特征点图谱。
31.本实施例中,在提取到目标噪声特征点序列以及所述目标噪声特征点序列对应于所述业务更新活动的噪声特征点关系,可以重构生成对应的第二噪声特征点图谱,第二噪声特征点图谱相较于第一噪声特征点图谱,更符合与最新预设业务上线时段所对应的业务更新活动。
32.process300,基于所述第二噪声特征点图谱进行遍历大数据采集流程更新。
33.例如,具体更新方式例如可以是在大数据采集模板中过滤所述第二噪声特征点图谱中噪声特征点所对应的特征字段信息,以及与其它噪声特征点之间的关联关系所对应的特征字段信息。
34.基于以上步骤,本实施例在从大数据采集服务数据库中提取对大数据采集进程的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并在基于第一噪声特征点图谱进行大数据采集流程更新后,当需要调整第一噪声特征点图谱时,从第一噪声特征点图谱中获取与预设业务上线时段所对应的业务更新活动关联的目标噪声特征点序列以及目标噪声特征点序列对应于业务更新活动的噪声特征点关系,并由此重构对应的第二噪声特征点图谱,基于第二噪声特征点图谱进行遍历大数据采集流程更新,实现噪声特征点图谱的不断重构优化,由此进行遍历大数据采集流程更新,可以提高后续大数据样本采集的精准性。
35.针对一些示例性的设计思路而言,process100可以通过以下示例性的步骤实现。
36.process110,从大数据采集服务数据库中提取对大数据采集进程200的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并依据第一噪声特征点图谱对大数据采集进程200配置目标大数据采集流程更新信息,监测大数据采集进程200的大数据采集更新部署数据,大数据采集更新部署数据为依据大数据采集流程更新信息进行大数据采集流程更新后所进行遍历大数据采集生成的大数据采集日志。
37.process120,大数据系统100获取该大数据采集流程更新信息的估计大数据采集结论指标和该大数据采集更新部署数据的真实大数据采集结论指标。
38.process130,大数据系统100依据该估计大数据采集结论指标和该真实大数据采集结论指标,输出该大数据采集流程更新信息和该大数据采集更新部署数据之间的噪声挖掘效果指标。
39.process140,若噪声挖掘效果指标不小于第一效果指标,则将目标大数据采集流程更新信息加载至样本大数据采集活动,若噪声挖掘效果指标小于第一效果指标,则输出优化第一噪声特征点图谱的优化指示信息。
40.采用以上技术方案,在获取大数据采集更新部署数据后,通过对大数据采集流程更新信息和大数据采集更新部署数据,进行噪声挖掘效果指标评估,来判断大数据采集更新部署数据是否与大数据采集流程更新信息的采集满足状态,也就能够确定出本次大数据采集流程更新是否满足有效部署要求,当满足时即可将所述目标大数据采集流程更新信息加载至样本大数据采集活动进行有效记录,从而形成可靠性较高的样本大数据采集活动资源,当不满足时则输出优化大数据采集流程更新信息配置依据的第一噪声特征点图谱的优化指示信息,以便于进行噪声特征点更新。
41.基于前述实施例的描述,下面介绍本技术另一种实施例提供的一种应用人工智能分析的大数据采集优化方法的流程,该实施例包括:
process210,大数据采集进程200向大数据系统100发送大数据流程更新评估指令,该大数据流程更新评估指令携带大数据采集更新部署数据,该大数据采集更新部署数据为依据大数据采集流程更新信息进行大数据采集流程更新后所进行遍历大数据采集生成的大数据采集日志。
42.其中,大数据采集更新部署数据是指大数据采集进程进行大数据采集流程更新后所进行遍历大数据采集生成的大数据采集日志。大数据采集更新部署数据可以包含有大数据采集进程进行训练样本数据采集的部署信息等。大数据采集流程更新信息是指依据预先挖掘的第一噪声特征点图谱所生成的大数据采集流程更新信息,例如可以包括一系列的针对大数据采集字段的采集流程更新信息。
43.针对另一些设计思路而言,在上传大数据采集更新部署数据时,自动触发大数据采集进程200向大数据系统100发送大数据流程更新评估指令。
44.process220,大数据系统100接收大数据采集进程200的大数据流程更新评估指令。
45.process230,大数据系统100获取该大数据采集流程更新信息和该大数据采集更新部署数据的冲突信息占比,分析该大数据采集流程更新信息和该大数据采集更新部署数据的冲突信息占比是否不大于目标冲突信息占比,若该大数据采集流程更新信息和该大数据采集更新部署数据的冲突信息占比不大于目标冲突信息占比,则执行process240。
46.其中,目标冲突信息占比是指预先设定的冲突信息占比,目标冲突信息占比用于衡量该大数据采集流程更新信息和该大数据采集更新部署数据的冲突信息占比是否满足期望条件。
47.在另针对一些设计思路而言,大数据系统100获取大数据采集流程更新信息和大数据采集更新部署数据的冲突信息占比后,若大数据采集流程更新信息和大数据采集更新部署数据中任一项的冲突信息占比大于目标冲突信息占比,则结束步骤。
48.通过前述冲突信息占比的判断,能够筛选出冲突信息占比满足条件的大数据采集流程更新信息和大数据采集更新部署数据,提高了后续大数据采集流程更新评估的精度,使得大数据采集流程更新信息和大数据采集更新部署数据中的特征更加明显,提高了特征提取的精度。
49.process240,大数据系统100获取该大数据采集流程更新信息的估计大数据采集结论指标和该大数据采集更新部署数据的真实大数据采集结论指标。
50.其中,估计大数据采集结论指标被配置于表达大数据采集流程更新信息的大数据采集效果变量。真实大数据采集结论指标被配置于表达大数据采集更新部署数据的大数据采集效果变量。其中,真实大数据采集结论指标(大数据采集效果变量)可以是不同流程更新标签的成员估计采集参数信息。估计大数据采集事件是指大数据采集流程更新信息所期望的基本大数据采集事件。
51.针对一些设计思路而言,大数据系统100获取大数据采集流程更新信息的估计大数据采集结论指标的过程为:在获取大数据采集流程更新信息后,针对当前噪声特征点的预估过滤数量与当前累积噪声特征点数量之间的比例,确定估计大数据采集结论指标。
52.针对一些设计思路而言,大数据系统100获取大数据采集更新部署数据的真实大数据采集结论指标的过程为:针对大数据采集更新后的实际噪声特征点的过滤数量与当前
累积噪声特征点数量之间的比例,确定估计大数据采集结论指标。
53.process250,大数据系统100依据该大数据采集流程更新信息的估计大数据采集结论指标和该大数据采集更新部署数据的真实大数据采集结论指标,输出该估计大数据采集结论指标和该真实大数据采集结论指标的第二挖掘连通度。
54.其中,挖掘连通度是指估计大数据采集结论指标和真实大数据采集结论指标之间的重合度。
55.process260,大数据系统100获取该大数据采集流程更新信息的重点估计大数据采集事件和该大数据采集更新部署数据的重点真实大数据采集事件,其中,重点估计大数据采集事件被配置于表达对应大数据采集流程更新信息的不同流程更新标签的估计大数据采集事件中采集跨度存在变化且采集跨度变化值大于目标变化值的估计大数据采集事件。
56.其中,目标变化值用于衡量估计大数据采集事件的采集跨度更新状态。例如,将采集跨度变化值大于目标变化值的估计大数据采集事件作为更新明显的重点估计大数据采集事件。
57.针对一些设计思路而言,大数据系统100在获取到大数据采集流程更新信息和大数据采集更新部署数据后,对大数据采集流程更新信息和大数据采集更新部署数据进行分析,分别确定大数据采集流程更新信息和大数据采集更新部署数据的不同流程更新标签的估计大数据采集事件中发生更新且采集跨度变化值大于目标变化值的重点估计大数据采集事件,从而得到大数据采集流程更新信息的重点估计大数据采集事件和大数据采集更新部署数据的重点真实大数据采集事件。
58.process270,大数据系统100依据该重点估计大数据采集事件的第一大数据采集变量分布和该重点真实大数据采集事件的第二大数据采集变量分布,输出该大数据采集流程更新信息和该大数据采集更新部署数据的第一挖掘连通度。
59.其中,挖掘连通度可以是指第一大数据采集变量分布和第二大数据采集变量分布之间的重合度。
60.其中,大数据采集变量分布的获取过程可以在获取所述大数据采集流程更新信息的估计大数据采集结论指标和所述大数据采集更新部署数据的真实大数据采集结论指标之前、之后或者同时执行。本技术实施例对大数据采集变量分布的获取过程的执行次序不作限定。
61.process280,大数据系统100对该挖掘连通度和该挖掘连通度加权输出该噪声挖掘效果指标。
62.针对一些设计思路而言,大数据系统100确定出第一挖掘连通度和所述第二挖掘连通度后,依据第一挖掘连通度和所述第二挖掘连通度的重要性权重加权输出噪声挖掘效果指标。在过程中,通过调整第一挖掘连通度和所述第二挖掘连通度的重要性权重,能够更好地结合两个效果指标,进而提高了噪声挖掘效果指标评估的精度。
63.其中,process260至process280为可选步骤。在另针对一些设计思路而言,大数据系统100将估计大数据采集结论指标和真实大数据采集结论指标的第二挖掘连通度作为噪声挖掘效果指标,再进行后续过程。
64.process290,若该噪声挖掘效果指标满足目标条件,则大数据系统100向该大数据
采集进程200发送更新通过信息,该更新通过信息用于指示该大数据采集更新部署数据满足有效部署要求。
65.针对一些设计思路而言,若噪声挖掘效果指标不小于第一效果指标,则确定大数据采集更新部署数据满足有效部署要求,则将目标大数据采集流程更新信息加载至样本大数据采集活动。其中,第一效果指标是指预先设定的固定阈值,第一效果指标用于衡量大数据采集更新部署数据满足有效部署要求。
66.针对另一些设计思路而言,大数据系统100还能够依据噪声挖掘效果指标评估和特征匹配,来进行效果指标评估流程。其中,大数据流程更新评估指令还携带大数据采集流程更新信息相关的第一采集知识点部署数据和该大数据采集更新部署数据相关的第二采集知识点部署数据。下面介绍本技术另一实施例提供的一种应用人工智能分析的大数据采集优化方法的流程,该实施例包括:process310,大数据采集进程200向大数据系统100发送大数据流程更新评估指令,该大数据流程更新评估指令携带大数据采集流程更新信息、第一采集知识点部署数据、大数据采集更新部署数据和第二采集知识点部署数据。
67.其中,第一采集知识点部署数据是指大数据采集流程更新信息的采集知识点部署数据。
68.process320,大数据系统100接收大数据采集进程200的大数据流程更新评估指令。
69.process330,大数据系统100获取该大数据采集流程更新信息和该大数据采集更新部署数据的冲突信息占比,判断该大数据采集流程更新信息和该大数据采集更新部署数据的冲突信息占比是否不大于目标冲突信息占比,若该大数据采集流程更新信息和该大数据采集更新部署数据的冲突信息占比不大于目标冲突信息占比,则执行process340。
70.process340,大数据系统100获取该大数据采集流程更新信息的估计大数据采集结论指标和该大数据采集更新部署数据的真实大数据采集结论指标。
71.process350,大数据系统100依据该大数据采集流程更新信息的估计大数据采集结论指标和该大数据采集更新部署数据的真实大数据采集结论指标,输出该估计大数据采集结论指标和该真实大数据采集结论指标的第二挖掘连通度。
72.process320至process350参见process220至process250的内容,不再赘述。
73.process360,大数据系统100依据该第一采集知识点部署数据与该第二采集知识点部署数据,输出该大数据采集流程更新信息与该大数据采集更新部署数据的第三挖掘连通度。
74.其中,第三挖掘连通度是指第一采集知识点部署数据和第二采集知识点部署数据之间的重合度。
75.process370,大数据系统100对该挖掘连通度和该第三挖掘连通度加权输出该噪声挖掘效果指标。
76.process380,若该噪声挖掘效果指标满足目标条件,则大数据系统100向该大数据采集进程200发送更新通过信息,该更新通过信息用于指示该大数据采集更新部署数据满足有效部署要求。
77.process380参见process290的内容,不再赘述。
78.针对一些设计思路而言,对于process110而言,在从大数据采集服务数据库中提取对所述大数据采集进程200的标的大数据采集日志进行噪声特征点挖掘生成的第一噪声特征点图谱,并依据所述第一噪声特征点图谱对所述大数据采集进程200配置目标大数据采集流程更新信息的流程中,可以通过以下步骤实现。
79.step101,获取大数据采集进程200的标的大数据采集日志,对标的大数据采集日志进行噪声情报挖掘,确定标的大数据采集日志对应的标的噪声情报。
80.step102,获取标的大数据采集日志对应的第一标的协同大数据采集日志及标的噪声情报对应的第二标的协同大数据采集日志,并获取所述大数据采集进程200的协同采集进程,协同采集进程中配置有多个第一在先大数据采集日志及多个第一在先大数据采集日志分别对应的协同采集日志,在协同采集日志中包括与第一在先大数据采集日志对应的第一协同大数据采集日志。
81.step103,将前述标的大数据采集日志、标的噪声情报、第一标的协同大数据采集日志及第二标的协同大数据采集日志分别与前述step103中获取的协同采集进程中的第一在先大数据采集日志和第一协同大数据采集日志进行匹配,输出与标的大数据采集日志、标的噪声情报和第一标的协同大数据采集日志及第二标的协同大数据采集日志所匹配的第一在先大数据采集日志和第一协同大数据采集日志。
82.例如,将标的大数据采集日志、标的噪声情报、第一标的协同大数据采集日志和第二标的协同大数据采集日志分别与协同采集进程中的各第一在先大数据采集日志及其第一协同大数据采集日志进行匹配,从而得到与标的大数据采集日志、标的噪声情报、第一标的协同大数据采集日志和第二标的协同大数据采集日志所匹配的第一在先大数据采集日志和第一协同大数据采集日志。
83.step104,基于前述step103匹配得到的第一在先大数据采集日志及第一协同大数据采集日志,对标的大数据采集日志进行日志整合。
84.针对一些设计思路而言,本技术还提供另一种应用人工智能分析的大数据采集优化方法,包括以下步骤。
85.step501,获取标的大数据采集日志以及与标的大数据采集日志进行日志整合的附加大数据采集日志,将标的大数据采集日志和附加大数据采集日志输出为目标大数据采集日志。
86.step502,获取目标大数据采集日志在第一ai训练流程内各ai训练采集任务对应的训练样本数据簇,第一ai训练流程包含至少两个ai训练采集任务,各ai训练采集任务对应的训练样本数据簇包含目标大数据采集日志中的训练样本采集活动在对应的ai训练采集任务中采集的目标训练样本模板特征的采集大数据。
87.step503,输出第一ai训练流程内各ai训练采集任务对应的训练样本数据簇之间的训练样本数据图谱。
88.step504,基于第一ai训练流程内各ai训练采集任务对应的训练样本数据簇之间的训练样本数据图谱,输出目标大数据采集日志在第一ai训练流程内的噪声特征点连通信息。
89.step505,基于噪声特征点连通信息确定目标大数据采集日志在第一ai训练流程内的噪声特征点关系信息,基于噪声特征点关系信息获得的第一噪声特征点图谱对大数据
采集进程200配置目标大数据采集流程更新信息。
90.譬如,针对一些设计思路而言,step502可以通过以下步骤实现。
91.step5021,获取目标大数据采集日志中的训练样本采集活动在第一ai训练采集任务启用后预设采集分区内采集的目标训练样本模板特征的采集大数据,并依据目标大数据采集日志中的训练样本采集活动在第一ai训练采集任务启用后预设采集分区内采集的目标训练样本模板特征的采集大数据,输出第一ai训练采集任务对应的训练样本数据簇,第一ai训练采集任务为第一ai训练流程内的任一ai训练采集任务。
92.step5022,在目标大数据采集日志中的训练样本采集活动在第二ai训练采集任务启用后预设采集分区内未采集目标训练样本模板特征时,基于目标大数据采集日志中的训练样本采集活动接收的目标训练样本模板特征的采集大数据,输出针对第二ai训练采集任务对应的训练样本数据簇,第二ai训练采集任务为第一ai训练流程内第一ai训练采集任务以外的任一ai训练采集任务。
93.其中,本实施例还可以在目标大数据采集日志中的训练样本采集活动在第三ai训练采集任务启用后的预设采集分区内未采集目标训练样本模板特征,且第三ai训练采集任务之前连续的第一目标数量的ai训练采集任务对应的训练样本数据簇均为基于训练样本采集活动接收的目标训练样本模板特征的采集大数据确定时,向训练样本采集活动发送目标训练样本模板特征采集请求,以使训练样本采集活动响应目标训练样本模板特征采集请求采集目标训练样本模板特征,第三ai训练采集任务为第一ai训练流程内第一ai训练采集任务和第二ai训练采集任务以外的任一ai训练采集任务。
94.由此,可以获取训练样本采集活动响应目标训练样本模板特征采集请求采集的目标训练样本模板特征的采集大数据,并依据训练样本采集活动响应目标训练样本模板特征采集请求采集的目标训练样本模板特征的采集大数据,输出第三ai训练采集任务对应的训练样本数据簇。
95.譬如,针对一些设计思路而言,输出第一ai训练流程内各ai训练采集任务对应的训练样本数据簇之间的训练样本数据图谱,例如可以是:从第一ai训练流程内的各ai训练采集任务对应的训练样本数据簇中,输出一个动态采集大数据簇。然后,分别确定第一ai训练流程内各ai训练采集任务对应的训练样本数据簇中动态采集大数据簇以外的各训练样本数据簇,与动态采集大数据簇之间的训练样本数据图谱。或,分别确定第一ai训练流程内每相关联两个ai训练采集任务对应的训练样本数据簇之间的训练样本数据图谱。
96.其中,训练样本数据图谱可以包括多个训练样本数据和训练样本数据之间的训练协同关系信息。
97.针对一些设计思路而言,第一ai训练流程内各ai训练采集任务对应的训练样本数据簇包含可迁移训练样本数据簇和非迁移训练样本数据簇,噪声特征点连通信息包含基于第一ai训练流程内指定的各ai训练采集任务的可迁移训练样本数据簇对应的训练样本数据图谱确定的第一噪声特征点连通信息,以及基于第一ai训练流程内指定的各ai训练采集任务的非迁移训练样本数据簇对应的训练样本数据图谱确定的第二噪声特征点连通信息。
98.基于前述实施例的描述,基于噪声特征点连通信息确定目标大数据采集日志在第一ai训练流程内的噪声特征点关系信息,具体可以基于第一噪声特征点连通信息和第二噪声特征点连通信息,输出目标大数据采集日志在第一ai训练流程内的噪声特征点关系信
息。
99.譬如,针对一些设计思路而言,step504可以通过以下步骤实现。
100.step5041,从第一ai训练流程内各ai训练采集任务对应的训练样本数据簇中,输出目标训练样本模板特征的协同特征的噪声特征点关系信息对应的噪声输出价值高于第一目标价值的多个目标可迁移训练样本数据簇,以及目标训练样本模板特征的协同特征的噪声特征点关系信息对应的噪声输出价值高于第二目标价值的多个目标非迁移训练样本数据簇。
101.step5042,基于多个目标可迁移训练样本数据簇对应的训练样本数据图谱确定第一噪声特征点连通信息,并依据多个目标非迁移训练样本数据簇对应的训练样本数据图谱确定第二噪声特征点连通信息。
102.其中,基于第一噪声特征点连通信息和第二噪声特征点连通信息,输出目标大数据采集日志在第一ai训练流程内的噪声特征点关系信息,例如可以是:在第一噪声特征点连通信息的连通持续度(可以表示存在连通关系的连续噪声特征点数量)不小于预设的第一目标连通持续度,且第二噪声特征点连通信息的连通持续度不小于预设的第二目标连通持续度时,输出目标大数据采集日志在第一ai训练流程内的噪声特征点关系信息为第一噪声特征点关系信息(也即包括第一噪声特征点连通信息和第二噪声特征点连通信息)。在第一噪声特征点连通信息的连通持续度不小于第一目标连通持续度,且第二噪声特征点连通信息的连通持续度小于第二目标连通持续度时,输出目标大数据采集日志在第一ai训练流程内的噪声特征点关系信息为第二噪声特征点关系信息(也即包括第一噪声特征点连通信息)。在第一噪声特征点连通信息的连通持续度小于第一目标连通持续度,且第二噪声特征点连通信息的连通持续度小于第二目标连通持续度时,输出目标大数据采集日志在第一ai训练流程内的噪声特征点关系信息为第三噪声特征点关系信息(也即包括第一噪声特征点连通信息和第二噪声特征点连通信息以外的模糊噪声特征点连通信息,模糊噪声特征点连通信息可以是指预测的可能相关的噪声特征点连通信息)。
103.针对一些设计思路而言,若噪声特征点关系信息为第三噪声特征点关系信息,那么则可以获取第三噪声特征点关系信息对应的n种大数据采集路径序列,以及每种大数据采集路径序列对应的采集成员类别链,每种大数据采集路径序列中包括m个不同的重点大数据采集路径,n和m均为不小于1的正整数。 然后,在大数据采集路径序列对应的采集成员类别链中确定大数据采集路径序列对应的当前循环性采集成员类别,采用大数据采集路径序列对应的当前循环性采集成员类别进行采集成员类别变量提取,输出大数据采集路径序列中每个重点大数据采集路径的采集成员类别变量,依据n种大数据采集路径序列中每个重点大数据采集路径的采集成员类别变量,对大数据采集路径序列对应的当前循环性采集成员类别进行延伸引用,输出大数据采集路径序列对应的实时延伸引用采集成员类别,将大数据采集路径序列对应的实时延伸引用采集成员类别加入大数据采集路径序列对应的采集成员类别链中。
104.由此,返回并执行步骤在大数据采集路径序列对应的采集成员类别链中确定大数据采集路径序列对应的当前循环性采集成员类别,直至n种大数据采集路径序列对应的全局采集覆盖率大于设定采集覆盖率,并依据全局采集覆盖率得到n种大数据采集路径序列对应的大数据采集路径区间的更新信息。
105.其中,在大数据采集路径序列对应的采集成员类别链中确定大数据采集路径序列对应的当前循环性采集成员类别,例如可以是:确定大数据采集路径序列对应的关联循环性采集成员类别、当前大数据采集路径覆盖信息,以及目标大数据采集路径序列对应的当前大数据采集路径覆盖信息,通过对大数据采集路径序列对应的当前大数据采集路径覆盖信息和目标大数据采集路径序列对应的当前大数据采集路径覆盖信息进行对比,输出大数据采集路径序列对应的当前大数据采集路径覆盖信息的第一覆盖类别分布,目标大数据采集路径序列为n种大数据采集路径序列中包括大数据采集路径序列在内的所有大数据采集路径序列。然后,通过对大数据采集路径序列对应的当前大数据采集路径覆盖信息和大数据采集路径序列对应的关联循环性采集成员类别进行对比,输出大数据采集路径序列当前大数据采集路径覆盖信息的第二覆盖类别分布,依据第二覆盖类别分布和第一覆盖类别分布,将大数据采集路径序列对应的关联循环性采集成员类别或者大数据采集路径序列对应的当前大数据采集路径覆盖信息确定为大数据采集路径序列当前时序节点对应的采集成员类别。
106.在一种可能的实施方式中,本实施例所提供的方法还可以包括下述步骤。
107.process400,获取基于大数据采集流程更新后获取到的用于进行用户兴趣挖掘模型训练的待学习用户行为大数据,并调度用于作为用户兴趣挖掘模型训练的初始用户兴趣挖掘模型和协同训练模型,所述初始用户兴趣挖掘模型包括多个待进行模型参数层调优和选取的第一基础兴趣学习单元,所述协同训练模型包括多个已进行模型参数层调优和选取的第二基础兴趣学习单元。
108.process500,对所述待学习用户行为大数据进行数据分治,提取与所述待学习用户行为大数据相对应的用户前置行为活动和用户触发行为活动。
109.process600,基于所述用户前置行为活动、所述用户触发行为活动和与所述用户触发行为活动相对应的用户活动兴趣点生成兴趣学习数据序列,并且,基于所述用户触发行为活动和所述用户活动兴趣点生成兴趣区别学习数据序列。
110.process700,基于所述第一基础兴趣学习单元并依据所述兴趣学习数据序列中的兴趣学习数据确定第一兴趣学习变量。
111.process800,基于对应的第二基础兴趣学习单元并依据所述兴趣区别学习数据序列中的兴趣区别学习数据确定第二兴趣学习变量。
112.process900,基于所述第一兴趣学习变量与所述第二兴趣学习变量或所述用户触发行为活动的学习代价信息对所述第一基础兴趣学习单元的模型参数层进行调优和选取,输出已进行模型参数层调优和选取的最终用户兴趣挖掘模型。
113.基于以上步骤,基于待进行模型参数层调优和选取的初始用户兴趣挖掘模型并依据兴趣学习数据确定第一兴趣学习变量,基于已进行模型参数层调优和选取的协同训练模型并依据兴趣区别学习数据确定第二兴趣学习变量,基于第一兴趣学习变量与第二兴趣学习变量或用户触发行为活动的学习代价信进行模型参数层调优和选取,能够获得已进行模型参数层调优和选取的、基于用户前置行为驱动的初始用户兴趣挖掘模型并依据此初始用户兴趣挖掘模型生成模糊兴趣热力图,基于已进行模型参数层调优和选取的协同训练模型在模型训练过程中生成训练依据信息,进而提高模型训练的可靠性。
114.在一种可能的实施方式中,在以上实施例实施之前,本实施例可以配置所述第一
基础兴趣学习单元与所述第二基础兴趣学习单元的学习协同关系,然后依据所述学习协同关系在所述兴趣学习数据序列中确定与所述第一基础兴趣学习单元相对应的兴趣学习数据,并在所述兴趣区别学习数据序列中确定与所述第二基础兴趣学习单元相对应的兴趣区别学习数据。
115.在一种可能的实施方式中,所述第一基础兴趣学习单元包括:第一显式兴趣特征学习子单元,所述第二基础兴趣学习单元包括:第二显式兴趣特征学习子单元;所述兴趣学习数据包括:用户前置行为活动学习数据,所述兴趣区别学习数据包括:与所述用户前置行为活动学习数据相对应的用户触发行为活动学习数据;process700的一种实现方式可以是:基于所述第一显式兴趣特征学习子单元并依据所述用户前置行为活动学习数据获得第一显式兴趣特征信息;process800的一种实现方式可以是:基于所述第二显式兴趣特征学习子单元并依据所述用户触发行为活动学习数据获得第二显式兴趣特征信息;process900的一种实现方式可以是:基于所述第一显式兴趣特征信息和所述第二显式兴趣特征信息的学习代价信息计算第一训练损失函数值;基于所述第一训练损失函数值对所述第一显式兴趣特征学习子单元的模型参数层进行调优和选取。
116.譬如,在一种可能的实施方式中,所述第一基础兴趣学习单元包括:隐式兴趣特征学习子单元,所述第二基础兴趣学习单元包括:第一隐式兴趣点显性转换子单元;所述兴趣学习数据包括:用户前置行为活动学习数据,所述兴趣区别学习数据包括:与所述用户前置行为活动学习数据相对应的用户触发行为活动学习数据。
117.process700的一种实现方式可以是:基于所述隐式兴趣特征学习子单元并依据所述用户前置行为活动学习数据获得隐式兴趣特征信息;process800的一种实现方式可以是:基于所述第一隐式兴趣点显性转换子单元并依据所述用户触发行为活动学习数据获得第一隐式兴趣点显性转换特征信息;process900的一种实现方式可以是:基于所述隐式兴趣特征信息获取第二隐式兴趣点显性转换特征信息;基于所述第一隐式兴趣点显性转换特征信息和所述第二隐式兴趣点显性转换特征信息的学习代价信息计算第二训练损失函数值;基于所述第二训练损失函数值对所述隐式兴趣特征学习子单元的模型参数层进行调优和选取。
118.譬如,在一种可能的实施方式中,所述第二基础兴趣学习单元还包括:第二隐式兴趣点显性转换子单元;所述兴趣区别学习数据包括:与所述用户触发行为活动学习数据相对应的范例用户活动兴趣点。
119.基于所述隐式兴趣特征信息获取第二隐式兴趣点显性转换特征信息包括:基于所述第二隐式兴趣点显性转换子单元并依据所述范例用户活动兴趣点获得显性兴趣点特征;基于所述显性兴趣点特征与所述隐式兴趣特征信息进行显性转换,生成所述第二隐式兴趣点显性转换特征信息。
120.譬如,在一种可能的实施方式中,所述第一基础兴趣学习单元包括:第一预测子单元,所述第二基础兴趣学习单元包括:意图概率分布矩阵输出单元;所述兴趣学习数据包括:用户触发行为活动学习数据和范例用户活动兴趣点,所述兴趣区别学习数据包括用户触发行为活动学习数据;process700的一种实现方式可以是:基于所述用户触发行为活动学习数据获取第
三隐式兴趣点显性转换特征信息;基于所述第一预测子单元并依据所述第三隐式兴趣点显性转换特征信息和所述范例用户活动兴趣点获得第一意图概率分布矩阵;process800的一种实现方式可以是:基于所述意图概率分布矩阵输出单元并依据所述用户触发行为活动学习数据获得第二意图概率分布矩阵;process900的一种实现方式可以是:基于所述第一意图概率分布矩阵和所述第二意图概率分布矩阵的学习代价信息计算第三训练损失函数值;基于所述第三训练损失函数值对所述第一预测子单元的模型参数层进行调优和选取。
121.譬如,在一种可能的实施方式中,所述第二基础兴趣学习单元还包括:第三隐式兴趣点显性转换子单。基于所述用户触发行为活动学习数据获取第三隐式兴趣点显性转换特征信息,具体包括:基于所述第三隐式兴趣点显性转换子单元并依据所述用户触发行为活动学习数据获得所述第三隐式兴趣点显性转换特征信息。
122.譬如,在一种可能的实施方式中,所述第一基础兴趣学习单元包括:第二预测子单元,所述兴趣学习数据包括所述用户触发行为活动学习数据和范例用户活动兴趣点。
123.process700的一种实现方式可以是:获取与所述用户触发行为活动学习数据相对应的第三意图概率分布矩阵;基于所述第二预测子单元并依据所述第三意图概率分布矩阵和所述范例用户活动兴趣点获得模糊兴趣热力图;process900的一种实现方式可以是:基于所述模糊兴趣热力图和所述用户触发行为活动学习数据的学习代价信息计算第四训练损失函数值;基于所述第四训练损失函数值对所述第二预测子单元的模型参数层进行调优和选取。
124.譬如,在一种可能的实施方式中,获取与所述用户触发行为活动学习数据相对应的第三意图概率分布矩阵包括:基于所述第三隐式兴趣点显性转换子单元并依据所述用户触发行为活动学习数据获得所述第三显性兴趣点特征;基于所述第一预测子单元并依据所述第三隐式兴趣点显性转换特征信息获得所述第三意图概率分布矩阵。
125.图2示出了本发明实施例提供的用于实现上述的应用ai和大数据分析的用户需求决策系统的互联网系统100的硬件结构意图,如图2所示,互联网系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
126.处理器110可以基于存储在机器可读存储介质120中的程序而执行各种适当的动作和处理,例如前述实施例所描述的应用ai和大数据分析的用户需求决策方法所相关的程序指令。处理器110、机器可读存储介质120以及通信单元140通过总线130进行信号传输。
127.特别地,基于本发明的实施例,上文示例性流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信单元140从网络上被下载和安装,在该计算机程序被处理器110执行时,执行本发明实施例的方法中限定的上述功能。
128.本发明又一实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述任一实施例所述的应用ai和大数据分析的用户需求决策方法。
129.其中,本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——
电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(lam)、只读存储器(lom)、可擦式可编程只读存储器(eplom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-lom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、lm(射频)等等,或者上述的任意合适的组合。
130.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
131.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
132.本发明又一实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上述任一实施例所述的应用ai和大数据分析的用户需求决策方法。
133.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献