一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种虚假流量检测方法、装置、电子设备及存储介质与流程

2021-11-15 18:25:00 来源:中国专利 TAG:

技术特征:
1.一种虚假流量检测方法,所述方法包括:获得用户在目标平台上进行搜索时的搜索词条;对所述搜索词条进行向量化处理,得到表征所述搜索词条上下文信息的第一向量;根据所述搜索词条中不同类型的字符的占比,获得所述搜索词条的字符评估信息;对所述第一向量和字符评估信息进行融合,得到第二向量;根据所述第二向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。2.根据权利要求1所述的方法,其中,所述根据所述第二向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量,包括:获得包含所述搜索词条中不同类型的字符的占比的第三向量;将所述第二向量、第三向量融合得到融合向量,根据所述融合向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。3.根据权利要求2所述的方法,其中,所述获得包含所述搜索词条中不同类型的字符的占比的第三向量,包括:确定以数字形式表示的所述搜索词条所属分类的目标分类标识;获得包含所述搜索词条中不同类型的字符的占比、所述目标分类标识的第三向量。4.根据权利要求1所述的方法,其中,所述对所述搜索词条进行向量化处理,得到表征所述搜索词条上下文信息的第一向量,包括:将所述搜索词条输入预先训练完成的流量检测模型中的向量化层,得到所述向量化层输出的表征所述搜索词条上下文信息的第一向量;所述对所述第一向量和字符评估信息进行融合,得到第二向量,包括:将所述第一向量、字符评估信息输入所述流量检测模型中的向量融合层,利用所述向量融合层对所述第一向量和字符评估信息进行融合,得到第二向量;所述根据所述第二向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量,包括:将所述第二向量输入所述流量检测模型中的流量检测层,利用所述流量检测层检测所输入的向量对应的访问流量是否为虚假流量,得到所述流量检测层输出的检测结果。5.根据权利要求4所述的方法,其中,所述将所述第二向量输入所述流量检测模型中的流量检测层,利用所述流量检测层检测所输入的向量对应的访问流量是否为虚假流量,得到所述流量检测层输出的检测结果,包括:将所述第二向量、第三向量输入所述流量检测层,其中,所述第三向量中包含所述搜索词条中不同类型的字符的占比;利用所述流量检测层将所述第二向量、第三向量融合得到融合向量,根据所述融合向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。6.根据权利要求3所述的方法,其中,所述流量检测模型通过以下方式训练得到:获得样本用户在样本平台上进行搜索时的样本搜索词条;获得所述样本搜索词条的标注信息,其中,每一样本搜索词条的标注信息用于反映:该样本搜索词条对应的流量是否为虚假流量;根据所述样本搜索词条中不同类型的字符的占比,获得所述样本搜索词条的样本字符
评估信息;利用所述样本搜索词条、样本字符评估信息和标注信息训练所述流量检测模型。7.根据权利要求6所述的方法,其中,所述样本用户为:满足预设的行为稀疏条件的用户,所述行为稀疏条件包括:预设周期内每一预设时间段访问所述样本平台的次数少于预设的次数阈值。8.根据权利要求6所述的方法,其中,所述样本搜索词条包括:第一数量比例的第一类词条、第二数量比例的第二类词条;所述第一类词条为:所述样本用户在预设的访问高峰时间段内在所述样本平台上进行搜索时的搜索词条;所述第二类词条为:所述样本用户在预设的访问低谷时间段内在所述样本平台上进行搜索时的搜索词条。9.一种虚假流量检测装置,所述装置包括:词条获得模块,用于获得用户在目标平台上进行搜索时的搜索词条;第一向量获得模块,用于对所述搜索词条进行向量化处理,得到表征所述搜索词条上下文信息的第一向量;评估信息获得模块,用于根据所述搜索词条中不同类型的字符的占比,获得所述搜索词条的字符评估信息;第二向量获得模块,用于对所述第一向量和字符评估信息进行融合,得到第二向量;虚假流量检测模块,用于根据所述第二向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。10.根据权利要求9所述的装置,其中,所述虚假流量检测模块,包括:第三向量获得单元,用于获得包含所述搜索词条中不同类型的字符的占比的第三向量;虚假流量检测单元,用于将所述第二向量、第三向量融合得到融合向量,根据所述融合向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。11.根据权利要求10所述的装置,其中,所述第三向量获得单元,具体用于:确定以数字形式表示的所述搜索词条所属分类的目标分类标识;获得包含所述搜索词条中不同类型的字符的占比、所述目标分类标识的第三向量。12.根据权利要求9所述的装置,其中,所述第一向量获得模块,具体用于:将所述搜索词条输入预先训练完成的流量检测模型中的向量化层,得到所述向量化层输出的表征所述搜索词条上下文信息的第一向量;所述第二向量获得模块,具体用于:将所述第一向量、字符评估信息输入所述流量检测模型中的向量融合层,利用所述向量融合层对所述第一向量和字符评估信息进行融合,得到第二向量;所述虚假流量检测模块,具体用于:将所述第二向量输入所述流量检测模型中的流量检测层,利用所述流量检测层检测所输入的向量对应的访问流量是否为虚假流量,得到所述流量检测层输出的检测结果。13.根据权利要求12所述的装置,其中,所述虚假流量检测模块,具体用于:将所述第二向量、第三向量输入所述流量检测层,其中,所述第三向量中包含所述搜索
词条中不同类型的字符的占比;利用所述流量检测层将所述第二向量、第三向量融合得到融合向量,根据所述融合向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。14.根据权利要求11所述的装置,所述装置还包括模型训练模块,用于通过以下方式训练得到所述流量检测模型:获得样本用户在样本平台上进行搜索时的样本搜索词条;获得所述样本搜索词条的标注信息,其中,每一样本搜索词条的标注信息用于反映:该样本搜索词条对应的流量是否为虚假流量;根据所述样本搜索词条中不同类型的字符的占比,获得所述样本搜索词条的样本字符评估信息;利用所述样本搜索词条、样本字符评估信息和标注信息训练所述流量检测模型。15.根据权利要求14所述的装置,其中,所述样本用户为:满足预设的行为稀疏条件的用户,所述行为稀疏条件包括:预设周期内每一预设时间段访问所述样本平台的次数少于预设的次数阈值。16.根据权利要求14所述的装置,其中,所述样本搜索词条包括:第一数量比例的第一类词条、第二数量比例的第二类词条;所述第一类词条为:所述样本用户在预设的访问高峰时间段内在所述样本平台上进行搜索时的搜索词条;所述第二类词条为:所述样本用户在预设的访问低谷时间段内在所述样本平台上进行搜索时的搜索词条。17.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1

8中任一项所述的方法。18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1

8中任一项所述的方法。

技术总结
本公开提供了一种虚假流量检测方法、装置、电子设备及存储介质,涉及互联网技术领域,尤其涉及流量检测技术领域。具体方案为:获得用户在目标平台上进行搜索时的搜索词条;对所述搜索词条进行向量化处理,得到表征所述搜索词条上下文信息的第一向量;根据所述搜索词条中不同类型的字符的占比,获得所述搜索词条的字符评估信息;对所述第一向量和字符评估信息进行融合,得到第二向量;根据所述第二向量检测所述目标用户搜索所述搜索词条时带来的访问流量是否为虚假流量。应用本公开的方案可以实现虚假流量检测。实现虚假流量检测。实现虚假流量检测。


技术研发人员:谭云飞 钟贤德
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.08.12
技术公布日:2021/11/14
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献