一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

网络指纹识别模型训练方法、识别方法、设备及存储介质

2023-01-15 07:40:20 来源:中国专利 TAG:

技术特征:
1.一种网络指纹识别模型训练方法,其特征在于,包括以下步骤:获取蜂窝网络用户在第一时间段内的流量使用数据集;基于所述流量使用数据集,确定每个用户在每个第二时间段内的轨迹特征序列,其中每个所述第二时间段均属于第一时间段且n1个第二时间段之和等于第一时间段,每个用户有n1个轨迹特征序列;基于每个用户的轨迹特征序列,计算每个用户与其他用户在同一第二时间段内的轨迹相似度,根据所述轨迹相似度确定每个用户的最相邻用户,并由每个用户的最相邻用户生成该用户的候选用户序列;根据每个用户的n1个轨迹特征序列及其候选用户序列生成该用户的正样本和负样本;由所有用户的正样本和负样本构成训练样本集;构建用户网络指纹识别模型,利用所述训练样本集中的正样本和负样本对所述用户网络指纹识别模型进行训练,得到目标用户网络指纹识别模型。2.根据权利要求1所述的网络指纹识别模型训练方法,其特征在于:所述流量使用数据集包括用户流量上下行数据记录、访问时间、基站访问行为和用户基础属性;所述用户基础属性包括年龄、性别、套餐信息以及设备信息。3.根据权利要求1所述的网络指纹识别模型训练方法,其特征在于:确定每个用户在第二时间段内的轨迹特征序列的具体实现过程为:统计该用户在第二时间段的每个单位时间内各基站上的总使用时间、上行流量总消耗量和下行流量总消耗量;将所有用户在所有单位时间内各基站上的上行流量总消耗量进行降序排序,对降序排序后的所有上行流量总消耗量进行等级划分,并对每个等级进行等级号标记;将所有用户在所有单位时间内各基站上的下行流量总消耗量进行降序排序,对降序排序后的所有下行流量总消耗量进行等级划分,并对每个等级进行等级号标记;按照每个单位时间内的所述总使用时间对该用户在该单位时间内的各基站进行降序排序,提取降序排序中前m1个基站所对应的总使用时间、上行流量总消耗量和下行流量总消耗量,其中m1≥1;由该用户在第二时间段内的所有前m1个基站所对应的总使用时间构成该用户在第二时间段内的活跃度特征;由该用户在第二时间段内的所有前m1个基站的id构成基站特征;基于上行流量总消耗量和下行流量总消耗量的等级划分,确定该用户在第二时间段内的所有前m1个基站所对应的上行流量总消耗量和下行流量总消耗量的所属等级号,由该用户在第二时间段内的所有前m1个基站所对应的等级号构成流量特征;由该用户在第二时间段内的活跃度特征、基站特征和流量特征构成该用户在第二时间段内的轨迹特征序列。4.根据权利要求1所述的网络指纹识别模型训练方法,其特征在于:生成每个用户的候选用户序列的具体实现过程为:计算该用户与其他用户在每个同一第二时间段内的轨迹特征序列的jaccard相关系数,其中其他用户是指所述流量使用数据集中除该用户外的所有用户;将该用户与其他用户的所有jaccard相关系数进行降序排序,提取降序排序中前k1个jaccard相关系数所对应的其他用户生成该用户的候选用户序列。
5.根据权利要求1所述的网络指纹识别模型训练方法,其特征在于:生成每个用户的正样本和负样本的具体实现方式为:由该用户的第1个轨迹特征序列和第n1/2+1个轨迹特征序列构成该用户的第一条正样本,从该用户的候选用户序列中随机选取一个最相邻用户,由该最相邻用户的第1个轨迹特征序列和该用户的第n1/2+1个轨迹特征序列构成该用户的第一条负样本;由该用户的第2个轨迹特征序列和第n1/2+2个轨迹特征序列构成该用户的第二条正样本,从该用户的候选用户序列中随机选取一个最相邻用户,由该最相邻用户的第2个轨迹特征序列和该用户的第n1/2+2个轨迹特征序列构成该用户的第二条负样本;以此类推,由该用户的第n1/2个轨迹特征序列和第n1个轨迹特征序列构成该用户的第n1/2条正样本,从该用户的候选用户序列中随机选取一个最相邻用户,由该最相邻用户的第n1/2个轨迹特征序列和该用户的第n1个轨迹特征序列构成该用户的第n
1/
2条负样本。6.根据权利要求1~5中任一项所述的网络指纹识别模型训练方法,其特征在于:所述用户网络指纹识别模型为基于注意力机制的识别模型,所述基于注意力机制的识别模型包括依次连接的特征编码模块、匹配模块以及融合模块;所述特征编码模块,用于对输入的每个正样本或负样本中的轨迹特征序列a和轨迹特征序列b分别进行拆分处理,得到轨迹特征序列a的多个轨迹特征a
i
和轨迹特征序列b的多个轨迹特征b
i
,由轨迹特征a
i
和轨迹特征b
j
构成轨迹对<a
i
,b
j
>,将每个所述轨迹对中每个轨迹特征的活跃度特征、基站特征和流量特征嵌入成一个特征向量序列,将同一第二时间段内的多个特征向量序列合并成一条轨迹嵌入向量,即得到轨迹特征序列a对应的轨迹嵌入向量以及轨迹特征序列b对应的轨迹嵌入向量;所述匹配模块,用于利用门控循环单元学习每个轨迹嵌入向量的上下文信息,并通过协同注意力机制捕获经门控循环单元学习后的轨迹嵌入向量的关键特征,将每个轨迹嵌入向量的上下文信息与关键特征合并形成特征表示向量;所述融合模块,用于利用多层感知机以及注意力权重的分配对输入的两个所述特征表示向量进行整合和降维处理,得到相似度得分。7.一种蜂窝网络用户网络指纹识别方法,其特征在于,包括以下步骤:获取蜂窝网络用户在第三时间段内的流量使用数据;基于所述第三时间段内的流量使用数据,得到每个用户的访问基站序列、每个基站的被访问用户序列、每个用户在每个第四时间段内的第一轨迹特征序列、以及每个用户的第一候选用户序列,其中每个所述第四时间段均属于第三时间段且n2个第四时间段之和等于第三时间段,每个用户有n2个第一轨迹特征序列;获取蜂窝网络用户在第五时间段内的泄露流量使用数据,其中第五时间段与第三时间段为两个不同的时间段;基于所述第五时间段内的泄露流量使用数据,确定每个用户在每个第六时间段内的第二轨迹特征序列,其中每个所述第六时间段均属于第五时间段且n3个第六时间段之和等于第五时间段,每个用户有n3个第二轨迹特征序列;根据所述被访问用户序列、访问基站序列、第二轨迹特征序列、第一候选用户序列确定目标候选用户序列;在所有用户的第一轨迹特征序列中找出与所述目标候选用户序列中每个目标用户匹
配的第一轨迹特征序列,由匹配出的第一轨迹特征序列与任一第二轨迹特征序列构成输入向量;利用如权利要求1~6中任一项所述网络指纹识别模型训练方法得到的目标用户网络指纹识别模型对所述输入向量进行识别,得到目标用户。8.根据权利要求7所述的蜂窝网络用户网络指纹识别方法,其特征在于,确定所述目标候选用户序列的具体实现过程为:在所有基站的被访问用户序列中找出与所述第二轨迹特征序列中的基站特征匹配的被访问用户序列,由匹配出的所有被访问用户序列构成每个用户的第二候选用户序列;在所有用户的第一候选用户序列中找出与所述第二候选用户序列中每个候选用户匹配的候选用户,由匹配出的候选用户构成第三候选用户序列;对所述第二候选用户序列和所述第三候选用户序列进行合并、去重处理,得到第四候选用户序列;在所有用户的访问基站序列中找出与所述第四候选用户序列中每个候选用户匹配的用户的访问基站序列;计算每个匹配出的用户的访问基站序列与所述第二轨迹特征序列的基站特征的相似度,对所有相似度进行降序排序,提取降序排序中前k2个相似度所对应的目标用户构成目标候选用户序列。9.一种智能设备,其特征在于,所述设备包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现权利要求1~6中任一项所述的网络指纹识别模型训练方法的步骤,或实现权利要求7或8所述的蜂窝网络用户网络指纹识别方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1~6中任一项所述的网络指纹识别模型训练方法的步骤,或实现权利要求7或8所述的蜂窝网络用户网络指纹识别方法的步骤。

技术总结
本发明公开了一种网络指纹识别模型训练方法、识别方法、设备及存储介质,该训练方法包括获取蜂窝网络用户在第一时间段内的流量使用数据集;确定每个用户在每个第二时间段内的轨迹特征序列;计算每个用户与其他用户的轨迹相似度,确定每个用户的最相邻用户,并由每个用户的最相邻用户生成该用户的候选用户序列;根据每个用户的N1个轨迹特征序列及其候选用户序列生成该用户的正样本和负样本;构建用户网络指纹识别模型,利用训练样本集中的正样本和负样本对所述用户网络指纹识别模型进行训练,得到目标用户网络指纹识别模型。本发明能够提高复杂蜂窝场景下用户网络指纹的识别精度。度。度。


技术研发人员:何骁豪 张永敏 段思婧 肖飞 王姗姗 孟陈莹
受保护的技术使用者:中南大学
技术研发日:2022.11.28
技术公布日:2023/1/13
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献