一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据特征提取方法及装置与流程

2023-01-15 08:22:45 来源:中国专利 TAG:

技术特征:
1.一种数据特征提取方法,其特征在于,包括:从数据传输隧道中获取n个目标数据包;根据每个目标数据包的四元组信息将所述n个目标数据包组成数据流,其中,所述四元组信息至少包括所述每个目标数据包对应的网络地址信息以及数据端口信息;根据所述每个目标数据包的获取时间对所述数据流进行数据包过滤操作,得到目标数据流,其中,所述目标数据流包含q个目标数据包,q小于或等于n;基于所述目标数据流提取多个数据特征,其中,所述数据特征用于确定所述数据传输隧道在传输数据包时是否存在异常。2.根据权利要求1所述的方法,其特征在于,所述四元组信息至少包括第一终端设备的网络地址信息、第一数据端口的端口信息、第二终端设备的网络地址信息以及第二数据端口的端口信息,其中,所述第一终端设备用于生成所述目标数据包,并且将所述目标数据包发送至所述第二终端设备中,所述第一数据端口为所述第一终端设备上用于发送所述目标数据包的端口,所述第二数据端口为所述第二终端设备上用于接收所述目标数据包的端口。3.根据权利要求1所述的方法,其特征在于,从数据传输隧道中获取n个目标数据包,包括:从所述数据传输隧道中获取m个数据包,其中,m大于或等于n;从所述m个数据包中确定所述n个目标数据包,其中,每个目标数据包的字节数量大于或等于预设字节数量,所述每个目标数据包的第一字段所对应的至少一个字符中包含第一预设字符,所述每个目标数据包的第二字段所对应的至少一个字符中包含第二预设字符,所述第一字段表征传输所述每个目标数据包的传输层安全协议,所述第二字段表征所述每个目标数据包的隐含类型。4.根据权利要求1所述的方法,其特征在于,根据所述目标数据包的获取时间对所述数据流进行数据包过滤操作,得到目标数据流,包括:检测所述数据流中n个目标数据包的总数量是否大于预设数量;在所述总数量大于所述预设数量的情况下,根据所述每个目标数据包的获取时间对所述n个目标数据包进行排序,得到排序结果;计算所述总数量与所述预设数量的差值,得到第一数量;根据所述排序结果按照从后向前的顺序,从所述数据流中删除所述第一数量的目标数据包,得到所述目标数据流。5.根据权利要求1所述的方法,其特征在于,基于所述目标数据流提取多个数据特征,包括:根据所述目标数据流中每个目标数据包的传输方向将所述目标数据流划分为第一数据流和第二数据流,其中,所述第一数据流中的目标数据包的传输方向为第一方向,所述第二数据流中的目标数据包的传输方向为第二方向,所述第一方向与所述第二方向为相反的方向;确定所述第一数据流中的每个目标数据包为第一数据包;根据所述第一数据包的数量以及每个第一数据包的字节数量确定所述第一数据流的数据长度;
确定所述第二数据流中的每个目标数据包为第二数据包;根据所述第二数据包的数量以及每个第二数据包的字节数量确定所述第二数据流的数据长度,其中,所述多个数据特征至少包括所述第一数据流的数据长度以及所述第二数据流的数据长度。6.根据权利要求5所述的方法,其特征在于,在确定所述第一数据流的数据长度以及所述第二数据流的数据长度之后,所述方法还包括:获取传输所述目标数据流的持续时长,其中,所述持续时长用于表征所述目标数据流中的q个目标数据包全部传输完成的时长;计算所述第一数据流的数据长度与所述持续时长的比值,得到第一数据传输速率;计算所述第二数据流的数据长度与所述持续时长的比值,得到第二数据传输速率,其中,所述多个数据特征至少包括所述第一数据传输速率以及所述第二数据传输速率。7.根据权利要求1所述的方法,其特征在于,基于所述目标数据流提取多个数据特征,包括:获取所述目标数据流中每个目标数据包的字节数量,得到q个字节数量;确定所述q个字节数量的统计数值,其中,所述q个字节数量的统计数值至少包括:所述q个字节数量的平均值、所述q个字节数量的中位数、所述q个字节数量的众数、所述q个字节数量的方差以及q个字节数量的标准差;根据所述q个字节数量的统计数值确定数据长度变量因子,其中,所述数据长度变量因子用于表征在所述目标数据流中目标数据包的字节数量的变化特征,所述多个数据特征至少包括所述数据长度变量因子。8.根据权利要求1所述的方法,其特征在于,基于所述目标数据流提取多个数据特征,包括:确定所述数据传输隧道中第一个数据包的出现时间为第一时间;确定所述目标数据流中每个目标数据包在所述数据传输隧道中的出现时间为第二时间;根据所述第二时间以及所述第一时间确定所述每个目标数据包的目标时长,得到q个目标时长,其中,所述目标时长用于表征所述每个目标数据包与所述第一个数据包先后出现在所述数据传输隧道的间隔时长;确定所述q个目标时长的统计数值,其中,所述q个目标时长的统计数值至少包括:所述q个目标时长的平均值、所述q个目标时长的中位数、所述q个目标时长的众数、所述q个目标时长的方差以及所述q个目标时长的标准差;根据所述q个目标时长的统计数值确定目标时长变量因子,其中,所述目标时长变量因子用于表征所述间隔时长的变化特征,所述多个数据特征至少包括所述目标时长变量因子。9.根据权利要求1所述的方法,其特征在于,基于所述目标数据流提取多个数据特征,包括:识别所述目标数据流中的k个请求数据包,其中,请求数据包为用于提交数据处理请求的目标数据包,k小于或等于q;获取每个请求数据包对应的响应数据包;
根据所述每个请求数据包的生成时间以及每个响应数据包的生成时间确定所述每个请求数据包的响应时长,得到k个响应时长;确定所述k个响应时长的统计数值,其中,所述k个响应时长的统计数值至少包括所述k个响应时长的平均值、所述k个响应时长的中位数、所述k个响应时长的众数、所述k个响应时长的方差以及所述k个响应时长的标准差;根据所述k个响应时长的统计数值确定响应时长变量因子,其中,所述响应时长变量因子用于表征在所述目标数据流中请求数据包的响应时长的变化特征,所述多个数据特征至少包括所述响应时长变量因子。10.一种数据特征提取装置,其特征在于,包括:获取模块,用于从数据传输隧道中获取n个目标数据包;数据包处理模块,用于根据每个目标数据包的四元组信息将所述n个目标数据包组成数据流,其中,所述四元组信息至少包括所述每个目标数据包对应的网络地址信息以及数据端口信息;过滤模块,用于根据所述每个目标数据包的获取时间对所述数据流进行数据包过滤操作,得到目标数据流,其中,所述目标数据流包含q个目标数据包,q小于或等于n;特征提取模块,用于基于所述目标数据流提取多个数据特征,其中,所述数据特征用于确定所述数据传输隧道在传输数据包时是否存在异常。

技术总结
本申请公开了一种数据特征提取方法及装置。其中,该方法包括:从数据传输隧道中获取N个目标数据包;根据每个目标数据包的四元组信息将N个目标数据包组成数据流,其中,四元组信息至少包括每个目标数据包对应的网络地址信息以及数据端口信息;根据每个目标数据包的获取时间对数据流进行数据包过滤操作,得到目标数据流,其中,目标数据流包含Q个目标数据包,Q小于或等于N;基于目标数据流提取多个数据特征,其中,数据特征用于确定数据传输隧道在传输数据包时是否存在异常。本申请解决了现有技术中对数据流特征提取效率低的技术问题。术中对数据流特征提取效率低的技术问题。术中对数据流特征提取效率低的技术问题。


技术研发人员:韦云川 李超 万朝华
受保护的技术使用者:山石网科通信技术股份有限公司
技术研发日:2022.09.30
技术公布日:2023/1/13
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献