一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于卷积神经网络的微信小程序分类方法及系统

2022-11-30 10:37:34 来源:中国专利 TAG:

技术特征:
1.基于卷积神经网络的微信小程序分类系统,其特征在于,包括反编译模块、动态特征提取模块、静态特征提取模块、特征预处理模块、深度学习模块;所述反编译模块用于将多个微信压缩包文件合并,反编译成代码文件并发送至动态和静态特征提取模块;所述动态特征提取模块用于在沙箱中运行小程序,记录动态特征并存储在数据库中;并记录了每个页面的访问频率,发送至静态特征提取模块;所述静态特征提取模块用于从访问频率最高的页面代码中提取静态特征,为获得的代码文件生成一个抽象语法树,遍历抽象语法树来提取微信小应用程序的api特征和url特征,并将api和url的数量存储在原生数据库中;所述特征预处理模块用于对原生数据库中的缺失、重复、冗余和异常值特征数据进行处理,将数据转换成统一的格式,并存储在特征数据库中;所述cnn深度学习分类模块,基于微信小程序中提取并预处理后的动态特征和静态特征,采用两个深度学习模型cnn进行训练和分类,最终得到分类结果。2.根据权利要求1所述的基于卷积神经网络的微信小程序分类系统,其特征在于,所述动态特征包括文件系统特征、网络流量特征和辅助特征。3.根据权利要求1所述的基于卷积神经网络的微信小程序分类系统,其特征在于,所述api特征通过以下过程提取:从微信打开文档捕获api列表;使用esprima库为小应用的每个json文件构建一个抽象语法树,并遍历所有抽象语法树;当节点类型为函数调用且调用对象为wx时,对应的api值设置为1,由此构造微信小应用的api特征向量。4.根据权利要求1所述的基于卷积神经网络的微信小程序分类系统,其特征在于,所述url特征通过以下过程提取:遍历抽象语法树来提取wx下的url参数;请求节点,其中url被分为四个部分:主机名、路径名、文件名和参数,然后,使用skip-gram模型将url字符串转换为具有更紧凑表示的密集向量。5.基于卷积神经网络的微信小程序分类方法,其特征在于,包括如下步骤:步骤1,代码反编译模块自动反编译微信小应用程序的代码压缩包,并将源代码发送给动态和静态特征提取模块;步骤2,动态特征提取模块首先运行小应用程序一端时间,然后将动态特性存储到数据库中,同时记录访问每个页面的频率,并将结果发送给静态特征提取模块;步骤3,静态特征提取模块从属于最常访问页面的源代码中提取静态特性,并将原始静态特性写入数据库;步骤4,数据预处理模块从数据库中提取原始特征进行预处理,针对缺失值、重复值或无法区分的常量值进行处理,根据mann-whiteny原理筛选出选择性最高的1300列特征作为最终的特征矩阵,然后输入到cnn分类器中;步骤5,基于预处理后的动态特征和静态特征进行cnn模型训练,根据用户每次输入小程序后产生的特征向量生成最终的分类结果。
6.根据权利要求5所述的基于卷积神经网络的微信小程序分类方法,其特征在于,所述步骤2具体包括如下子步骤:(1)首先捕获在启动该小程序前三分钟内,移动设备产生的cpu、内存以及网络特征;(2)再在沙箱中启动微信小程序,并捕获启动后三分钟内产生的动态特征;(3)从后台关闭微信小程序,并捕获小程序关闭后内三分钟的动态特征;(4)将以上动态特征发送至动态特征数据库同时将各个页面的访问频率发送至静态特征提取模块。7.根据权利要求5所述的基于卷积神经网络的微信小程序分类方法,其特征在于,所述步骤3具体包括如下子步骤:(1)用户指定反编译文件的存储目录以及入口页面;(2)筛选出最常访问的五个页面,并构建抽象语法树;(3)遍历抽象语法树提取微信小应用程序的api和url,并记录各api以及url的调用次数;(4)将以上数据作为静态特征发送至静态特征数据库。8.根据权利要求5所述的基于卷积神经网络的微信小程序分类方法,其特征在于,所述步骤5中,基于用户输入进行分类生成最终的分类结果的过程包括如下步骤:(1)用户在主界面搜索框输入待分类小程序的名称;(2)系统从沙箱中启动该微信小程序,并将微信压缩包文件目录发送至反编译接口;(3)从预处理模块取出该微信小程序的动态特征矩阵以及静态特征矩阵,并将其发送至训练好的cnn接口,得到最终的多分类结果;(4)分类器将可能性最高的三个分类结果显示在用户界面,并给予建议性措施。

技术总结
本发明提供了一种基于卷积神经网络的微信小程序分类方法及其系统,基于编译和抽象语法树实现,提取了微信小应用程序的静态特性,包括API和URL;还提取了动态特征以利用沙箱和运行时监视技术;最后基于上述特征设计了一个用于小程序分类的CNN分类模型,将微信小app的特征矩阵以图像的形式输入到CNN中来完成分类任务。本发明能够对微信小程序进行有效、准确、详细的分类,使用户更容易识别小程序功能。本发明的检测准确率达到93%以上,动态检测准确率达到96.5%,能够帮助用户更好地理解所选择的小程序,有助于用户决定是否使用目标小程序,并有效保护用户的隐私安全。并有效保护用户的隐私安全。并有效保护用户的隐私安全。


技术研发人员:伏晓 金义皓 骆斌
受保护的技术使用者:南京大学
技术研发日:2022.08.31
技术公布日:2022/11/29
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献