一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种物联网设备敏感数据的识别方法、装置及电子设备

2022-12-31 15:23:25 来源:中国专利 TAG:

技术特征:
1.一种物联网设备敏感数据的识别方法,其特征在于,包括:从物联网设备的描述文本信息中提取多个物联网敏感数据项,根据所述多个物联网敏感数据项构建物联网敏感语义词典;根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,所述物联网代码块与所述物联网设备在语义上相关;根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点,所述物联网敏感数据点是与所述物联网设备语义相关的文本标签;从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组,将所有所述物联网敏感数据点对应的别名标签组和所述若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据,所述别名标签组是所述物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。2.根据权利要求1所述的物联网设备敏感数据的识别方法,其特征在于,从物联网设备的描述文本信息中提取多个物联网敏感数据项包括:利用命名实体识别模型从物联网设备的描述文本信息中提取多个物联网敏感数据项,所述描述文本信息至少包含物联网设备的新闻报道、物联网应用程序的代码描述及开发者文档。3.根据权利要求1所述的物联网设备敏感数据的识别方法,其特征在于,根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块包括:将物联网应用程序的源代码切分为多个语义代码块,各所述语义代码块中包含至少一个文本标签,所述文本标签具有语义信息;根据各所述语义代码块中包含的文本标签筛选出与物联网设备语义相关的物联网代码块。4.根据权利要求3所述的物联网设备敏感数据的识别方法,其特征在于,根据各所述语义代码块中包含的文本标签筛选出与物联网设备语义相关的物联网代码块包括:提取各所述语义代码块中的所有文本标签;将与各所述文本标签有语义关联的的文本标签扩展到各所述语义代码中,以丰富各所述语义代码块的语义;将各所述语义代码块中的所有文本标签构成一个文本标签列表,对所述文本标签列表进行预处理;将预处理后的所述文本标签列表转化为数值向量,将所述数值向量输入到训练好的文本分类模型中得到物联网代码块。5.根据权利要求1所述的物联网设备敏感数据的识别方法,其特征在于,所述文本分类模型为:fasttext模型。6.根据权利要求1所述的物联网设备敏感数据的识别方法,其特征在于,根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点包括:计算各所述物联网代码块中的所有文本标签与所述物联网敏感语义词典中的各所述物联网敏感数据项之间的相似度;若所述相似度大于预设的相似度阈值,则所述文本标签为物联网敏感数据点;否则,所
述文本标签不是物联网敏感数据点。7.根据权利要求6所述的物联网设备敏感数据的识别方法,其特征在于,所述预设的相似度阈值为70%。8.根据权利要求1所述的物联网设备敏感数据的识别方法,其特征在于,从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组包括:利用基于语义信息的变量关联组件,从所述物联网应用程序的源代码中查找到各所述物联网敏感数据点的多个副本和/或多个引用。9.一种物联网设备敏感数据的识别装置,其特征在于,包括:敏感语义词典构建模块,用于从物联网设备的描述文本信息中提取多个物联网敏感数据项,根据所述多个物联网敏感数据项构建物联网敏感语义词典;物联网代码筛选模块,用于根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,所述物联网代码块与所述物联网设备在语义上相关;敏感数据点识别模块,用于根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点,所述物联网敏感数据点是与所述物联网设备语义相关的文本标签;设备敏感数据识别模块,用于从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组,将所有所述物联网敏感数据点对应的别名标签组和所述若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据,所述别名标签组是所述物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。10.一种电子设备,其特征在于,包括:存储器,用于保存计算机程序;处理器,用于执行所述计算机程序,以实现如权利要求1至8任一项所述的物联网设备敏感数据的识别方法。

技术总结
本发明公开了一种物联网设备敏感数据的识别方法、装置及电子设备,方法包括:从物联网设备的描述文本信息中提取多个物联网敏感数据项并构建物联网敏感语义词典;根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,物联网代码块与物联网设备在语义上相关;根据物联网敏感语义词典识别出各物联网代码块中包含的若干物联网敏感数据点,物联网敏感数据点是与物联网设备语义相关的文本标签;从物联网应用程序的源代码中查找到与各物联网敏感数据点对应的别名标签组,将所有别名标签和所有物联网敏感数据点关联的程序变量作为物联网设备敏感数据。本发明能够支持大规模、自动化、高效准确地识别出物联网设备所包含的敏感数据。含的敏感数据。含的敏感数据。


技术研发人员:南雨宏 杨培福 黄佳颖 张玉亮 郑子彬
受保护的技术使用者:中山大学
技术研发日:2022.10.12
技术公布日:2022/12/30
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献