一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种物联网设备敏感数据的识别方法、装置及电子设备

2022-12-31 15:23:25 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其是涉及一种物联网设备敏感数据的识别方法、装置及电子设备。


背景技术:

2.伴随着移动互联网的快速发展,移动终端如智能手机成为各类智能设备的管理终端。物联网设备借助移动应用,实现配对、连接、管理等功能。在与智能手机交互的过程中,涉及了大量的物联网设备敏感数据。
3.现有分析物联网设备敏感数据的方法中,研究者往往采用动态运行的方式,收集物联网设备的通信流量,分析物联网设备所涉及的敏感数据。这类方法主要缺点在于:物联网设备硬件获取成本高昂,难以进行大规模的分析;数据交互行为依赖于特定场景触发,难以覆盖全面;数据加密,难以解析敏感数据。


技术实现要素:

4.本发明的目的是提供一种物联网设备敏感数据的识别方法、装置及电子设备,以解决现有技术在识别物联网设备敏感数据的过程中难以自动化、大规模进行的技术问题。
5.本发明的目的,可以通过如下技术方案实现:
6.一种物联网设备敏感数据的识别方法,包括:
7.从物联网设备的描述文本信息中提取多个物联网敏感数据项,根据所述多个物联网敏感数据项构建物联网敏感语义词典;
8.根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,所述物联网代码块与所述物联网设备在语义上相关;
9.根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点,所述物联网敏感数据点是与所述物联网设备语义相关的文本标签;
10.从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组,将所有所述物联网敏感数据点对应的别名标签组和所述若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据,所述别名标签组是所述物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。
11.可选地,从物联网设备的描述文本信息中提取多个物联网敏感数据项包括:
12.利用命名实体识别模型从物联网设备的描述文本信息中提取多个物联网敏感数据项,所述描述文本信息至少包含物联网设备的新闻报道、物联网应用程序的代码描述及开发者文档。
13.可选地,根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块包括:
14.将物联网应用程序的源代码切分为多个语义代码块,各所述语义代码块中包含至少一个文本标签,所述文本标签具有语义信息;
15.根据各所述语义代码块中包含的文本标签筛选出与物联网设备语义相关的物联网代码块。
16.可选地,根据各所述语义代码块中包含的文本标签筛选出与物联网设备语义相关的物联网代码块包括:
17.提取各所述语义代码块中的所有文本标签;
18.将与各所述文本标签有语义关联的的文本标签扩展到各所述语义代码中,以丰富各所述语义代码块的语义;
19.将各所述语义代码块中的所有文本标签构成一个文本标签列表,对所述文本标签列表进行预处理;
20.将预处理后的所述文本标签列表转化为数值向量,将所述数值向量输入到训练好的文本分类模型中得到物联网代码块。
21.可选地,所述文本分类模型为:
22.fasttext模型。
23.可选地,根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点包括:
24.计算各所述物联网代码块中的文本标签与所述物联网敏感语义词典中的各所述物联网敏感数据项之间的相似度;
25.若所述相似度大于预设的相似度阈值,则所述文本标签为物联网敏感数据点;否则,所述文本标签不是物联网敏感数据点。
26.可选地,所述预设的相似度阈值为70%。
27.可选地,从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组包括:
28.利用基于语义信息的变量关联组件,从所述物联网应用程序的源代码中查找到各所述物联网敏感数据点的多个副本和/或多个引用。
29.本发明还提供了一种物联网设备敏感数据的识别装置,包括:
30.敏感语义词典构建模块,用于从物联网设备的描述文本信息中提取多个物联网敏感数据项,根据所述多个物联网敏感数据项构建物联网敏感语义词典;
31.物联网代码筛选模块,用于根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,所述物联网代码块与所述物联网设备在语义上相关;
32.敏感数据点识别模块,用于根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点,所述物联网敏感数据点是与所述物联网设备语义相关的文本标签;
33.设备敏感数据识别模块,用于从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组,将所有所述物联网敏感数据点对应的别名标签组和所述若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据,所述别名标签组是所述物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。
34.本发明还提供了一种电子设备,包括:
35.存储器,用于保存计算机程序;
36.处理器,用于执行所述计算机程序,以实现一种物联网设备敏感数据的识别方法。
37.本发明提供了一种物联网设备敏感数据的识别方法、装置及电子设备,其中方法包括:从物联网设备的描述文本信息中提取多个物联网敏感数据项,根据所述多个物联网敏感数据项构建物联网敏感语义词典;根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,所述物联网代码块与所述物联网设备在语义上相关;根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点,所述物联网敏感数据点是与所述物联网设备语义相关的文本标签;从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组,将所有所述物联网敏感数据点对应的别名标签组和所述若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据,所述别名标签组是所述物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。
38.有鉴如此,本发明带来的有益效果是:
39.本发明通过提取物联网敏感数据项构建物联网敏感语义词典,利用代码语义筛选出物联网设备配套移动应用程序源代码中的物联网代码块,能自动化地识别出物联网设备传输至物联网应用程序的隐私数据,追踪隐私数据的泄露;利用物联网敏感语义词典识别出物联网代码块中与物联网设备语义相关的文本标签作为敏感数据点,在物联网应用程序源代码中找到所有敏感数据点的别名标签,能快速、准确、全面地识别出物联网应用程序源代码中与物联网设备语义相关的所有物联网设备敏感数据。
40.同时,由于本发明的分析对象是物联网应用程序源代码,因此,具有良好的拓展性,实现了物联网设备数据的大规模审查,极大地拓宽了物联网设备数据的分析规模,能够对大规模的物联网设备数据进行分析,可以自动化地、高效准确地识别出大规模的物联网设备敏感数据,是一种低成本、高扩展、自动化的物联网设备敏感数据识别方法,能够支持大规模、自动化、高效准确地识别出物联网设备所包含的敏感数据。
附图说明
41.图1为现有物联网设备的第一种交互模式示意图;
42.图2为现有物联网设备的第二种交互模式示意图;
43.图3为本发明方法一实施例的流程示意图;
44.图4为本发明方法另一实施例的流程示意图;
45.图5为本发明装置的结构示意图。
具体实施方式
46.术语解释:
47.物联网设备:物联网设备是指可无线连接到网络并具有传输数据的能力,通过内部嵌入相关技术的方式,借助internet进行通信和交互的非标准计算设备。
48.物联网设备配套应用程序:物联网设备配套应用是指物联网设备与手机终端连接的计算机软件媒介,简称为物联网应用程序。
49.物联网设备敏感数据:是指与物联网设备相关的并且泄露后可能会给社会或个人带来严重危害的数据。
50.文本分类:文本分类是指用计算机对文本(或其他实体或物件)按照一定的分类体
系或标准进行自动分类标记。
51.物联网代码块:对于物联网配套移动应用程序,本发明认为物联网代码块包括一组具有语义信息的文本标签(如常量字符串,类成员变量名),描述与物联网设备相关的信息。
52.物联网敏感数据点:对于给定的物联网代码块,如果其中的文本标签清楚地表明了与物联网设备相关的信息,本发明将该代码块包含的每个文本标签(如常量字符串、类成员变量名)定义为物联网敏感数据点。
53.本发明实施例提供了一种物联网设备敏感数据的识别方法、装置及电子设备,以解决现有技术在识别物联网设备敏感数据的过程中难以自动化、大规模进行的技术问题。
54.为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的首选实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
55.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
56.请参阅图1和图2,在物联网设备的两种交互模式中,物联网数据均经过物联网设备配套应用程序。物联网设备的交互模式有两种:如图1所示,第一种为物联网设备端-手机端-云端交互模式,例如nfc、bluetooth、ble等传统设备,供应商利用物联网设备配套应用程序作为中介来处理物联网设备的数据,再将这些数据传入云端。这种数据处理手段多应用在倾向于充分利用手机的算力去处理和传输数据的短程通信设备。如图2所示,第二种为物联网设备端-云端-手机端交互模式,例如google home、amazon echo等设备,这些物联网设备直接传输它们的数据到它们的云平台后端,虽然这些物联网设备的通信路径不通过物联网设备配套应用程序,但是出于设备管理的目的,这些设备的云端倾向于将数据转发给物联网配套应用程序。
57.长久以来,如何自动化分析物联网设备所涉及的敏感数据一直存在较大挑战。物联网设备硬件的获取成本高昂,数据交互行为依赖于特定场景触发,且受限于数据加密等因素,使得传统的分析技术难以有效捕获真实的物联网设备实用数据。
58.本技术发明人经过研究发现,已有的物联网设备敏感数据识别技术集中于对物联网设备进行动态分析。有些方案在实验室环境下,部署多个物联网设备,收集这些物联网设备的通信流量,利用收集的对应设备的通信流量来识别它们在互联网上传输的数据类型、接收数据方等。还有些方案通过在现实家庭网络中由物联网用户自愿安装的应用程序来收集众包流量,以捕获物联网设备和互联网之间的通信。这样做虽然能有效地扩展了物联网设备研究的覆盖范围,但是其涉及的供应商数量较少。
59.同时,开发者出于安全考虑,往往会采用数据加密等手段;因此,在诸如家庭应用场景等特定环境下收集的数据具有一定的局限性,无法有效的应用于数据分析技术。此外,鉴于物联网数据的广度和已有研究对物联网敏感数据的覆盖面较为有限,尚未有详细的物联网设备敏感数据的识别方法。
60.请参阅图3,本发明提供的一种物联网设备敏感数据的识别方法的实施例,包括:
61.s100:从物联网设备的描述文本信息中提取多个物联网敏感数据项,根据所述多个物联网敏感数据项构建物联网敏感语义词典;
62.s200:根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,所述物联网代码块与所述物联网设备在语义上相关;
63.s300:根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点,所述物联网敏感数据点是与所述物联网设备语义相关的文本标签;
64.s400:从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组,将所有所述物联网敏感数据点对应的别名标签组和所述若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据,所述别名标签组是所述物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。
65.在识别物联网敏感数据之前,首先需要构建物联网敏感语义词典。在本发明的一个实施例的步骤s100中,从物联网设备的描述文本信息中提取多个物联网敏感数据项,根据这些物联网敏感数据项构建物联网敏感语义词典。其中,描述文本信息至少包含物联网设备的新闻报道、物联网应用程序的代码描述及开发者文档等。优选的实施方式,利用依靠安全领域的命名实体识别模型来提取多个物联网敏感数据项。表1显示了一个实施例的物联网敏感语义词典,本发明可以将物联网敏感数据项扩展到553个数据项,每个子类平均包含61项物联网敏感数据项。
66.表1
67.[0068][0069]
在自然语言处理技术领域,命名实体识别(ner)用于提取语句中的实体,根据不同的领域任务定义不同的实体类型,从而获取到所需的实体。例如,定义实体类型“节日”,命名实体识别模型能提取出“中秋节”、“端午节”等实体。优选的实施方式,本实施例中所使用的命名实体识别模型可以为xfinder模型,该模型可以提取文本中与安全领域相关的实体信息,例如安全关键数据“密码”,sdk敏感数据“用户设备标识符”等。
[0070]
在步骤s200中,根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,所述物联网代码块与所述物联网设备在语义上是相关的。
[0071]
对获取的物联网应用程序安装包进行反编译得到物联网应用程序的源代码,从物联网应用程序的源代码中查找出所有的物联网代码块。物联网应用程序的源代码中除了语义信息外,还掺杂着大量的无用信息,因此,在识别物联网设备敏感数据之前,需要定位物联网设备敏感数据所在的代码块即物联网代码块。
[0072]
本实施例中,根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块包括:首先,将物联网应用程序的源代码切分为多个语义代码块,各语义代码块中包含至少一个具有语义信息的文本标签;然后,根据各语义代码块中包含的文本标签筛选出与物联网设备语义相关的物联网代码块。
[0073]
本实施例中,将物联网应用程序的源代码划分为多个语义代码块后,再判断各语义代码块是否与物联网设备敏感数据相关,与物联网设备敏感数据相关的语义代码块称为物联网代码块,与物联网设备敏感数据不相关的语义代码块称为非物联网代码块。本实施例中的物联网代码块,在其包含的类、方法、变量或常量字符串中,至少包含一个具有语义信息的文本标签,例如包含一个单词或名词性词组。
[0074]
具体地,根据各语义代码块中包含的文本标签筛选出与物联网设备语义相关的物联网代码块包括:提取各语义代码块中的所有文本标签;将与各文本标签有语义关联的的文本标签扩展到各语义代码中,以丰富各语义代码块的语义;将各语义代码块中的所有文本标签构成一个文本标签列表,对文本标签列表进行预处理;将预处理后的文本标签列表转化为数值向量,将数值向量输入到训练好的文本分类模型中得到物联网代码块。
[0075]
在一个实施例中,通过一个文本二分类任务来检查文本标签的语义信息。以下是物联网代码块识别步骤的详细说明:
[0076]
(1)提取待测的各个语义代码块中的所有语义信息(如常量字符串、变量名等)作为文本标签;
[0077]
(2)扩展各个语义代码块的语义信息。由于各语义代码块中存在的有效文本标签的数量可能有限,或者包含模糊语义的文本标签,因此,本实施例提出了一组启发式方法,通过将分散的文本标签关联到这些语义代码块中,以丰富这些语义代码块的语义信息。
[0078]
以下面代码所示的语义代码块为例,成员变量a、b和c包含在同一个语义代码块中,但“a”、“b”、“c”这些标签的语义模糊,不能判断其是否为物联网代码块。为了丰富语义,本发明利用数据流分析技术,分析类中的所有方法,并找到与成员变量相关的文本标签。语义代码中的文本标签“,isrunning=”与语义代码块相关,因为它描述了“this.a”字段(第19行)。通过这个过程,可以丰富包含语义模糊字段的语义代码块的语义信息,能提升物联网代码块识别的准确性。
[0079][0080]
(3)将各语义代码块中的所有文本标签构成一个文本标签列表,表2展示了将一个语义代码块中所有文本标签构成的文本标签列表的示例。
[0081]
表2
[0082][0083][0084]
(4)将得到的文本标签列表进行文本预处理,将预处理后的本标签列表转化为数值向量,将数值向量输入到训练好的文本分类模型(如fasttext模型)中进行分类,判断文本标签列表对应的语义代码块是否为物联网代码,进一步得到所有的物联网代码块。
[0085]
可以理解的是,物联网代码块中的文本标签既包括从代码块中直接提取的文本标签,还包括与提取的文本标签具有语义关联的文本标签即扩展的文本标签,将直接提取的
文本标签和扩展的文本标签一起构成一个文本标签列表。
[0086]
需要说明的是,在本发明的物联网敏感语义词典中,有些数据项既描述了物联网设备收集的敏感数据,也描述了物联网移动应用程序直接收集的敏感数据。为了减少或消除误报,本实施例采取以下措施:
[0087]
(1)基于程序包名进行筛选。本实施例依靠包名识别与物联网设备管理有关的代码,过滤第三方库中与物联网设备无关代码。
[0088]
(2)基于聚合语义的敏感数据识别。本实施例利用fasttext模型检测具有聚合语义的物联网代码块。fasttext根据多个文本标签组成的聚合语义,判断输入代码块是否为物联网代码块,这样不会因为单个数据点而将代码块判断为与物联网设备相关的物联网代码块。
[0089]
另外,本实施例将由物联网移动应用程序直接收集的、且与物联网设备有关的敏感数据也划入到物联网敏感数据项中,提高了识别效果。
[0090]
在本实施例的物联网代码定位过程中,使用一种基于词嵌入和神经网络的监督文本分类模型——fasttext模型来学习文本标签,根据代码块包含的聚合文本标签列表,判断其是否与物联网设备相关。
[0091]
fasttext模型的训练步骤如下:
[0092]
收集物联网代码块和非物联网代码块用于构造正负样本训练集,并进行人工检查。
[0093]
提取训练数据集中每个代码块的语义信息(即常量字符串和变量名)作为文本标签。多个文本标签构成一个文本标签列表,并对该列表内的所有标签文本进行文本预处理。
[0094]
使用句子嵌入模型(sentence embedding model),将处理过后的文本标签列表转化为数值向量。优选的,句子嵌入模型为sbert模型,将处理过后的文本标签列表输入到sbert模型中,将文本标签转换为数值向量。由于sbert模型是由斯坦福自然语言推理(snli)语料库上训练得出,其所给出的数值向量(embedding)能够准确反映文本标签在多维空间中的语义特征。
[0095]
将得到的数值向量输入模型训练。
[0096]
在实施例的步骤s300中,根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点,所述物联网敏感数据点是与所述物联网设备语义相关的文本标签。
[0097]
在查找得到与物联网设备语义相关的所有物联网代码块后,利用构建的物联网敏感语义词典来识别出物联网代码块中所包含的所有物联网敏感数据点。具体地,根据如表1所示的物联网敏感语义词典,计算各物联网代码块中的所有文本标签与各物联网敏感数据项之间的相似度;然后,比较该相似度与预设的相似度阈值之间的大小,若该相似度大于预设的相似度阈值,则对应的文本标签为物联网敏感数据点;否则,对应的文本标签不是物联网敏感数据点,而是与物联网设备敏感数据无关的文本标签。
[0098]
需要说明的是,计算各物联网代码块中的所有文本标签与各物联网敏感数据项之间的相似度时,首先,将该物联网代码块中的所有文本标签构成一个文本标签列表;然后,使用句子嵌入模型将文本标签列表中的所有文本标签转换为数值向量,该数字向量能准确反映对应的文本标签在多维空间中的语义特征;最后,使用句子嵌入模型衡量句子语义相
似度,若衡量结果大于预设的相似度阈值,则将对应的文本标签作为物联网敏感数据点。优选的实施方式,预设的相似度阈值为70%。
[0099]
在相似度分析技术中,本实施例使用了sentence-bert模型(简称sbert模型),将需要比较的文本数据单独传入到模型,得到每个句子的词向量,再使用余弦函数计算两两词向量的余弦距离就可以得到相似度。
[0100]
在步骤s400中,从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组,将所有别名标签和所述若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据,所述别名标签组是所述物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。
[0101]
在整个物联网应用程序的代码空间中,物联网敏感数据点在不同的方法中可能有多个副本或引用。因此,本实施例设计了基于语义信息的变量关联组件。
[0102]
给定一个已识别的物联网敏感数据点,变量关联组件进行搜索并维护,该物联网敏感数据点在物联网应用程序中的一组别名标签。由于代码结构特征,本实施例认为同一行代码中的变量名、字符串标签具有相似、相关联的自然语义信息,能够用于表征同一物联网(iot)数据。例如,string light_status=json.get("bulb_on"),本实施例认为bulb_on跟light_status具有相同语义,均表示亮灯状态。
[0103]
本实施例中的变量关联组件会搜索与此变量相关的数据赋值等操作,找到物联网敏感数据点的所有别名,通过搜索语义变量的别名,可以更加丰富变量语义,更好地关联具有语义信息的文本标签。
[0104]
本实施例提供的物联网设备敏感数据的识别方法,通过提取物联网敏感数据项构建物联网敏感语义词典,利用代码语义筛选出物联网设备配套移动应用程序源代码中的物联网代码块,能自动化地识别出物联网设备传输至物联网应用程序的隐私数据,追踪隐私数据的泄露;利用物联网敏感语义词典识别出物联网代码块中与物联网设备语义相关的文本标签作为敏感数据点,在物联网应用程序源代码中找到所有敏感数据点的别名标签,能快速、准确、全面地识别出物联网应用程序源代码中与物联网设备语义相关的所有物联网设备敏感数据。
[0105]
同时,由于本实施例的分析对象是物联网应用程序源代码,因此,具有良好的拓展性,实现了物联网设备数据的大规模审查,极大地拓宽了物联网设备数据的分析规模,能够对大规模的物联网设备数据进行分析,可以自动化地、高效准确地识别出大规模的物联网设备敏感数据,是一种低成本、高扩展、自动化的物联网设备敏感数据识别方法。
[0106]
请参阅图4,本发明提供了一种物联网设备敏感数据的识别方法的另一实施例,包括:
[0107]
预先提取了与物联网设备敏感数据相关的物联网敏感数据项,并制作了物联网敏感语义词典,作为物联网数据识别的基础;
[0108]
接着,将物联网设备配套应用程序进行反编译得到物联网应用程序的源代码,将源代码切分为多个语义代码块,根据语义代码块所包含的语义信息,筛选出与物联网设备相关的所有物联网代码块;
[0109]
比较语义代码块中的文本标签与预先构建的物联网敏感数据项之间的相似性,根据相似性定位物联网代码块所包含的物联网敏感数据点;
[0110]
将识别出的物联网敏感数据点,通过基于语义信息的变量关联组件,定位到敏感数据在源代码中对应的变量别名。
[0111]
本实施例旨在构建一种物联网设备敏感数据的识别方法,这是一个低成本、高扩展、自动化的物联网设备敏感数据识别方法。本发明利用了物联网设备配套移动应用出现中的代码语义,使用自然语言处理技术,自动化地识别物联网设备传输至移动应用中的隐私数据。同时,由于分析对象是物联网设备配套应用程序,因此,本发明提供的方法具有良好的拓展性,可以适用于对大规模的物联网设备敏感数据进行分析。
[0112]
请参阅图5,本发明还提供了一种物联网设备敏感数据的识别装置的实施例,包括:
[0113]
敏感语义词典构建模块11,用于从物联网设备的描述文本信息中提取多个物联网敏感数据项,根据所述多个物联网敏感数据项构建物联网敏感语义词典;
[0114]
物联网代码筛选模块22,用于根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,所述物联网代码块与所述物联网设备在语义上相关;
[0115]
敏感数据点识别模块33,用于根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点,所述物联网敏感数据点是与所述物联网设备语义相关的文本标签;
[0116]
设备敏感数据识别模块44,用于从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组,将所有所述物联网敏感数据点对应的别名标签组和所述若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据,所述别名标签组是所述物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。
[0117]
在物联网设备数据分析领域,本发明借助配套应用中的变量语义,自动化的识别物联网设备传输的隐私数据、追踪隐私数据的泄露,从而实现了物联网设备数据的大规模审查,极大地拓宽了物联网数据分析的规模,能够支持大规模、自动化、高效准确地识别出物联网设备所包含的敏感数据。
[0118]
本发明还提供了一种电子设备,包括:
[0119]
存储器,用于保存计算机程序;
[0120]
处理器,用于执行所述计算机程序,以实现一种物联网设备敏感数据的识别方法。
[0121]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0122]
在本技术所提供的实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0123]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0124]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0125]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0126]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献