一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

神经网络的鲁棒性评估方法、装置、设备及存储介质与流程

2023-06-17 15:10:21 来源:中国专利 TAG:


1.本技术涉及人工智能领域,具体涉及一种神经网络的鲁棒性评估方法、装置、设备及存储介质。


背景技术:

2.随着大数据技术的日趋成熟以及计算机处理速度和存储能力的极大提高,神经网络的研究取得突破性进展,与其相关的应用也呈现出爆发式增长。其中,最为典型的是面向视觉任务的图像分类、目标检测和目标跟踪等神经网络模型。
3.神经网络的鲁棒性是指在任何条件下,保持其性能水平的能力。从神经网络鲁棒性的定义可知,对神经网络进行鲁棒性测试需要构建一系列的测试数据集,并通过测试数据集实现对神经网络进行测试。例如,在自动驾驶场景中,通常采用的测试数据集包括imagenet数据集(图像识别最大的数据库)、kitti数据集(自动驾驶的真实场景数据库)和cityscapes数据集(真实城市道路的场景数据库)。
4.然而,相关技术中测试数据集包括的数据主要面向的是普通场景,内容单一,无法实现对各种鲁棒性影响条件的全面覆盖,导致神经网络的鲁棒性评估不够准确。


技术实现要素:

5.因此,本技术要解决在相关技术中,对神经网络的鲁棒性评估不够准确的技术问题,从而提供一种神经网络的鲁棒性评估方法、装置、设备及存储介质,所述技术方案如下:
6.一方面,本技术提供了一种神经网络的鲁棒性评估方法,所述方法包括:
7.基于待评估神经网络的应用任务,构建鲁棒性评估模型,所述鲁棒性评估模型包括量化评估指标以及n个级别的度量元;其中,所述n个级别的度量元中i-1级度量元包括至少一个i级度量元,所述i级度量元从属于所述i-1级度量元,所述n个级别的度量元中的一级度量元从属于所述量化评估指标,所述n为大于或等于2的正整数,所述i为小于或等于所述n的正整数;
8.获取至少一个测试数据集,所述测试数据集与所述n个级别的度量元中n级度量元的标签一一对应;
9.基于所述至少一个测试数据集对所述待评估神经网络进行测试,得到所述n级度量元的标签分别对应的测试值;
10.对所述n级度量元的标签分别对应的测试值进行层次分析计算,得到所述量化评估指标的指标评估值,所述指标评估值用于指示所述待评估神经网络的鲁棒性。
11.可选地,所述对所述n级度量元的标签分别对应的测试值进行层次分析计算,得到所述量化评估指标的指标评估值,包括:通过每个n级度量元的标签的权重系数,对相应n级度量元的标签的测试值进行加权求和处理,得到相应n级度量元的测试值;通过每个n级度量元的权重系数,对相应n级度量元的测试值进行加权求和处理,得到相应n级度量元所从属的n-1级度量元的测试值;通过每个n-1级度量元的权重系数,对相应n-1级度量元的测试
值进行加权求和处理,得到相应n-1级度量元所从属的n-2级度量元的测试值;直到通过所述n个级别的度量元中每个一级度量元的权重系数,对相应一级度量元的测试值进行加权求和处理,得到所述量化评估指标的指标评估值。
12.可选地,所述基于所述至少一个测试数据集对所述待评估神经网络进行测试,得到所述n级度量元的标签分别对应的测试值之后,还包括:针对每个n级度量元的标签,统计相应n级度量元的标签对应的测试数据集中测试样本的数量;计算相应n级度量元的标签中测试样本的数量,占同属性标签中测试样本的总数量的第一概率分布比,所述同属性标签包括相应n级度量元的标签,且所述同属性标签从属于同一个n级度量元;获取第二概率分布比,所述第二概率分布比是指实际场景中相应n级度量元的标签出现的概率;基于所述第一概率分布比和第二概率分布比,修正相应n级度量元的标签的测试值,得到修正后的测试值,所述修正后的测试值用于进行所述层次分析计算。
13.可选地,所述应用任务包括自动驾驶任务,所述一级度量元包括:环境复杂度,用于指示所述待评估神经网络在所述自动驾驶任务中所处环境的复杂性;平台复杂度,用于指示所述待评估神经网络在所述自动驾驶任务中数据采集过程的复杂性;任务复杂度,用于指示所述待评估神经网络在所述自动驾驶任务中所执行操作的复杂性。
14.可选地,从属于所述环境复杂度的二级度量元包括:天气、光照、场景和对抗;从属于所述平台复杂度的二级度量元包括:机动、视角、噪声和成像;从属于所述任务复杂度的二级度量元包括:距离、遮挡、密度和干扰。
15.可选地,所述获取至少一个测试数据集,包括以下至少一项:基于仿真环境中采集的仿真数据生成所述测试数据集;基于实际环境中采集的实际数据生成所述测试数据集;基于预设规则的网络聚类得到的数据生成所述测试数据集。
16.可选地,在所述应用任务包括图像分类任务的情况下,所述量化评估指标包括以下任意一项:准确率、误分类率、查准率、查全率、f1值、roc曲线、auc值、pr曲线;在所述应用任务包括目标检测任务的情况下,所述量化评估指标包括以下任意一项:map、coco评估指标、准确率、误分类率、查准率、查全率、f1值、roc曲线、auc值、pr曲线。
17.另一方面,本技术提供了一种神经网络的鲁棒性评估装置,包括:
18.构建模块,用于基于待评估神经网络的应用任务,构建鲁棒性评估模型,所述鲁棒性评估模型包括量化评估指标以及n个级别的度量元;其中,所述n个级别的度量元中i-1级度量元包括至少一个i级度量元,所述i级度量元从属于所述i-1级度量元,所述n个级别的度量元中的一级度量元从属于所述量化评估指标,所述n为大于或等于2的正整数,所述i为小于或等于所述n的正整数;
19.第一获取模块,用于获取至少一个测试数据集,所述测试数据集与所述n个级别的度量元中n级度量元的标签一一对应;
20.测试模块,用于基于所述至少一个测试数据集对所述待评估神经网络进行测试,得到所述n级度量元的标签分别对应的测试值;
21.第一计算模块,用于对所述n级度量元的标签分别对应的测试值进行层次分析计算,得到所述量化评估指标的指标评估值,所述指标评估值用于指示所述待评估神经网络的鲁棒性。
22.再一方面,本技术提供了一种计算机设备,包括:存储器和处理器,所述存储器和
所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行上述的神经网络的鲁棒性评估方法。
23.又一方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机设备执行上述的鲁棒性评估方法。
24.还一方面,本技术提供了一种计算机程序产品,当计算机程序产品在计算机设备上运行时,用于实现上述的鲁棒性评估方法。
25.本技术技术方案,具有如下优点:
26.本技术提供的神经网络的鲁棒性评估方法,由于鲁棒性评估模型基于待评估神经网络的应用任务构建,与应用任务高度匹配,从而n级度量元的标签可覆盖全部场景的数据,如针对自动驾驶的不同场景、不同干扰因素、不同路面情况、不同行驶任务等多种组合形式实现多种场景的构造,进而通过利用与n级度量元的标签对应的测试数据集对待评估神经网络进行测试,实现比较同一神经网络在多种场景中的鲁棒性,达到客观全面地评估神经网络鲁棒性的要求,提高对神经网络的鲁棒性评估的准确性。
附图说明
27.为了更清楚地说明本技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
28.图1为本技术实施例1神经网络的鲁棒性评估方法的流程图;
29.图2为本技术实施例1中鲁棒性评估模型图;
30.图3为本技术实施例2神经网络的鲁棒性评估装置的结构框图;
31.图4为本技术实施例3计算机设备的原理框图。
具体实施方式
32.下面将结合附图对本技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
33.在本技术的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,下面所描述的本技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
34.神经网络的鲁棒性优劣决定神经网络在实际应用中的性能,在将神经网络应用上线前,可以对神经网络进行鲁棒性评估,以保证神经网络在实际应用中的稳定性。
35.实施例1
36.本实施例提供了一种神经网络的鲁棒性评估方法,图1是说明根据本技术某些实施例,基于鲁棒性评估模型计算得到待评估神经网络的指标评估值的流程图。虽然下文描述的过程包括以特定的顺序出现的多个操作,但是应该清楚地了解到,这些过程也可以包括更多或者更少的操作,这些操作可以顺序执行或者并行执行(例如使用并行处理器或者多线程环境)。如图1所示,该方法包括如下步骤:
37.s101、基于待评估神经网络的应用任务,构建鲁棒性评估模型,鲁棒性评估模型包括量化评估指标以及n个级别的度量元。
38.待评估神经网络可应用于车牌识别、人脸识别、自动驾驶或目标物检测等任务中,不同的应用任务所处理的对象、场景等不同,基于待评估神经网络不同的应用任务,可以构建不同的鲁棒性评估模型。
39.鲁棒性评估模型包括量化评估指标和n个级别的度量元,n个级别的度量元中i-1级度量元包括至少一个i级度量元。其中,n是大于或等于2的正整数,i是小于或等于n的正整数;针对确定的鲁棒性评估模型而言,n是定值,i是1至n的变值。例如,针对图像数据集中的语义分割任务,n可以是3,i可以是1、2或3;针对目标检测任务,n可以是2,i可以是1或2。需要说明的是,i取1时,i-1级度量元可视为量化评估指标,i-1级度量元包括至少一个i级度量元可视为,量化评估指标包括至少一个一级度量元。
40.i级度量元从属于i-1级度量元,n个级别的度量元中的一级度量元从属于量化评估指标。其中,i级度量元指的是第i级度量元,i-1级度量元指的是第i-1级度量元,一级度量元指的是第一级度量元;从属于是指i-1级度量元包含对应的i级度量元,量化评估指标包含一级度量元。当然,一级度量元可包括多个,多个一级度量元从属于量化评估指标,每个一级度量元至少包括一个二级度量元。
41.在一个或多个实施例中,待评估神经网络应用在自动驾驶任务中。针对自动驾驶,一级度量元可包括:环境复杂度、平台复杂度和任务复杂度。环境复杂度用于指示待评估神经网络在自动驾驶任务中所处环境的复杂性;平台复杂度用于指示待评估神经网络在自动驾驶任务中数据采集过程的复杂性;任务复杂度用于指示待评估神经网络在自动驾驶任务中所执行操作的复杂性。可选地,从属于环境复杂度的二级度量元包括:天气、光照、场景和对抗,从属于平台复杂度的二级度量元包括:机动、视角、噪声和成像,从属于任务复杂度的二级度量元包括:距离、遮挡、密度和干扰。
42.如图2所示,其为针对自动驾驶任务,所构建的一种鲁棒性评估模型。一级度量元102包括环境复杂度、平台复杂度和任务复杂度,一级度量元102从属于量化评估指标101。二级度量元103包括:从属于环境复杂度的天气、光照、场景、对抗;从属于平台复杂度的机动、视角、噪声、成像;从属于任务复杂度的距离、遮挡、密度、干扰。天气的标签104包括雾天、雨天、雪天、阴天、晴天;光照的标签104包括:黎明、白天、黄昏、黑夜;场景的标签104包括:海洋、陆地、天空;对抗的标签104包括:随机、单频、脉冲、电磁、工频;机动的标签104包括:振动、转动;视角的标签104包括:平视、仰视、俯视;噪声的标签104包括:高斯、泊松、乘性、椒盐、瑞利;成像的标签104包括:分辨率、色相、饱和度、亮度;距离的标签104包括:近、中、远、过远;遮挡的标签104包括:无遮挡、小部分遮挡、大部分遮挡;密度的标签104包括:低密度、中密度、高密度;干扰的标签104包括:相似物和倒影等。
43.本技术实施例中,由于鲁棒性评估模型基于待评估神经网络的应用任务构建,与应用任务高度匹配,从而n级度量元的标签可覆盖全部场景的数据,如针对自动驾驶的不同场景、不同干扰因素、不同路面情况、不同行驶任务等多种组合形式实现多种场景的构造,比较同一神经网络在多种场景中的鲁棒性,达到客观全面地评估神经网络鲁棒性的要求,提高对神经网络的鲁棒性评估的准确性。
44.s102、获取至少一个测试数据集,测试数据集与n个级别的度量元中n级度量元的
标签一一对应。
45.测试数据集用于对待评估神经网络进行测试,测试数据集是基于n级度量元的标签获取的。n级度量元的标签从属于n级度量元(指的是第n级度量元),即每个n级度量元中包括至少一个标签。例如,n级度量元包括天气,天气的标签包括雾天、雨天、雪天、阴天和晴天等,可以根据天气的标签制作对应的测试数据集,每个标签对应一个测试数据集。
46.在一个或多个实施例中,测试数据集可基于仿真环境中采集的仿真数据生成;也可基于实际环境中采集的实际数据生成;还可基于预设规则的网络聚类得到的数据生成。当然,实际应用中,也可以结合多种方式生成测试数据集,如基于仿真环境中采集的仿真数据和基于预设规则的网络聚类得到的数据,生成测试数据集。可选地,可以按照n级度量元的标签要求,生成、采集和/或搜索对应的数据,再读取生成、采集和/或搜索到的数据,形成测试数据集。
47.s103、基于至少一个测试数据集对待评估神经网络进行测试,得到n级度量元的标签分别对应的测试值。
48.利用测试数据集对待评估神经网络进行测试,得到n级度量元的标签分别对应的测试值。例如,获取雪天标签、晴天标签对应的测试数据集,利用雪天标签对应的测试数据集对待评估神经网络进行测试,得到雪天标签对应的测试值,利用晴天标签对应的测试数据集对待评估神经网络进行测试,得到晴天标签对应的测试值。
49.s104、对n级度量元的标签分别对应的测试值进行层次分析计算,得到量化评估指标的指标评估值,指标评估值用于指示待评估神经网络的鲁棒性。
50.鲁棒性评估模型包括量化评估指标和n个级别的度量元,i-1级度量元从属于i级度量元,一级度量元从属于量化评估指标。利用n级度量元的标签分别对应的测试值进行层次分析计算,得到量化评估指标的指标评估值,以指示待评估神经网络的鲁棒性。在计算得到量化评估指标的指标评估值后,可对鲁棒性评估模型、相关的测试数据集以及测试结果数据等进行可视化展示。
51.在应用任务包括图像分类任务的情况下,量化评估指标包括以下任意一项:准确率、误分类率、查准率、查全率、f1值、roc(receiver operating characteristic,受试者工作特征)曲线、auc(area under curve,roc曲线下与坐标轴围成的面积)值、pr(precision recall,查准率-查全率)曲线;在应用任务包括目标检测任务的情况下,量化评估指标包括以下任意一项:map(mean average precision,类平均精度)、coco评估指标、准确率、误分类率、查准率、查全率、f1值、roc曲线、auc值、pr曲线。需要说明的一点是,量化评估指标与对待评估神经网络进行测试时,所使用的指标应当保持一致,如量化评估指标为准确率,那么在步骤s103中得到的测试值也应当是准确率的测试值。
52.综上所述,在本技术实施例中,基于待评估神经网络的应用任务,构建包括量化评估指标以及n个级别的度量元的鲁棒性评估模型;再利用与n级度量元的标签对应的测试数据集对待评估神经网络进行测试,并利用n级度量元的标签对应的测试值,基于鲁棒性评估模型进行层次分析计算,得到用于指示待评估神经网络鲁棒性的量化评估指标的指标评估值。由于鲁棒性评估模型基于待评估神经网络的应用任务构建,与应用任务高度匹配,从而n级度量元的标签可覆盖全部场景的数据,如针对自动驾驶的不同场景、不同干扰因素、不同路面情况、不同行驶任务等多种组合形式实现多种场景的构造,进而通过利用与n级度量
元的标签对应的测试数据集对待评估神经网络进行测试,实现比较同一神经网络在多种场景中的鲁棒性,达到客观全面地评估神经网络鲁棒性的要求,提高对神经网络的鲁棒性评估的准确性。
53.在一个或多个实施例中,每个i级度量元具有对应的权重系数,每个n级度量元的标签具有对应的权重系数。例如,一级度量元包括环境复杂度,从属于环境复杂度的二级度量元包括天气、光照,天气的标签包括雨天、雪天和晴天,则天气、光照各自具有对应的权重系数,雨天、雪天和晴天各自具有对应的权重系数。
54.基于此,对n级度量元的标签分别对应的测试值进行层次分析计算,得到量化评估指标的指标评估值,包括如下步骤(s201~s203)。
55.s201、通过每个n级度量元的标签的权重系数,对相应n级度量元的标签的测试值进行加权求和处理,得到相应n级度量元的测试值。
56.n级度量元的标签各自对应一个权重系数,在利用测试数据集对待评估神经网络进行测试,得到对应的测试值后,利用测试值及对应的权重系数进行加权求和计算,得到相应n级度量元的测试值。
57.举例来说,n级度量元包括天气,天气的标签包括雨天、雪天和晴天,雨天、雪天和晴天的权重分别为a、b和c,利用雨天、雪天和晴天对应的测试数据集对待评估神经网络进行测试,得到测试值分别为a、b和c,则n级度量元(天气)的测试值为aa bb cc。
58.s202、通过每个n级度量元的权重系数,对相应n级度量元的测试值进行加权求和处理,得到相应n级度量元所从属的n-1级度量元的测试值;通过每个n-1级度量元的权重系数,对相应n-1级度量元的测试值进行加权求和处理,得到相应n-1级度量元所从属的n-2级度量元的测试值。
59.每个n级度量元各自对应一个权重系数,在得到n级度量元的测试值后,利用n级度量元的测试值和对应的权重系数进行加权计算,得到对应n-1级度量元的测试值。
60.举例来说,n级度量元包括天气、光照,n-1级度量元包括环境复杂度,天气、光照具有对应的权重系数,天气和光照同从属于环境复杂度,在计算得到天气的测试值、光照的测试值后,利用天气的测试值、光照的测试值及其各自对应的权重系数进行加权计算,得到环境复杂度的测试值。
61.s204、直到通过n个级别的度量元中每个一级度量元的权重系数,对相应一级度量元的测试值进行加权求和处理,得到量化评估指标的指标评估值。
62.每个一级度量元具有各自对应的权重系数,在计算得到各个一级度量元的测试值后,利用各一级度量元的测试值及对应的权重系数进行加权计算,得到量化评估指标的指标评估值,用于指示待评估神经网络的鲁棒性。
63.综上所述,为每个i级度量元、n级度量元的标签配置相应的权重系数,并将权重系数参与指标评估值的计算,提高指标评估值的计算精度,即提高待评估神经网络鲁棒性的评估准确度。各级度量元的权重系数、n级度量元的标签的权重系数,可通过层次分析等方法进行合理的定量分析,并结合定性讨论的方式进行确定。
64.在一个或多个实施例中,基于至少一个测试数据集对待评估神经网络进行测试,得到n级度量元的标签分别对应的测试值之后,神经网络的鲁棒性评估方法还包括如下步骤(s301~s304)。
65.s301、针对每个n级度量元的标签,统计相应n级度量元的标签对应的测试数据集中测试样本的数量。
66.每个n级度量元的标签对应有测试数据集,每个测试数据集中包括有若干个测试样本,测试样本用于对待评估神经网络进行测试。
67.s302、计算相应n级度量元的标签中测试样本的数量,占同属性标签中测试样本的总数量的第一概率分布比。
68.同属性标签包括相应n级度量元的标签,且同属性标签从属于同一个n级度量元。计算测试数据集中测试样本的数量占同属性标签中测试样本总数的比,得到第一概率分布比。举例来说,n级度量元的标签包括雪天、雨天、晴天、白天、黑夜和黄昏,其中雪天、雨天和晴天是同属性标签,均从属于同一个n级度量元(天气);白天、黑夜和黄昏是同属性标签,均从属于同一个n级度量元(光照)。计算雪天、雨天和晴天分别对应的测试数据集中测试样本占同属性总测试样本的数量,得到各自对应的第一概率分布比;计算白天、黑夜和黄昏分别对应的测试数据集中测试样本占同属性总测试样本的数量,得到各自对应的第一概率分布比。
69.s303、获取第二概率分布比。第二概率分布比是指在实际场景中,相应n级度量元的标签出现的概率。例如,通过历史天气记录,统计某地夏季晴天的概率。
70.s304、基于第一概率分布比和第二概率分布比,修正相应n级度量元的标签的测试值,得到修正后的测试值,修正后的测试值用于进行层次分析计算。
71.比较第一概率分布比和第二概率分布比,如果第一概率分布比和第二概率分布比不相等,则说明测试数据集中测试样本的数量不适当,使用该测试数据集对待评估神经网络进行测试所得到的测试值也不适当,需对测试值进行修正,得到修正后的测试值,利用修正后的测试值进行层次分析计算,得到量化评估指标的指标评估值,以提高对待评估神经网络鲁棒性的评估准确度。例如,在第一概率分布比与第二概率分布比不相等的情况下,可对对应的测试值减分或加分处理。
72.示例性地,量化评估值包括准确率,且90%至100%的准确率对应的分值为10分,80%至90%的准确率对应的分值为9分,70%至80%的准确率对应的分值为8分,假设利用某一标签对应的测试数据集对待评估神经网络进行测试得到的测试值为95%,若该标签对应的测试数据集中的测试样本数量占同属性标签中测试样本总数量,等于该标签实际出现的概率,则该标签的测试值为10分;若该标签对应的测试数据集中的测试样本数量占同属性标签中测试样本总数量,小于该标签实际出现的概率,则该标签的测试值为9分。
73.需要说明的是,为避免对计算结果准确度造成干扰,在生成测试数据集时,可以确保各个n级度量元的各标签在同属性标签中的第一概率分布比与第二概率分布比相等。
74.实施例2
75.本实施例提供了一种神经网络的鲁棒性评估装置,该装置可以为计算机设备,也可以设置在计算机设备中。如图3所示,该装置包括:构建模块201、第一获取模块202、测试模块203和第一计算模块204。
76.构建模块201,用于基于待评估神经网络的应用任务,构建鲁棒性评估模型,所述鲁棒性评估模型包括量化评估指标以及n个级别的度量元;其中,所述n个级别的度量元中i-1级度量元包括至少一个i级度量元,所述i级度量元从属于所述i-1级度量元,所述n个级
别的度量元中的一级度量元从属于所述量化评估指标,所述n为大于或等于2的正整数,所述i为小于或等于所述n的正整数;详细内容请参见实施例1中的相关描述,此处不再赘述。
77.第一获取模块202,用于获取至少一个测试数据集,所述测试数据集与所述n个级别的度量元中n级度量元的标签一一对应;详细内容请参见实施例1中的相关描述,此处不再赘述。
78.测试模块203,用于基于所述至少一个测试数据集对所述待评估神经网络进行测试,得到所述n级度量元的标签分别对应的测试值;通过提供被测试神经网络的外部接口,实现被测神经网络的封装和接入,根据与该被测神经网络相对应的鲁棒性评估模型,调用相应测试数据集进行被测对象的运行测试,返回不同数据集下的测试指标。详细内容请参见实施例1中的相关描述,此处不再赘述。
79.第一计算模块204,用于对所述n级度量元的标签分别对应的测试值进行层次分析计算,得到所述量化评估指标的指标评估值,所述指标评估值用于指示所述待评估神经网络的鲁棒性。详细内容请参见实施例1中的相关描述,此处不再赘述。
80.在一个或多个实施例中,第一计算模块204用于通过每个n级度量元的标签的权重系数,对相应n级度量元的标签的测试值进行加权求和处理,得到相应n级度量元的测试值;通过每个n级度量元的权重系数,对相应n级度量元的测试值进行加权求和处理,得到相应n级度量元所从属的n-1级度量元的测试值;通过每个n-1级度量元的权重系数,对相应n-1级度量元的测试值进行加权求和处理,得到相应n-1级度量元所从属的n-2级度量元的测试值;直到通过n个级别的度量元中每个一级度量元的权重系数,对相应一级度量元的测试值进行加权求和处理,得到量化评估指标的指标评估值。详细内容请参见实施例1中的相关描述,此处不再赘述。
81.在一个或多个实施例中,所述装置还包括统计模块(图3中未示出)、第二计算模块(图3中未示出)、第二获取模块(图3中未示出)和修正模块(图3中未示出)。
82.统计模块,用于针对每个n级度量元的标签,统计相应n级度量元的标签对应的测试数据集中测试样本的数量;详细内容请参见实施例1中的相关描述,此处不再赘述。
83.第二计算模块,用于计算相应n级度量元的标签中测试样本的数量,占同属性标签中测试样本的总数量的第一概率分布比,所述同属性标签包括相应n级度量元的标签,且所述同属性标签从属于同一个n级度量元;详细内容请参见实施例1中的相关描述,此处不再赘述。
84.第二获取模块,用于获取第二概率分布比,所述第二概率分布比是指实际场景中相应n级度量元的标签出现的概率;详细内容请参见实施例1中的相关描述,此处不再赘述。
85.修正模块,用于基于所述第一概率分布比和第二概率分布比,修正相应n级度量元的标签的测试值,得到修正后的测试值,所述修正后的测试值用于进行所述层次分析计算。详细内容请参见实施例1中的相关描述,此处不再赘述。
86.在一个或多个实施例中,第一获取模块202还包括:第一获取子模块、和/或第二获取子模块、和/或第三获取子模块(图3中未示出子模块)。
87.第一获取子模块,用于基于仿真环境中采集的仿真数据生成所述测试数据集;第二获取子模块,用于基于实际环境中采集的实际数据生成所述测试数据集;第三获取子模块,用于基于预设规则的网络聚类得到的数据生成所述测试数据集。详细内容请参见实施
例1中的相关描述,此处不再赘述。
88.本实施例深度学习模型的测试装置的效果可参见实施例1中的相关描述,在此不做赘述。
89.实施例3
90.本实施例提供了一种计算机设备,如图4所示,该计算机设备包括处理器301和存储器302,其中处理器301和存储器302可以通过总线或者其他方式连接,图4中以通过总线连接为例。
91.处理器301可以为中央处理器(central processing unit,cpu)。处理器301还可以为其他通用处理器、数字信号处理器(digital signal processor,dsp)、图形处理器(graphics processing unit,gpu)、嵌入式神经网络处理器(neural-network processing unit,npu)或者其他专用的深度学习协处理器、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
92.存储器302作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的神经网络的鲁棒性评估方法对应的程序指令/模块(如上述实施例中的构建模块201、第一获取模块202、测试模块203和第一计算模块204;统计模块、第二计算模块、第二获取模块和修正模4;第一获取子模块、第二获取子模块和第三获取子模块)。处理器301通过运行存储在存储器302中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述的神经网络的鲁棒性评估方法。
93.存储器302可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器301所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器302可选包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至处理器301。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
94.本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的神经网络的鲁棒性评估方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(random access memory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;所述存储介质还可以包括上述种类的存储器的组合。
95.本技术实施例还提供了一种计算机程序产品,当计算机程序产品在计算机设备上运行时,实现实施例1中的鲁棒性评估方法。
96.显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本技术创造的保护范围之中。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表