一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于强化学习的测试数据生成方法及装置与流程

2022-09-01 00:21:36 来源:中国专利 TAG:

技术特征:
1.一种基于强化学习的测试数据生成方法,其特征在于,所述方法包括:根据预设数据规则生成输入数据,所述预设数据规则为银行金融系统数据规则;将所述输入数据输入预设强化学习模型进行训练直至测试覆盖率达到预设阈值;确定测试覆盖率达到预设阈值时的最大q值,所述q值为预设强化学习模型的状态动作网络参数,所述状态动作网络参数用于表征按照指定策略执行目标操作后得到的奖惩值之和;输出所述最大q值对应的目标操作链;以及根据所述目标操作链确定目标测试数据。2.根据权利要求1所述的方法,其特征在于,所述将所述输入数据输入预设强化学习模型进行训练直至测试覆盖率达到预设阈值包括:通过测试插件收集测试评估信息,所述测试评估信息包括测试数据覆盖程序行数、测试数据覆盖分支数、依赖系统操作次数和生成输入数据次数;根据所述测试评估信息和预设权重参数确定奖惩表;根据所述奖惩表和预设计算公式确定q值,以生成q表;以及更新q表直至测试覆盖率达到预设阈值。3.根据权利要求2所述的方法,其特征在于,所述根据所述测试评估信息和预设权重参数确定奖惩表包括:根据所述测试评估信息和预设权重参数确定奖惩值,所述奖惩值为软件程序系统在目标状态描述下执行目标操作后能够获得的奖惩值;以及根据多个所述奖惩值生成所述奖惩表。4.根据权利要求2所述的方法,其特征在于,所述根据所述奖惩表和预设计算公式确定q值,以生成q表包括:根据当前时刻的奖惩值、预设奖励性衰系数和下一时刻的最大奖惩值确定q值;根据q值的时间差分法更新公式更新q值,以生成q表。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述目标测试数据为能够覆盖测试程序全部分支的测试案例集。6.根据权利要求5所述的方法,所述目标操作包括对数据库的新增、查询、删除和更改操作。7.一种基于强化学习的测试数据生成装置,其特征在于,所述装置包括:输入数据生成模块,用于根据预设数据规则生成输入数据,所述预设数据规则为银行金融系统数据规则;模型训练模块,用于将所述输入数据输入预设强化学习模型进行训练直至测试覆盖率达到预设阈值;第一确定模块,用于确定测试覆盖率达到预设阈值时的最大q值,所述q值为预设强化学习模型的状态动作网络参数,所述状态动作网络参数用于表征按照指定策略执行目标操作后得到的奖惩值之和;输出模块,用于输出所述最大q值对应的目标操作链;以及第二确定模块,用于根据所述目标操作链确定目标测试数据。8.一种电子设备,包括:
一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~6中任一项所述的方法。9.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~6中任一项所述的方法。10.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~6中任一项所述的方法。

技术总结
本公开提供了一种基于强化学习的测试数据生成方法,可以应用于人工智能技术领域。该方法包括:根据预设数据规则生成输入数据,所述预设数据规则为银行金融系统数据规则;将所述输入数据输入预设强化学习模型进行训练直至测试覆盖率达到预设阈值;确定测试覆盖率达到预设阈值时的最大Q值,所述Q值为预设强化学习模型的状态动作网络参数,所述状态动作网络参数用于表征按照指定策略执行目标操作后得到的奖惩值之和;输出所述最大Q值对应的目标操作链;以及根据所述目标操作链确定目标测试数据。本公开还提供了一种基于强化学习的测试数据生成装置、设备、存储介质和程序产品。存储介质和程序产品。存储介质和程序产品。


技术研发人员:林芝峰 罗秉安 沈思思 廖俊宇
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:2022.06.30
技术公布日:2022/8/30
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献