一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于Bert模型的大数据自动测试方法与流程

2022-04-27 07:17:43 来源:中国专利 TAG:

技术特征:
1.一种基于bert模型的大数据自动测试方法,其特征在于,该方法包括如下内容:步骤1,构建大数据自动测试系统,该系统包含测试集模块x、预处理模块y,其中测试集模块x包含自动标注系统a、bert模型标注系统b,测试集模块x给使用者提供随机测试集,随机测试集来源分别由自动标注系统a和bert模型标注系统b生成;自动标注系统a是已有的大数据语料库标注系统,通过收集的大量真实语料进行标注,构建出了一个大数据库,根据需要测试的模型类型,自动标注系统a随机出一定规模的测试集提供验证;bert模型标注系统b是基于训练成熟的bert模型,将少量的语料测试集通过固有的随机屏蔽方法,生成大量相似度可调整的模拟测试集;将训练成熟的bert模型运用到测试集生成过程,具体为:bert模型从真实语料中,随机的抽取15%的token作为即将参与mask的对象,这些被选中的token中,数据生成器并不会把他们全部变成[mask],其80%用[mask]标记替换该token;10%用一个随机的单词替换该token;剩下的10%保持该token不变;真实语料测试集p为[p1,p2,
……
pn],根据p调用bert模型生成的测试集q为[q1,q2,
……
qn],其中每一个生成的qi是根据pi生成的集合,如q2=[p21,p22,

p2m],则最终生成的测试集为s为[p1*q1,p1*q2
……
pn*qn];基于bert生成的测试集构建基类,和继承类统一管理,继承自同一个基类的测试集有明确的标识;步骤2,选定测试集后,设定执行时间,系统检测指定时间是否存在资源冲突,如果选定时间段资源已经饱和,则会提醒资源冲突,需要重新选择时间执行;如果设定的执行时间资源空闲时,系统提示设定告警推送方式及配置收件人员信息;步骤3,开始进行测试;步骤4,测试结束后,自动生成测试链接进行推送给收件人,收件人点击链接可以查看测试结果。2.根据权利要求1所述的一种基于bert模型的大数据自动测试方法,其特征在于,所述自动标注系统a的数据选择,支持不同数据类型type、不同数量数据集的混合。3.根据权利要求2所述的一种基于bert模型的大数据自动测试方法,其特征在于,步骤1还包括:对bert模型标注系统b生成的结果进行人工抽检,定期对bert模型进行优化迭代。4.根据权利要求3所述的一种基于bert模型的大数据自动测试方法,其特征在于,步骤1之后,步骤2执行之前还包括通过远程调用大数据自动标注接口启动。5.根据权利要求4所述的一种基于bert模型的大数据自动测试方法,其特征在于,步骤2的告警推送支持邮件、微信、手机短信方式。6.根据权利要求1-5任一项所述的一种基于bert模型的大数据自动测试方法,其特征在于,步骤3测试过程中如果出现异常,根据设定告警推送方式进行告警推送,配置的收件人收到告警后,人工判断后继续执行,或者修复异常后重新执行。7.根据权利要求6所述的一种基于bert模型的大数据自动测试方法,其特征在于,步骤4测试结束后,还可以通过测试结果获取接口进行数据调取集成到其他环境中。8.根据权利要求6所述的一种基于bert模型的大数据自动测试方法,其特征在于,步骤4中收件人根据测试链接可以选择自定义生成测试报告,包括自定义测试报告的格式、数据的统计方式、图表的展现形式,最终生成一份符合要求的测试报告。

技术总结
本发明公开了一种基于Bert模型的大数据自动测试方法,该方法包括步骤1,构建大数据自动测试系统,该系统包含测试集模块X、预处理模块Y,其中测试集模块X包含自动标注系统A、Bert模型标注系统B,测试集模块X给使用者提供随机测试集,随机测试集来源分别由自动标注系统A和Bert模型标注系统B生成;步骤2,选定测试集后,设定执行时间;步骤3,开始进行测试;步骤4,测试结束后,自动生成测试链接进行推送给收件人,收件人点击链接可以查看测试结果。通过采用Bert模型,基于有限的少量实际数据,可以生成大量的初始标注数据,大幅增加业务相关语料库的数量;通过自动化测试系统,实现了大数据领域的自动测试,降低人力成本,提高工作效率。提高工作效率。提高工作效率。


技术研发人员:李敬
受保护的技术使用者:南京行者易智能交通科技有限公司
技术研发日:2021.12.06
技术公布日:2022/4/26
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献