一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

编程语句纠错方法、装置、电子设备及存储介质与流程

2021-10-29 23:22:00 来源:中国专利 TAG:纠错 语句 编程 计算机 电子设备

技术特征:
1.一种编程语句纠错方法,其特征在于,包括:对用户输入的编程语句进行查询,并确定所述编程语句是否正确;当确定所述编程语句正确时,将所述编程语句采集至预训练样本集中;建立预训练模型,并基于所述预训练样本集对所述预训练模型进行训练;当确定所述编程语句错误时,将所述编程语句以及与所述编程语句对应的正确的编程语句采集至纠错样本集中;建立纠错模型,并基于所述纠错样本集和经训练的所述预训练模型对所述纠错模型进行训练;通过经训练的所述纠错模型对用户输入的错误的编程语句进行纠错。2.如权利要求1所述的编程语句纠错方法,其特征在于,当确定所述编程语句正确时,还将所述编程语句的元信息采集至所述预训练样本集中;以及当确定所述编程语句错误时,还将所述编程语句的报错信息和元信息采集至所述纠错样本集中。3.如权利要求1所述的编程语句纠错方法,其特征在于,所述当确定所述编程语句正确时,将所述编程语句采集至预训练样本集中,包括:确定所述编程语句与前一编程语句的相似度,并确定所述相似度是否小于预设的阈值;当所述相似度大于或等于所述预设的阈值时,将所述编程语句采集至预训练样本集中。4.如权利要求3所述的编程语句纠错方法,其特征在于,所述方法还包括:当所述相似度小于所述预设的阈值时,确定所述前一编程语句为正确的编程语句或错误的编程语句;当所述前一编程语句为错误的编程语句时,将所述编程语句采集至预训练样本集中,并且还将所述编程语句采集至所述纠错样本集中。5.如权利要求2所述的编程语句纠错方法,其特征在于,所述方法还包括:对所述编程语句、所述报错信息或所述元信息进行分词处理,得到多个token;对所述多个token进行分类处理,得到属于保留关键词类别的多个token和属于自定义变量类别的多个token;将编程语句、所述报错信息或所述元信息的多个token转换为独热编码,其中,将属于保留关键词类别的多个token转换为预定的多个独热编码,将属于自定义变量类别的多个token转换为对应的独热编码段中的各相应的独热编码。6.如权利要求5所述的编程语句纠错方法,其特征在于,所述基于所述预训练样本集对所述预训练模型进行训练,包括:对所述编程语句的属于自定义变量类别的多个token中的至少一个token进行掩码处理,并使所述预训练模型对经掩码处理的所述至少一个token进行还原。7.如权利要求6所述的编程语句纠错方法,其特征在于,所述至少一个token为彼此相邻的多个token。8.如权利要求6所述的编程语句纠错方法,其特征在于,所述方法还包括:通过所述预训练样本集对所述预训练模型输入正确的编程语句的元信息;
所述基于所述纠错样本集和经训练的所述预训练模型对所述纠错模型进行训练,包括:通过所述纠错样本集对所述纠错模型输入所述错误的编程语句以及所述错误的编程语句的报错信息和元信息;基于经训练的所述预训练模型以及所述错误的编程语句的报错信息和元信息,使所述纠错模型对所述错误的编程语句进行纠错处理,其中,所述纠错处理包括对所述错误的编程语句的token进行保留或删除,或者在所述错误的编程语句中插入token。9.一种编程语句纠错装置,其特征在于,包括:查询模块,用于对用户输入的编程语句进行查询,并确定所述编程语句是否正确;采集模块,用于当确定所述编程语句正确时,将所述编程语句采集至预训练样本集中;以及当确定所述编程语句错误时,将所述编程语句以及与所述编程语句对应的正确的编程语句采集至纠错样本集中;预训练模块,用于建立预训练模型,并基于所述预训练样本集对所述预训练模型进行训练;以及纠错模块,用于建立纠错模型,并基于所述纠错样本集和经训练的所述预训练模型对所述纠错模型进行训练,其中,经训练的所述纠错模型用于对用户输入的错误的编程语句进行纠错。10.一种电子设备,其特征在于,包括:存储器;以及耦合到所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1

8任一项所述的编程语句纠错方法。11.一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如权利要求1

8任一项所述的编程语句纠错方法。

技术总结
本公开提供一种编程语句纠错方法、编程语句纠错装置、电子设备及计算机可读存储介质;涉及计算机技术领域。该编程语句纠错方法包括:对用户输入的编程语句进行查询,并确定所述编程语句是否正确;当确定编程语句正确时,将所述编程语句采集至预训练样本集中;建立预训练模型,并基于预训练样本集对预训练模型进行训练;当确定编程语句错误时,将所述编程语句以及与所述编程语句对应的正确的编程语句采集至纠错样本集中;建立纠错模型,并基于纠错样本集和经训练的预训练模型对纠错模型进行训练;通过经训练的纠错模型对用户输入的错误的编程语句进行纠错。本公开可以克服SQL语句调试效率低下的问题,并同时对用户提供有效的纠错辅助手段。的纠错辅助手段。的纠错辅助手段。


技术研发人员:冯睿东 胡志鹏 程龙 刘勇成 袁思思
受保护的技术使用者:网易(杭州)网络有限公司
技术研发日:2021.08.04
技术公布日:2021/10/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜