一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于BART模型的正则表达式描述生成方法与流程

2021-10-20 00:33:00 来源:中国专利 TAG:

技术特征:
encoding)学习位置关系向量position embedding,通过学习分段编码(segment encoding)学习相邻两个句子的语义关系向量segment embedding,将三个学习的向量相加得到最终代码片段的特征向量x,即表示为:特征向量x=position embedding segment embedding word embedding。6.根据权利要求1所述的基于bart模型的正则表达式描述生成方法,其特征在于,所述步骤(4)中在softmax函数之后加入beam search束搜索算法,搜索算法在预测的每一步保留top

k高概率的词作为下一次的输入,其中k是beam size表示束宽,第一个时间步长,选取当前条件概率最大的k个词,当做候选输出序列的第一个词,之后的每个时间步长,基于上个步长的输出序列,挑选出所有组合中条件概率最大的k个,作为该时间步长下的候选输出序列,始终保持k个候选,最后从k个候选中挑出最优的。7.根据权要求1中所述的基于bart模型的正则表达式描述生成方法,其特征在于,所述步骤(4)中对bart模型微调时,将处理后的数据集按照8:1:1的比例成训练集、验证集和测试集。

技术总结
本发明提供了一种基于BART模型的正则表达式描述生成方法,包括以下步骤:(1)搜集高质量的正则表达式,对正则表达式人工标注对应的自然语言描述,针对数据进行预处理;(2)将分词输入嵌入层生成最终的特征向量X;(3)改进BART模型。本发明的有益效果为:该方法对输入的正则表达式生成高质量的自然语言描述,从而帮助计算机科学初学者以及开发人员更加快速的理解正则表达式。解正则表达式。解正则表达式。


技术研发人员:于池 陈翔 杨光 刘珂
受保护的技术使用者:南通大学
技术研发日:2021.04.21
技术公布日:2021/10/19
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜