一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

旋转文字检测方法和装置与流程

2022-11-19 16:04:37 来源:中国专利 TAG:

技术特征:
1.一种旋转文字检测方法,包括:获取含有文字图形样本区的图形样本数据;根据对所述文字图形样本区的标注,得到所述文字图形样本区的标签信息,所述标签信息包括关联于所述文字图形样本区的文字区域框标签值和归一化角度标签值,其中,所述归一化角度标签值表征所述文字图形样本区相对于所述图形样本数据的坐标横轴的倾斜角度;将所述图形样本数据输入待训练的目标检测模型,通过所述待训练的目标检测模型得到关联于所述文字图形样本区的文字区域框预测值和归一化角度预测值;根据所述文字区域框预测值和所述文字区域框标签值得到文字区域框回归损失,根据所述归一化角度预测值和所述归一化角度标签值得到角度归一化回归损失;根据所述文字区域框回归损失和所述角度归一化回归损失,得到关联于所述文字图形样本区的整体回归损失;根据所述整体回归损失,调整所述待训练的目标检测模型,得到训练后的目标检测模型;基于所述训练后的目标检测模型对待检测图形数据进行检测,得到关联于所述待检测图形数据中的文字图形区的文字区域检测框。2.根据权利要求1所述的旋转文字检测方法,其特征在于:所述文字区域框标签值包括所述文字图形样本区的中心点的归一化坐标值、所述文字图形样本区的归一化宽度值、所述文字图形样本区的归一化高度值;所述归一化角度标签值通过下式获得:其中,为所述归一化角度标签值,为所述文字图形样本区相对于所述图形样本数据的坐标横轴的倾斜角度,。3.根据权利要求1所述的旋转文字检测方法,其特征在于:所述文字区域框预测值包括所述文字图形样本区的中心点在所述图形样本数据中的归一化坐标预测值、所述文字图形样本区的归一化宽度预测值、所述文字图形样本区的归一化高度预测值。4.根据权利要求1所述的旋转文字检测方法,其特征在于:所述文字区域框回归损失为广义交叉联合giou损失函数;所述角度归一化回归损失为光滑平均绝对值误差smooth l1损失函数。5.根据权利要求1所述的旋转文字检测方法,其特征在于,所述根据所述文字区域框回归损失和所述角度归一化回归损失,得到关联于所述文字图形样本区的整体回归损失,包括:将所述文字区域框回归损失和所述角度归一化回归损失相加,得到所述整体回归损失。6.根据权利要求1所述的旋转文字检测方法,其特征在于,所述基于所述训练后的目标检测模型对待检测图形数据进行检测,得到关联于所述待检测图形数据中的文字图形区的
文字区域检测框,包括:将所述待检测图形数据输入所述训练后的目标检测模型,通过所述训练后的目标检测模型得到所述文字图形区的文字区域框检测值和角度归一化检测值;根据所述角度归一化检测值,得到角度值;根据所述文字区域框检测值和所述角度值,得到所述文字区域检测框。7.根据权利要求6所述的旋转文字检测方法,其特征在于:所述文字区域框检测值包括所述文字区域检测框的中心点的归一化坐标值、所述文字区域检测框的归一化宽度值、所述文字区域检测框的归一化高度值。8.根据权利要求6所述的旋转文字检测方法,其特征在于,所述根据所述角度归一化检测值,得到角度值,包括采用下式获得所述角度值:其中,为所述角度归一化检测值,为所述角度值。9.根据权利要求6所述的旋转文字检测方法,其特征在于,所述根据所述文字区域框检测值和所述角度值,得到所述文字区域检测框,包括:根据所述文字区域框检测值,得到所述文字区域检测框的中心点在所述待检测图形数据中的位置、以及所述文字区域检测框的宽度和高度;根据所述角度值,得到所述文字区域检测框相对于所述待检测图形数据的坐标横轴的倾斜角度;根据所述文字区域检测框的中心点在所述待检测图形数据中的位置、所述文字区域检测框的宽度和高度、所述文字区域检测框相对于所述待检测图形数据的坐标横轴的倾斜角度,得到所述文字区域检测框。10.根据权利要求1所述的旋转文字检测方法,其特征在于,在得到所述文字区域检测框后,所述旋转文字检测方法进一步包括:将所述文字区域检测框呈现于所述待检测图形数据。11.一种旋转文字检测装置,其特征在于,包括:图形样本数据获取模块,被配置为执行获取含有文字图形样本区的图形样本数据;标签信息获得模块,被配置为执行根据对所述文字图形样本区的标注,得到所述文字图形样本区的标签信息,所述标签信息包括关联于所述文字图形样本区的文字区域框标签值和归一化角度标签值,其中,所述归一化角度标签值表征所述文字图形样本区相对于所述图形样本数据的坐标横轴的倾斜角度;预测值获得模块,被配置为执行将所述图形样本数据输入待训练的目标检测模型,通过所述待训练的目标检测模型得到关联于所述文字图形样本区的文字区域框预测值和归一化角度预测值;区域框及角度回归损失获得模块,被配置为执行根据所述文字区域框预测值和所述文字区域框标签值得到文字区域框回归损失,根据所述归一化角度预测值和所述归一化角度标签值得到角度归一化回归损失;整体回归损失获得模块,被配置为执行根据所述文字区域框回归损失和所述角度归一化回归损失,得到关联于所述文字图形样本区的整体回归损失;
模型训练模块,被配置为执行根据所述整体回归损失,调整所述待训练的目标检测模型,得到训练后的目标检测模型;图形检测模块,被配置为执行基于所述训练后的目标检测模型对待检测图形数据进行检测,得到关联于所述待检测图形数据中的文字图形区的文字区域检测框。12.一种电子设备,其特征在于,包括:处理器;用于存储所述处理器的可执行指令的存储器;其中,所述处理器被配置为执行所述可执行指令,以实现如权利要求1至10任一项所述的旋转文字检测方法。13.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的至少一条指令被电子设备的处理器执行时,使得所述电子设备能够实现如权利要求1至10任一项所述的旋转文字检测方法。

技术总结
本公开涉及一种旋转文字检测方法和装置,该方法包括:获取图形样本数据,根据对其中文字图形样本区的标注,得到文字区域框标签值和归一化角度标签值;将图形样本数据输入目标检测模型,得到文字区域框预测值和归一化角度预测值,进而得到文字区域框回归损失和角度归一化回归损失;根据文字区域框回归损失和角度归一化回归损失,得到整体回归损失;根据整体回归损失,调整目标检测模型,得到训练后的目标检测模型;基于训练后的目标检测模型对待检测图形数据进行检测,得到文字区域检测框。本公开中,文字区域框回归损失和角度归一化回归损失各自独立,不影响文字区域框的回归精度,实现了对图形数据中的各种旋转角度文字的端到端的准确检测。端的准确检测。端的准确检测。


技术研发人员:张存义 艾国 杨作兴
受保护的技术使用者:深圳比特微电子科技有限公司
技术研发日:2022.10.08
技术公布日:2022/11/18
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献