一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本简洁明晰程度评价方法及相关设备与流程

2021-10-24 10:27:00 来源:中国专利 TAG:例数 明晰 简洁 文本 程度

技术特征:
1.一种文本简洁明晰程度评价方法,其特征在于,所述方法包括:获得预先训练完成的目标文本内容评分模型,所述目标文本内容评分模型由机器学习算法对多组第一训练样本训练得到,且每组所述第一训练样本包括第一训练文本以及所述第一训练文本的标准内容评分;获得预先训练完成的目标文本视觉评分模型,所述目标文本视觉评分模型由机器学习算法对多组第二训练样本训练得到,且每组所述第二训练样本包括训练文本图像以及所述训练文本图像的标准视觉评分;将待评价文本输入至所述目标文本内容评分模型,以得到所述目标文本内容评分模型输出的所述待评价文本的内容评分;将所述待评价文本的文本图像输入至所述目标文本视觉评分模型,以得到所述目标文本视觉评分模型输出的所述待评价文本的视觉评分;根据所述待评价文本的内容评分和视觉评分确定所述待评价文本的简洁明晰程度。2.根据权利要求1所述的方法,其特征在于,所述目标文本内容评分模型的训练步骤包括:获得初始文本内容评分模型;将多组所述第一训练样本输入所述初始文本内容评分模型,以使得所述初始文本内容评分模型提取第一批次的第一训练文本的文本内容特征,根据所述第一训练文本的文本内容特征输出预测内容评分,根据所述预测内容评分与所述标准内容评分之间的差值调整所述初始文本内容评分模型的模型参数,若所述差值未满足收敛条件,则返回执行提取下一批次的第一训练文本的文本内容特征,直至所述差值满足收敛条件时停止训练,得到所述目标文本内容评分模型。3.根据权利要求2所述的方法,其特征在于,所述将待评价文本输入至所述目标文本内容评分模型,以得到所述目标文本内容评分模型输出的所述待评价文本的内容评分,包括:将所述待评价文本输入至所述目标文本内容评分模型,以使所述目标文本内容评分模型执行下述分类步骤:从所述待评价文本中提取所述待评价文本的文本内容特征;根据所述训练步骤获得的文本内容特征与内容评分的函数关系计算所述待评价文本的文本内容特征对应的内容评分,输出所述待评价文本的内容评分。4.根据权利要求3所述的方法,其特征在于,文本内容特征包括句号数量在文本的标点符号总数中的占比、数值型字符数量在文本的总字数中的占比、目录层次与目录标题计数、表格数、形容词数量在文本的实词总数中的占比、定语从句数量、省略的主语数量、简单句数量中的一项或多项,所述简单句为只含有一个主谓结构且句子各成分只由单词或短语构成的独立句子或分句。5.根据权利要求1所述的方法,其特征在于,所述目标文本视觉评分模型的训练步骤包括:获得初始文本视觉评分模型;将多组所述第二训练样本输入所述初始文本视觉评分模型,以使得所述初始文本视觉评分模型提取第一批次的训练文本图像的文本视觉特征,根据所述训练文本图像的文本视觉特征输出预测视觉评分,根据所述预测视觉评分与所述标准视觉评分之间的差值调整所
述初始文本视觉评分模型的模型参数,若所述差值未满足收敛条件,则返回执行提取下一批次的训练文本图像的文本视觉特征,直至所述差值满足收敛条件时停止训练,得到所述目标文本视觉评分模型。6.根据权利要求5所述的方法,其特征在于,所述将所述待评价文本的文本图像输入至所述目标文本视觉评分模型,以得到所述目标文本视觉评分模型输出的所述待评价文本的视觉评分,包括:将所述待评价文本的文本图像输入至所述目标文本视觉评分模型,以使所述目标文本视觉评分模型执行下述分类步骤:从所述待评价文本的文本图像中提取所述待评价文本的文本视觉特征;根据所述训练步骤获得的文本视觉特征与视觉评分的函数关系计算所述待评价文本的文本视觉特征对应的视觉评分,输出所述待评价文本的视觉评分。7.根据权利要求6所述的方法,其特征在于,文本视觉特征包括段落文字长度、是否设置项目编号、粗体字数量在文本的总字数中的占比、行距和字号、扫描文件数量、文字阅读方向中的一项或多项。8.一种计算机设备,其特征在于,所述计算机设备包括:获取单元,用于获得预先训练完成的目标文本内容评分模型,所述目标文本内容评分模型由机器学习算法对多组第一训练样本训练得到,且每组所述第一训练样本包括第一训练文本以及所述第一训练文本的标准内容评分;所述获取单元还用于获得预先训练完成的目标文本视觉评分模型,所述目标文本视觉评分模型由机器学习算法对多组第二训练样本训练得到,且每组所述第二训练样本包括训练文本图像以及所述训练文本图像的标准视觉评分;内容评分单元,用于将待评价文本输入至所述目标文本内容评分模型,以得到所述目标文本内容评分模型输出的所述待评价文本的内容评分;视觉评分单元,用于将所述待评价文本的文本图像输入至所述目标文本视觉评分模型,以得到所述目标文本视觉评分模型输出的所述待评价文本的视觉评分;评价单元,用于根据所述待评价文本的内容评分和视觉评分确定所述待评价文本的简洁明晰程度。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法。10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有指令,所述指令在计算机上执行时,使得所述计算机执行如权利要求1至7中任一项所述的方法。

技术总结
本申请实施例公开了一种文本简洁明晰程度评价方法及相关设备,将待评价文本分别输入至预先训练完成的目标文本内容评分模型以及目标文本视觉评分模型,从而目标文本内容评分模型对待评价文本的文本内容进行识别和计算,得到待评价文本的内容评分,目标文本视觉评分模型对待评价文本的文本图像进行识别和计算,得到待评价文本的视觉评分,综合内容评分和视觉评分确定待评价文本的简洁明晰程度,实现了基于内容维度和视觉维度对文本的简洁明晰程度的综合评价,实现了对文本简洁明晰程度的量化,使得文本简洁明晰程度的评价不会受到人员知识水平和阅读习惯等主观因素的影响,使得文本简洁明晰程度的评价标准实现统一,评价结果更加客观。更加客观。更加客观。


技术研发人员:毛瑞彬 朱菁 杨雯雯 邓永翠 潘斌强 张大千 尚东东 孙德旺 张俊 杨建明
受保护的技术使用者:深圳证券信息有限公司
技术研发日:2021.07.21
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜