一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于知识库的官文校对方法、系统、设备及存储介质与流程

2022-11-30 21:53:51 来源:中国专利 TAG:

技术特征:
1.一种基于知识库的官文校对方法,其特征在于,包括:获取实时网络数据,分析所述实时网络数据的热度情况确定网络用语,并构建或更新网络用语知识库;获取目标文本,对所述目标文本进行关键词句划分,遍历每个划分后的关键词句并将其与所述网络用语知识库进行比对,根据所述关键词句与所述网络用语知识库中的网络用语的比对相似度触发对应的用词提醒。2.根据权利要求1所述的基于知识库的官文校对方法,其特征在于,所述实时网络数据包括从目标地址中获取热度达标的网络视频;所述热度为在统计时间段内用户群体对网络视频或网络文本的喜好程度;所述目标地址根据用户设定进行自定义设置。3.根据权利要求2所述的基于知识库的官文校对方法,其特征在于,确定所述网络用语的方法为:获取所述网络视频的流量数据,并结合视频时长计算出所述网络视频的平均流量值;调取出所述网络视频中流量值高于所述平均流量值的视频帧数,解析该视频帧数的音频内容获得其所包含的热度词句,并将其作为一级网络用语存储于所述网络用语知识库中。4.根据权利要求3所述的基于知识库的官文校对方法,其特征在于,获取所述网络视频的流量数据时,还包括:调取出所述网络视频中流量值低于所述平均流量值,且与所述平均流量值之间的流量差值在设定范围内的视频帧数,解析该视频帧数的音频内容获得其所包含的热度词句,并将其作为二级网络用语存储于所述网络用语知识库中。5.根据权利要求4所述的基于知识库的官文校对方法,其特征在于,获取所述网络视频的流量数据时,还包括:计算所述网络用语知识库中每个网络用语的使用频率,并获取所述网络视频的发布时间,根据所述发布时间为所述网络用语知识库中每个网络用语进行加权以计算所述网络用语知识库中每个网络用语的词热度;当任一网络用语的词热度低于热度阈值则将其标记为三级网络用语。6.根据权利要求1所述的基于知识库的官文校对方法,其特征在于,所述实时网络数据还包括由目标网站统计的网络用语,直接获取所述目标网站的网络用语并将其存储于所述网络用语知识库中。7.根据权利要求1所述的基于知识库的官文校对方法,其特征在于,将所述关键词句与所述网络用语知识库进行比对的方法为:将所述关键词句分别与所述网络用语知识库中的网络用语进行比对,若所述关键词句与任一网络用语的比对相似度高于预设阈值,则根据该网络用语的等级触发对应等级的用词提醒,并推送该网络用语所对应的来源信息。8.一种基于知识库的官文校对系统,其特征在于,执行如权利要求1~7任一所述的基于知识库的官文校对方法,所述系统包括:网络服务器,用于获取实时网络数据,分析所述实时网络数据的热度情况确定网络用语,并构建或更新网络用语知识库;校对服务器,用于获取目标文本,对所述目标文本进行关键词句划分,遍历每个划分后
的关键词句并将其与所述网络用语知识库进行比对,根据比对结果触发对应的用词提醒。9.一种电子设备,其特征在于,其包括处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1~7任一所述的基于知识库的官文校对方法。10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被执行时实现权利要求1~7任一所述的基于知识库的官文校对方法。

技术总结
本发明公开了一种基于知识库的官文校对方法、系统、设备及存储介质,所述校对方法包括:获取实时网络数据,分析所述实时网络数据的热度情况确定网络用语,并构建或更新网络用语知识库;获取目标文本,对所述目标文本进行关键词句划分,遍历每个划分后的关键词句并将其与所述网络用语知识库进行比对,根据所述关键词句与所述网络用语知识库中的网络用语的比对相似度触发对应的用词提醒。本发明可实时更新网络用语知识库,将官方文稿中的关键词句与网络用语知识库进行比对,识别出官方文稿中是否存在网络用语,在系统的用词提醒下校对人可准确地对官方文稿进行校对,提高官方文稿的准确性。准确性。准确性。


技术研发人员:林立磐 李伟 刘智国 陈朝晖 陈杰 吴久伟 王镇彬
受保护的技术使用者:广州市省信软件有限公司
技术研发日:2022.11.01
技术公布日:2022/11/29
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献