一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种视频处理方法、装置、电子设备和存储介质与流程

2021-10-24 06:33:00 来源:中国专利 TAG:电子设备 计算机应用 装置 视频处理 实施

技术特征:
1.一种视频处理方法,其特征在于,所述方法包括:根据视频记录的音频信息确定至少一个说话人的发言信息;根据各所述发言信息确定所述视频记录的交谈频率;基于阈值频率和各所述交谈频率在所述视频记录中确定重要事件记录。2.根据权利要求1所述的方法,其特征在于,所述根据视频记录的音频信息确定至少一个说话人的发言信息,包括:提取所述视频记录中的音频信息;将所述音频信息输入到预设音频识别模型以确定所述音频信息中各每帧音频数据对应的所述说话人;按照所述每帧音频数据与所述说话人的对应关系确定各所述说话人至少一段发言的发言起始时间和发言结束时间作为发言信息。3.根据权利要求2所述的方法,其特征在于,所述预设音频识别模型至少包括speaker

diarization模型、隐马尔可夫模型、支持向量机模型、深度神经网络模型中至少一种。4.根据权利要求2所述的方法,其特征在于,所述根据各所述发言信息确定所述视频记录的交谈频率,包括:提取各所述发言信息中的发言起始时间和发言结束时间;按照预设时间长度将所述视频记录划分为至少一个时间窗口;针对各所述时间窗口,统计发言起始时间和发言结束时间均位于所述时间窗口的发言的数量作为交谈频率。5.根据权利要求1至4任意一项所述的方法,其特征在于,还包括:过滤持续时间大于或等于过滤时长的发言。6.根据权利要求4所述的方法,其特征在于,所述基于阈值频率和各所述交谈频率在所述视频记录中确定重要事件记录,包括:将各所述交谈频率按照对应时间窗口的时间信息排列生成频率曲线;按照所述阈值频率将所述频率曲线进行频率二值化,其中,大于或等于阈值频率的频率曲线的取值置为1,小于阈值频率的频率曲线的取值置为0;根据所述频率二值化后的频率曲线划分所述视频记录以获取重要事件记录。7.根据权利要求6所述的方法,其特征在于,所述根据所述频率二值化后的频率曲线划分所述视频记录以获取重要事件记录,包括:将频率曲线中交谈频率取值置为1的至少一个连续线段对应的视频记录作为事件记录;针对各所述事件记录,合并时间差值小于或等于谈话暂停时间的事件记录;将各所述事件记录中持续时间小于谈话持续时间的事件记录清除后分别作为重要事件记录。8.一种视频处理装置,其特征在于,所述装置包括:发言确定模块,用于根据视频记录的音频信息确定至少一个说话人的发言信息;频率确定模块,用于根据各所述发言信息确定所述视频记录的交谈频率;事件获取模块,用于基于阈值频率和各所述交谈频率在所述视频记录中确定重要事件记录。
9.一种电子设备,其特征在于,所述电子设备包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1

7中任一所述的视频处理方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1

7中任一所述的视频处理方法。

技术总结
本发明公开了一种视频处理方法、装置、电子设备和存储介质,该方法包括:根据视频记录的音频信息确定至少一个说话人的发言信息;根据各所述发言信息确定所述视频记录的交谈频率;基于阈值频率和各所述交谈频率在所述视频记录中确定重要事件记录。本发明实施例通过音频信息实现数据视频记录的自动化处理,提高了重要内容的识别率,可提高视频记录的利用率。可提高视频记录的利用率。可提高视频记录的利用率。


技术研发人员:姚广 苏仲岳 徐麟 闫正
受保护的技术使用者:上海眼控科技股份有限公司
技术研发日:2021.07.14
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜