一种远程会议系统及多麦克风语音识别播放方法与流程

2022-03-30 10:37:44 来源：中国专利 TAG：

1.本发明涉及远程会议技术领域，具体涉及一种远程会议系统及多麦克风语音识别播放方法。

背景技术：

2.随着通信技术的发展，远程会议的应用越来越普遍。远程会议中发言人的视频展示和语音播放是影响会议效果的两大关键因素。现有的远程会议系统存在以下缺陷：
3.第一，远程会议系统通常使用全向麦收音，以满足参会人员发言的需要。然而，当会议现场空间较大，参加人数较多时，由于参会人员距离全向麦的距离不同，距离较远的发言人，全向麦获取到的语言信号较小，由此造成发言声音小、不清晰，不能很好地展示每个发言人的演讲语音。
4.第二，当远程会议参加人数较多时，很难分辨出当前发言人。
5.有鉴于此，需要对现有的远程会议系统进行改进，以使每个发言人都能够清晰地展示演讲语音，并且能够标识出当前发言人。

技术实现要素：

6.针对上述缺陷，本发明所要解决的技术问题在于提供一种远程会议系统及多麦克风语音识别播放方法，以解决现有技术采用全向麦不能很好地展示每个发言人的演讲语音的问题。
7.为此，本发明提供的一种远程会议系统的多麦克风语音信号识别播放方法，包括以下步骤：
8.在签到机上创建签到表，所述签到表中的每条记录包括参会人员的参会人员id和对应的人脸特征；
9.每个参会人员在所述签到机签到，分别领取各自的随身无线麦克风，并将各随身无线麦克风的麦克风id与对应的参会人员id绑定在所述签到表中；
10.各随身无线麦克风与签到机通信，在远程会议期间，签到机实时获取每一个随身无线麦克风的语音信号，会场摄像头实时采集会场视频；
11.签到机根据收到的语音信号，获得麦克风id，并将与该麦克风id对应的随身无线麦克风的语音信号发送给会议机播放；同时，根据该麦克风id，利用签到表获得参会人员id和人脸特征，再根据参会人员的人脸特征，在会场视频中识别出当前发言人，聚焦该当前发言人并进行标识。
12.在上述方法中，优选地，所述会议机具有第一屏幕和第二屏幕，所述第一屏幕用于展示会议视频，所述第二屏幕用于展示会议记录。
13.在上述方法中，优选地，
14.所述签到表的每条记录还包括参会人员姓名；
15.会议机将收到的语音信号转换为文字形成发言记录，展示在所述第二屏幕上，且
根据识别获得的当前发言人员，将发言人员的姓名添加在相应的发言记录前。
16.在上述方法中，优选地，根据识别获得的当前发言人，裁剪会场视频获得发言人视频，将该发言视频展示在所述第一屏幕上。
17.在上述方法中，优选地，在所述第一屏幕上展示最近n个当前发言人的剪裁画面，n大于等于1，且小于等于参会人数。
18.本发明还提供了一种远程会议系统，远程会议的发起端和参加端至少一端设有：
19.签到机，其上创建有签到表，所述签到表中的每条记录包括参会人员的参会人员id和对应的人脸特征；
20.多个随身无线麦克风，具有麦克风id，各随身无线麦克风id与对应的参会人员id绑定在所述签到表中；
21.会场摄像头，在远程会议期间，所述会场摄像头实时采集会场视频，所述签到机实时获取每一个随身无线麦克风的语音信号；
22.会议机，所述签到机根据收到的语音信号，获得麦克风id，并将与该麦克风id对应的随身无线麦克风的语音信号发送给会议机播放；同时，所述签到机根据该麦克风id，利用签到表获得参会人员id和人脸特征发送给所述会议机，所述会议机根据参会人员的人脸特征，在会场视频中识别出当前发言人，聚焦该当前发言人并进行标识。
23.在上述系统中，优选地，所述会议机具有第一屏幕和第二屏幕，所述第一屏幕用于展示会议视频，所述第二屏幕用于展示会议记录。
24.在上述系统中，优选地，
25.所述签到表的每条记录还包括参会人员姓名；
26.所述会议机上设有语音转换模块，所述语音转换模块将收到的语音信号转换为文字形成发言记录，展示在所述第二屏幕上，且根据识别获得的当前发言人员，将发言人员的姓名添加在相应的发言记录前。
27.在上述系统中，优选地，所述会议机上还设有视频裁剪模块，根据识别获得的当前发言人，裁剪会场视频获得发言人视频，将该发言视频展示在所述第一屏幕上。
28.在上述系统中，优选地，随身无线麦克风与签到机之间采用uhf频段进行通信，每个随身无线麦克风的频段各不相同，会前分别与接收器进行配对，接收器连接到签到机上，签到机根据接收器相应uhf频段收到语音信号，识别出麦克风id。
29.由上述技术方案可知，本发明提供的远程会议系统及多麦克风语音信号识别播放方法，解决了现有技术中发言人语音不清晰，不能清楚地展示当前发言人的问题。与现有技术相比，本发明具有以下有益效果：
30.在会议签到时建立参会人员id、人脸特征并绑定随身无线麦克风，会议期间，签到机实时获取每一个随身无线麦克风的语音信号，并识别出麦克风id，将与该麦克风id对应的随身无线麦克风的语音信号发送给会议机播放；同时，通过麦克风id获得发言人员的人脸特征发送给会议机，会议机根据人脸特征，在会场视频中识别出当前发言人，聚焦该当前发言人并进行标识。一方面，当前发言人员对应的随身无线麦克风的语音信号发送给会议机播放，远程会议中每个发言人的语音都非常清晰；另一方面，能够标识出当前发言人，提高了会议效果。
附图说明
31.为了更清楚地说明本发明的实施例或现有技术中的技术方案，下面将对本发明实施例或现有技术描述中所需要使用的附图做出简单地介绍和说明。显而易见地，下面描述中的附图仅仅是本发明的部分实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
32.图1为本发明提供的远程会议系统的多麦克风语音信号识别播放方法流程图；
33.图2为本发明中对发言标识的示图；
34.图3为本发明中视频画面与会议记录同步显示的示意图。
具体实施方式
35.下面将结合本发明实施例附图，对本发明实施例的技术方案进行清楚、完整地描述，显然，以下所描述的实施例，仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动的前提下，所获得的所有其他实施例，都属于本发明保护的范围。
36.为了对本发明的技术方案和实现方式做出更清楚地解释和说明，以下介绍实现本发明技术方案的几个优选的具体实施例。
37.需要说明的是，本文中“内、外”、“前、后”及“左、右”等方位词是以产品使用状态为基准对象进行的表述，显然，相应方位词的使用对本方案的保护范围并非构成限制。
38.请参见图1，图1为本发明提供的远程会议系统的多麦克风语音信号识别播放方法流程图。
39.如图1所示，本发明提供的一种远程会议系统的多麦克风语音信号识别播放方法，包括以下步骤：
40.步骤110，在签到机上创建签到表，其中，签到表中的每条记录包括参会人员的参会人员id和对应的人脸特征。其中，人脸特征可以在会前存入，也可以在签到时现场采集得到，优选在签到时现场拍照采集。
41.步骤120，每个参会人员在参加远程会议时，首先在签到机上进行签到，签到时分别领取一个随身无线麦克风，每个随身无线麦克风都具有一个唯一的麦克风id，并将麦克风id与对应的参会人员id绑定在签到表中。这样，每个参会人员都与自己的随身无线麦克风进行了绑定。
42.步骤130，在远程会议期间，随身无线麦克风通过无线方式与签到机通信，实时获取每一个随身无线麦克风的语音信号；会场摄像头实时采集会场视频。
43.其中，随身无线麦克风与签到机之间采用uhf频段(430.00-440.00mhz)进行通信。具体地，每个随身无线麦克风的频段各不相同，会前分别与接收器进行配对，接收器连接到签到机上，以确保各随身无线麦克风之间不产生信号干扰，减少噪音，提高语音质量。
44.步骤140，签到机根据接收器相应uhf频段收到语音信号，获得对应的随身无线麦克风的麦克风id，将与该麦克风id对应的随身无线麦克风的语音信号发送给会议机播放；同时，根据该麦克风id，利用签到表获得参会人员id和人脸特征，再根据参会人员的人脸特征，在会场视频中识别出当前发言人，聚焦该当前发言人并进行标识。如图2所示。
45.其中，签到机与会议机可采用有线方式连接通信，例如签到机通过有线方式将随
身无线麦克风的语音信号发送给会议机。对当前发言人进行标识可采用矩形框框选、箭头指引、指引线等形式。
46.在上述方法的基础上，本发明进一步提供了自动会议记录功能，不仅能实现传统的语音转文字会议记录，还能够自动地添加发言人，方便了会议记录整理，提高了工作效率。具体方法如下：
47.会议机具有第一屏幕和第二屏幕，第一屏幕用于展示会议视频，第二屏幕用于展示会议记录。签到表中的每条记录还包括参会人员姓名，会议机将收到的语音信号转换为文字形成发言记录，展示在第二屏幕上，且根据识别获得的当前发言人员，将发言人员的姓名添加在相应的发言记录前。如图3所示。
48.其中，第二屏幕可采用屏幕扩展的方式实现，例如采用hdmi线缆连接扩展屏幕。
49.由于会场摄像头通常会采集整个会场视频，发言人在会场视频中图像较小，为此，本发明根据识别获得的当前发言人，裁剪会场视频获得发言人视频，将该发言视频展示在第一屏幕上。这样，可以在主屏幕上显示当前发言人的图像，能够更清晰地展示当前发言人。其中，发言人视频通常仅包含发言人自己，一般的作法是预设矩形裁剪框，将会场视频放大，使发言人最大化地位于矩形裁剪框内，并将矩形裁剪框中的内容作为主屏幕布视频输出。视频裁剪技术为本领域的公知技术，在视频剪辑软件中大量使用，在此不做过多的介绍。
50.本发明方法中，在第一屏幕上展示最近n个当前发言人的剪裁画面，n大于等于1，且小于等于参会人数。通常情况下不超过四个发言人，主要用于会议讨论场景。
51.在上述方法的基础上，本发明还提供了一种远程会议系统，远程会议的发起端和参加端至少一端设有签到机10、多个随身无线麦克风20、会场摄像头30和会议机40。
52.签到机10上设有签到表，签到表中的每条记录包括参会人员的参会人员id和对应的人脸特征，每个随身无线麦克风具有唯一的麦克风id，各随身无线麦克风id与对应的参会人员id绑定在签到表中。
53.在远程会议期间，会场摄像头30实时采集会场视频，签到机10实时获取每一个随身无线麦克风20的语音信号。签到机10根据收到的语音信号，获得麦克风id，并将与该麦克风id对应的随身无线麦克风20的语音信号发送给会议机40播放；同时，签到机10根据该麦克风id，利用签到表获得参会人员id和人脸特征发送给会议机40，会议机40根据参会人员的人脸特征，在会场视频中识别出当前发言人，聚焦该当前发言人并进行标识。
54.进一步地，会议机具有第一屏幕和第二屏幕，第一屏幕用于展示会议视频，第二屏幕用于展示会议记录。签到表的每条记录还包括参会人员姓名，会议机上设有语音转换模块，语音转换模块将收到的语音信号转换为文字形成发言记录，展示在第二屏幕上，且根据识别获得的当前发言人员，将发言人员的姓名添加在相应的发言记录前。
55.会议机40上还设有视频裁剪模块，根据识别获得的当前发言人，裁剪会场视频获得发言人视频，将该发言视频展示在所述第一屏幕上。
56.综合以上具体实施例的描述，本发明提供的远程会议系统及多麦克风语音识别播放方法，与现有技术相比，具有如下优点：
57.第一，在会议签到时建立参会人员id、人脸特征并绑定随身无线麦克风，会议期间，签到机实时获取每一个随身无线麦克风的语音信号，并识别出麦克风id，将与该麦克风
id对应的随身无线麦克风的语音信号发送给会议机播放；同时，通过麦克风id获得发言人员的人脸特征发送给会议机，会议机根据人脸特征，在会场视频中识别出当前发言人，聚焦该当前发言人并进行标识。一方面，当前发言人员对应的随身无线麦克风的语音信号发送给会议机播放，远程会议中每个发言人的语音都非常清晰；另一方面，能够标识出当前发言人，提高了会议效果。
58.第二，随身无线麦克风与签到机之间采用uhf频段进行通信，每个随身无线麦克风的频段各不相同，会前分别与接收器进行配对，接收器连接到签到机上，根据接收器相应uhf频段收到语音信号，获得对应的随身无线麦克风的麦克风id，各随身无线麦克风之间不产生信号干扰，减少噪音，提高语音质量。
59.第三，根据识别获得的当前发言人员，将发言人员的姓名自动添加在相应的发言记录前，方便了会议记录整理，提高了工作效率。
60.最后，还需要说明的是，在本文中使用的术语"包括"、"包含"或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句"包括一个
…
"限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
61.本发明并不局限于上述最佳实施方式，任何人应该得知在本发明的启示下做出的结构变化，凡是与本发明具有相同或相近的技术方案，均落入本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：密钥管理和业务处理方法、装置及系统与流程

一种远程会议系统及多麦克风语音识别播放方法与流程

相关文献

最热文献