音频采集传输装置、音频处理系统以及音频采集传输方法与流程

2021-10-02 09:05:00 来源：中国专利 TAG：

本发明涉及音频采集传输领域，具体而言，涉及一种音频采集传输装置、音频处理系统以及音频采集传输方法。

背景技术

随着科技的发展，各种录音设备层出不穷。除了新闻采访、会议记录或者演讲场合等常规应用场景，能够进行语音处理的智能化语音处理机器也被应用于各种商业场景(例如销售场景)。

目前，根据语音处理机器内的麦克风的数量，可以将语音处理机器分为两种：

第一种是具有一个主麦克风、一个降噪麦克风的双麦克风的语音处理机器，通过声音信息到达两个麦克风的相差去除噪音并保留人声，但是在使用中语音处理机器相对于人嘴的位置不定，常常会将人声误处理，而使得拾取人声的效果不好；

第二种是具有四个麦克风的语音处理机器，通过四个麦克风的时延自动追踪音源，使得使用者无论对准语音处理机器的哪个方位说话，都可以跟踪拾取，但是在比较复杂的场景，如火车站、户外景点、人流量大或者许多人说话的情况下，声源来源非常嘈杂，声音拾取受到不同方向、不同音量的声音干扰，经常出现定位方向错乱，在拾取过程中如果出现更大的音量声源，拾取方向自动切过去，而真正的音源声音被过滤掉，拾取声音的音源不对。

由于目前市场上的语音处理机器存在上述的问题，在具体使用时会给后续的分析、处理带来不便。

技术实现要素：

本发明的主要目的在于提供一种音频采集传输装置、音频处理系统以及音频采集传输方法，以解决相关技术中的语音处理机器使用时会给后续的分析、处理带来不便的问题。

为了实现上述目的，根据本发明的一个方面，提供了一种音频采集传输装置，包括：音频采集设备，包括壳体、音频采集单元以及音频分离单元，音频采集单元和音频分离单元均设置在壳体内，其中，音频采集单元用于采集音频数据，音频分离单元用于将音频采集单元采集到的音频数据中的第一人声和第二人声进行分离；音频传输设备，与音频采集设备分体设置，音频传输设备和音频采集设备数据连接，音频传输设备用于获取分离后的音频数据并传输分离后的音频数据至外部设备。

应用本发明的技术方案，音频采集传输装置包括数据连接的音频采集设备和音频传输设备。其中，音频采集设备包括壳体以及设置在壳体内的音频采集单元和音频分离单元，音频采集单元和音频分离单元数据连接。音频采集单元能够收录附近的声音(包括环境音、佩戴音频采集设备的人员的声音以及与之对话的人员的声音)，音频分离单元能够将音频采集单元采集到的声音中的第一人声(佩戴音频采集设备的人员的声音，比如销售人员)和第二人声(与佩戴音频采集设备的人员进行对话的人员的声音，比如客户)分离出来。音频传输设备通过与音频采集设备的数据连接获取上述的第一人声和第二人声并将它们传输至对应的服务器中。音频采集设备和音频传输设备分体设置，音频采集设备体积小，携带方便。需要录音时仅需要佩戴音频采集设备即可，同时音频采集设备能够将采集到的音频数据中的第一人声和第二人声进行分离，无需后期再对采集到的音频数据进行复杂的处理即可获取到第一人声和第二人声。音频采集设备完成原始音频数据(即音频采集单元采集到的、未经处理的音频数据)采集以及进行分离处理得到分离后的音频数据之后，与音频传输设备数据连接，即可将分离后的第一人声和第二人声传输至外部设备，比如对应的服务器中，进行后续的处理以及分析。因此，本申请的技术方案能够有效地解决相关技术中的语音处理机器使用时会给后续的分析、处理带来不便的问题。

进一步地，音频采集设备还包括设置在壳体上的便携固定结构。上述结构使得佩戴者在使用音频采集设备进行录音时，能保证音频采集设备处于与用户嘴部相对固定的位置。同时，便携固定结构为易拆卸结构，方便用户在不损坏自身衣物的前提下进行固定或取下；当佩戴者完成音频数据的采集之后，也能够很方便地将音频采集设备取下进行后续的数据传输以及充电等操作。

进一步地，便携固定结构包括头戴结构、挂绳、别针、磁扣、粘胶或者夹子。

进一步地，壳体包括铭牌结构，音频采集设备还包括设置在壳体的正面的信息标识区，铭牌结构设置于所述信息标识区。信息标识区能够向与佩戴者沟通的沟通者展示佩戴者的身份、公司标识、职务等信息。

进一步地，铭牌结构包括显示屏或者显示贴片。

进一步地，音频采集单元包括麦克风，麦克风设置于壳体。

进一步地，麦克风为多个，壳体包括正面、背面以及位于正面和背面之间的侧面，多个麦克风设置在正面和/或侧面上。上述的多个已知位置关系的麦克风能够同时收录对话双方(佩戴者和与佩戴者对话的沟通者，其中沟通者可以为一个或者多个)声音以及环境的声音。由于麦克风收录到的多种声音的音源位置相较于每个麦克风不同，因此各个麦克风采集到的音频数据会有差异，同一声源发出的声音到达不同麦克风的时间不同，强度不同，因此可以针对采集到的数据进行时域/频域的运算和对比，来判断出不同声源相对麦克风的位置方向。

进一步地，侧面包括顶面，至少一个麦克风设置在顶面上。

进一步地，侧面还包括左侧面、右侧面以及底面，正面设置有至少两个麦克风，或者，侧面的顶面以外的位置设置有至少两个麦克风，或者，左侧面和右侧面设置有至少两个麦克风，或者，底面设置有至少一个麦克风。

进一步地，正面设置有至少两个麦克风。

进一步地，侧面包括左侧面以及右侧面，左侧面设置有至少一个麦克风，右侧面设置有至少一个麦克风。

进一步地，音频采集设备与音频传输设备之间通过数据线连接，或者直接插接连接，或者通过无线连接。音频采集设备与音频传输设备通过上述方式实现数据连接，能够将音频采集设备采集并分离的音频数据传输至音频传输设备并进行后续的处理。

进一步地，音频采集设备上设置有用于控制音频采集单元开启和关闭的开关结构，开关结构设置于壳体。开关结构能够便于佩戴者切换音频采集单元的开关状态，从而避免采集到佩戴者非工作状态时的隐私语音数据，以及有利于降低音频采集设备的耗电量，提升音频采集设备的使用时长。

进一步地，开关结构包括机械开关或者电子开关。

进一步地，音频采集设备还包括设置在壳体内的第一数据传输单元，第一数据传输单元与音频分离单元数据连接，第一数据传输单元用于传输分离后的音频数据。上述结构能够实现分离后的音频数据的传输，便于后续对音频数据进行进一步处理。

进一步地，音频采集设备还包括设置在壳体内的第一存储单元，第一存储单元与音频采集单元、音频分离单元以及第一数据传输单元数据连接，第一存储单元用于存储分离后的音频数据。

进一步地，音频传输设备包括：数据接收单元，用于接收分离后的音频数据；数据处理单元，与数据接收单元数据连接，数据处理单元用于对分离后的音频数据进行处理；第二数据传输单元，与数据处理单元数据连接，第二数据传输单元用于将分离后的音频数据或处理后的音频数据传输至外部设备。

进一步地，音频传输设备还包括第二存储单元，第二存储单元与数据接收单元、数据处理单元以及第二数据传输单元数据连接，第二存储单元用于存储数据接收单元接收到分离后的音频数据以及数据处理单元处理后的音频数据。

进一步地，音频传输设备还包括用于为音频采集设备充电的充电单元。充电单元能够给音频采集设备充电，数据传输和充电可同时进行，这样提升了效率。

根据本发明的另一方面，提供了一种音频处理系统，包括音频采集传输装置以及用于接收音频采集传输装置的音频数据的服务器，音频采集传输装置为上述的音频采集传输装置。上述的音频采集传输装置具有使用便捷、佩戴方便的优点，同时，可以在完成声音的采集之后就将收录的对话双方的声音进行分离，避免后期进行处理、分析操作复杂，能够有效地解决相关技术中的语音处理机器使用时会给后续的分析、处理带来不便的问题。因此，具有上述的音频采集传输装置的音频处理系统也具有上述的优点。同时，服务器能够存储大量的音频采集传输装置所收集、处理、传输的音频数据，便于后续对上述的音频数据进行分析。

根据本发明的另一方面，提供了一种音频采集传输方法，包括：获取音频数据；将音频数据中的第一人声和第二人声进行分离，并将分离后的音频数据分别进行存储；传输分离后的音频数据。

应用本发明的技术方案，先获取音频数据，然后直接对获取到的原始音频数据进行处理，抑制原始音频数据中的噪音(包括环境音等非目标声音)并分离出原始音频数据中的第一人声和第二人声，然后将分离出的第一人声和第二人声分别进行存储，并将上述分离后的第一人声和第二人声传输至相应的设备中(即上述的音频传输设备)。如果在获取到音频数据之后直接传输，之后再进行目标声音的提取以及分离，这样整个过程中需要传输的数据会更多，同时后续的操作会更加复杂。在获取到原始音频数据的之后直接进行第一人声和第二人声的分离操作，这样操作简单便捷。

进一步地，在传输分离后的音频数据之前还包括：对分离后的音频数据进行数据处理。

进一步地，数据处理包括数据压缩、数据加密、音频文件合并以及音频文件切块中的至少一种。

进一步地，音频采集传输方法还包括：在获取音频数据的同时获取时间标签，时间标签用于记录音频数据的获取时间。

进一步地，将音频数据中的第一人声和第二人声进行分离之后，通过无线通讯或者有线通讯方式传输分离后的音频数据。

进一步地，通过音频采集设备获取音频数据以及将音频数据中的第一人声和第二人声进行分离，通过音频采集设备将分离后的音频数据传输至与音频采集设备分体设置的音频传输设备中，通过音频传输设备传输分离后的音频数据。

进一步地，通过音频传输设备为音频采集设备充电。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了根据本发明的音频采集传输装置的实施例的立体结构示意图；

图2示出了图1的音频传输设备的立体结构示意图；

图3示出了根据本发明的音频传输设备的另一实施例的立体结构示意图；

图4示出了图1的音频采集设备的立体结构示意图；

图5示出了图4的音频采集设备的便携固定结构为别针的实施例的立体结构示意图；

图6示出了图4的音频采集设备的便携固定结构为磁扣的实施例的立体结构示意图；

图7示出了图4的音频采集设备的便携固定结构为蝴蝶扣的实施例的立体结构示意图；

图8示出了图4的音频采集设备的便携固定结构为夹子的实施例的立体结构示意图；

图9示出了图4的音频采集设备的顶面设置一个麦克风、左侧面设置两个麦克风的实施例的立体结构示意图；

图10示出了图4的音频采集设备的正面四个麦克风的实施例的立体结构示意图；

图11示出了图4的音频采集设备的顶面设置一个麦克风、正面四个麦克风的实施例的立体结构示意图；

图12示出了图4的音频采集设备的左侧面和右侧面各设置一个麦克风的实施例的立体结构示意图；

图13示出了图4的音频采集设备的左侧面和右侧面各设置两个麦克风的实施例的立体结构示意图；

图14示出了图4的音频采集设备的左侧面和右侧面各设置两个麦克风、顶面设置一个麦克风的实施例的立体结构示意图；

图15示出了根据本发明的音频处理系统的实施例的结构框图；

图16示出了根据本发明的音频采集传输方法的实施例的流程图。

其中，上述附图包括以下附图标记：

100、音频采集设备；110、壳体；111、正面；112、背面；113、侧面；1131、顶面；1132、底面；1133、左侧面；1134、右侧面；120、便携固定结构；130、信息标识区；140、开关结构；151、麦克风；200、音频传输设备。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

相关技术中的语音处理机器可以应用于销售场景，通过语音处理机器记录并分析销售人员与客户之间的对话，进而收集、分析有效话术。然而，进行话术分析时需要分别对销售人员与客户的对话内容进行分析，录音设备录音过程中同时收录了销售人员与客户双方的声音以及环境声音，后期分析时需要对收录的声音进行复杂的处理以分离双方的声音，这样操作复杂。

如图1、图2以及图4至图6所示，本实施例的音频采集传输装置包括：音频采集设备100以及音频传输设备200。其中，音频采集设备100包括壳体110、音频采集单元以及音频分离单元，音频采集单元和音频分离单元均设置在壳体110内，其中，音频采集单元用于采集音频数据，音频分离单元用于将音频采集单元采集到的音频数据中的第一人声和第二人声进行分离；音频传输设备200与音频采集设备100分体设置，音频传输设备200和音频采集设备100数据连接，音频传输设备200用于获取分离后的音频数据并传输分离后的音频数据至外部设备。

应用本实施例的技术方案，音频采集传输装置包括数据连接的音频采集设备100和音频传输设备200。其中，音频采集设备100包括壳体110以及设置在壳体110内的音频采集单元和音频分离单元，音频采集单元和音频分离单元数据连接，音频采集单元能够收录附近的声音(包括环境音、佩戴音频采集设备100的人员的声音以及与之对话的人员的声音)，音频分离单元能够将音频采集单元采集到的声音中的第一人声(佩戴音频采集设备100的人员的声音，比如销售人员)和第二人声(与佩戴音频采集设备100的人员进行对话的人员的声音，比如客户)分离出来。音频传输设备200通过与音频采集设备100的数据连接获取上述的第一人声和第二人声并将它们传输至对应的服务器中。音频采集设备100和音频传输设备200分体设置，音频采集设备100体积小，携带方便。需要录音时仅需要佩戴音频采集设备100即可，同时音频采集设备100能够将采集到的音频数据中的第一人声和第二人声进行分离，无需后期再对采集到的原始音频数据进行复杂的处理即可获取到第一人声和第二人声。音频采集设备100完成音频数据(即音频采集单元采集到的、未经处理的音频数据)采集以及进行分离处理得到分离后的音频数据之后，与音频传输设备200数据连接，即可将分离后的第一人声和第二人声传输至外部设备，比如对应的服务器中，进行后续的处理以及分析。因此，本实施例的技术方案能够有效地解决相关技术中的语音处理机器使用时会给后续的分析、处理带来不便的问题。

需要说明的是，上述的数据连接是指两个装置或者结构之间能够进行数据传输。例如，音频传输设备200和音频采集设备100数据连接是指，音频传输设备200和音频采集设备100之间能够进行数据传输。

本实施例的音频采集设备在使用时可以直接佩戴在使用者的身上，包括头部、手臂上、衣服上以及腰间等部位。如图5至图8所示，在一些实施方式中，音频采集设备100还包括设置在壳体110上的便携固定结构120。音频采集设备100能够通过便携固定结构120固定在佩戴者身上，例如可以通过便携固定结构120将音频采集设备100固定在佩戴者的衣物上。上述结构使得佩戴者在使用音频采集设备100进行录音时，能保证音频采集设备100处于与用户嘴部相对固定的位置。佩戴者无需长时间手持音频采集设备100，使用方便。同时，便携固定结构120为易拆卸结构，方便用户在不损坏自身衣物的前提下进行佩戴或取下；当佩戴者完成音频数据的采集之后，也能够很方便地将音频采集设备100取下进行后续的数据传输以及充电等操作。

具体地，如图5至图8所示，便携固定结构120包括头戴结构、挂绳、别针、磁扣、粘胶或者夹子。上述结构中，便携固定结构120可以包括多种形式，在具体使用时，可以根据使用场景、佩戴者衣服等灵活选择音频采集设备100的佩戴位置和佩戴方式。

具体地，便携固定结构120包括头戴结构，其具体结构与耳麦类似，这样的结构便于对佩戴者的声音进行采集。便携固定结构120还可以为挂绳，将音频采集设备100挂在佩戴者身上。

如图4和图5所示，便携固定结构120也可以为别针，采用别针将音频采集设备100别在佩戴者的衣物上能够提升音频采集设备100的固定稳定性。上述的别针可以为传统的别针(如图4以及图5所示)，这样可以将音频采集设备100像胸牌一样固定在佩戴者的衣服上，固定效果好，结构简单。别针也可以为蝴蝶扣别针(如图7所示)，通过捏紧或者松开蝴蝶扣别针的两个卡簧即可实现音频采集设备100的佩戴以及取下，操作简单。

另外，便携固定结构120还可以为磁扣结构(如图6所示)，具体地，磁扣结构包括与音频采集设备100固定连接的固定部以及与固定部磁吸配合的配合部，佩戴时，将配合部设置在佩戴者衣服的内部并与佩戴者衣服外部的固定部磁吸配合，这样不会损伤衣服，同时结构简单。

便携固定结构120还可以为夹子(如图8所示)，具体地，佩戴时直接将其夹在衣服上，不会损伤佩戴者的衣物，能够提升佩戴者的使用体验。

当然，在图中未示出的其他实施例中，便携固定结构也可以包括上述结构中的多种。

如图9至图14所示，在一些实施方式中，壳体110包括铭牌结构，音频采集设备100还包括设置在壳体110的正面111的信息标识区130，铭牌结构设置于信息标识区130，铭牌结构与壳体110一体设置或者分体设置。壳体110具有正面111、背面112以及设置在正面111和背面112之间的侧面113。其中，正面111为远离佩戴者、朝向与佩戴者进行对话的人员(例如客户)的一面，背面112为靠近佩戴者的一面。铭牌结构能够向与佩戴者沟通的沟通者展示佩戴者的身份、公司标识、职务等信息。

如图9至图14所示，在一些实施方式中，铭牌结构包括显示屏或者显示贴片。显示屏与壳体一体化设置，显示屏为电子显示屏，可以为LED显示屏、LCD显示屏、OLED显示屏、墨水屏等，显示屏上的信息易于调整、更改，能够适用于多种应用场景。显示贴片与壳体分体设置，壳体上还包括与显示贴片相配合的辅助固定件，显示贴片可以为纸质或金属的贴片，辅助固定件可以为透明夹层或者磁性件。显示贴片能够插入至信息标识区130上的透明夹层内或者粘贴至信息标识区130；显示贴片也可以为磁吸贴片，与信息标识区130上的磁性件相配合。当然，在其他可行的实施方式中，信息标识区上也可以粘贴亚克力板、或者直接在信息标识区进行激光雕刻等用以展示佩戴者的身份信息。具体使用时，可以根据实际情况选择上述各种信息标识方式中的一种。

如图9至图14所示，在一些实施方式中，音频采集单元包括麦克风151，麦克风151设置于壳体110。麦克风151能够采集声音信号并将声音信号转化为电信号进行存储、传输。具体地，麦克风151为多个，壳体110包括正面111、背面112以及位于正面111和背面112之间的侧面113，多个麦克风151设置在正面111上，或者麦克风151设置在侧面113上，或者麦克风151同时设置在正面111以及侧面113上。设置多个麦克风151，多个麦克风151之间的位置关系是固定的，上述的多个已知位置关系的麦克风151能够同时收录对话双方(佩戴者和与佩戴者对话的沟通者，其中沟通者可以为一个或者多个)声音(即上述的第一人声和第二人声)以及环境的声音。由于麦克风151收录到的多种声音的音源位置相较于每个麦克风151不同，因此各个麦克风151采集到的音频数据会有差异，同一声源发出的声音到达不同麦克风151的时间不同，强度不同，因此可以针对采集到的数据进行时域/频域的运算和对比，来判断出不同声源相对麦克风151的位置方向。然后根据已知的佩戴位置确认各个方向的声源(第一人声、第二人声以及环境声)，并分离出第一人声和第二人声，然后分别存储上述分离出的第一人声和第二人声，从而达到分离出佩戴者声音(第一人声)和与佩戴者沟通的沟通者声音(第二人声)并且抑制噪音(环境音)的目的。

具体地，如图4所示，侧面113包括顶面1131。当壳体110外轮廓为多边形(例如矩形)时，上述的顶面1131是指壳体110的侧面113上位于最上端的平面。当壳体110的外轮廓为圆形或者椭圆形等形状时，上述的顶面1131是指经过壳体110的中心的水平面上方的壳体110的侧面113的部分。至少一个麦克风151设置在顶面1131上，这样能够便于收录到佩戴者的声音。

如图4至图7所示，在一些实施方式中，壳体110的外轮廓为矩形，侧面113还包括左侧面1133、右侧面1134以及底面1132。其中，底面1132为与顶面1131相对的平面，左侧面1133为以沟通者的视角所看到的侧面113左边的平面，右侧面1134为以沟通者的视角所看到的侧面113右边的平面。具体地，麦克风151可以通过下述方式进行排列：

1)顶面1131设置有至少一个麦克风151，正面111设置有至少两个麦克风151，在图11示出的实施方式中，正面111设置有四个麦克风151，顶面1131设置有一个麦克风151；

2)顶面1131设置有至少一个麦克风151，侧面113的顶面1131以外的位置设置有至少两个麦克风151，在图9示出的实施方式中，左侧面1133设置有两个麦克风151，顶面1131设置有一个麦克风151；

3)顶面1131设置有至少一个麦克风151，左侧面1133和右侧面1134设置有至少两个麦克风151，在图14示出的实施方式中，顶面1131设置有一个麦克风151，左侧面1133和右侧面1134(图中未示出)分别设置有两个麦克风151；

4)在图中未示出的实施方式中，顶面设置有至少一个麦克风，底面设置有至少一个麦克风；

5)正面111设置有至少两个麦克风151，在图10示出的实施方式中，正面111设置有四个麦克风151；

6)左侧面1133设置有至少一个麦克风151，右侧面1134设置有至少一个麦克风151，在图12示出的实施方式中，左侧面1133和右侧面1134各设置有一个麦克风151；在图13示出的实施方式中，左侧面1133和右侧面1134各设置有两个麦克风151。

音频采集设备100与音频传输设备200之间通过数据线连接，或者直接插接连接，或者通过无线连接。音频采集设备100与音频传输设备200通过上述方式实现数据连接，能够将音频采集设备100采集并分离的音频数据传输至音频传输设备200并进行后续的处理。

如图4、图6和图8所示，在一些实施方式中，音频采集设备100上设置有用于控制音频采集单元开启和关闭的开关结构140，开关结构140设置于壳体110。上述结构中，开关结构140能够便于佩戴者切换音频采集单元的开关状态，从而有利于降低音频采集设备100的耗电量，提升音频采集设备100的使用时长。具体地，当佩戴者与沟通者进行对话时，佩戴者可以启动音频采集单元，从而对双方的音频信息进行记录。当佩戴者与沟通者结束对话时，佩戴者可以关闭音频采集单元，从而降低音频采集设备100的耗电量。

开关结构140包括机械开关或者电子开关。具体地，机械开关可以包括弹片开关、拨片开关、磁控开关等，机械开关的生产成本较低，有利于降低音频采集传输装置的整体生产成本。电子开关可以包括触摸开关、声控开关、压力感应开关、手势控制开关或运动控制开关等，电子开关能够提升佩戴者的使用体验。

在一些实施方式中，音频采集设备100还包括设置在壳体110内的第一数据传输单元，第一数据传输单元与音频分离单元数据连接，第一数据传输单元用于传输分离后的音频数据。上述结构中，音频采集设备100内设置有音频采集单元、音频分离单元以及第一数据传输单元，音频采集单元与音频分离单元数据连接，音频分离单元能够将音频采集单元采集的原始音频数据中的第一人声和第二人声进行分离，第一数据传输单元与音频分离单元数据连接，第一数据传输单元能够将分离后的第一人声和第二人声传输到音频传输设备200中。上述结构能够实现音频数据的传输，便于后续对音频数据进行进一步处理。

在一些实施方式中，音频采集设备100还包括设置在壳体110内的第一存储单元，第一存储单元与音频采集单元、音频分离单元以及第一数据传输单元数据连接，第一存储单元用于存储音频采集单元采集的原始音频数据以及分离后的音频数据。音频采集单元采集的原始音频数据经过音频分离单元处理，将原始音频数据中的第一人声和第二人声分离出来之后，第一人声和第二人声分别存储至第一存储单元中。当音频采集设备100与音频传输设备200数据连接时，第一数据传输单元能够将第一存储单元内存储的第一人声和第二人声传输至音频传输设备200中。

在一些实施方式中，分离后的第一人声和第二人声先存储在音频采集设备中然后经由音频传输设备传输至对应的服务器中。当然，在其他可行的实施方式中，分离后的第一人声和第二人声也可以直接由音频采集设备传输至对应的服务器中。

在一些实施例中，音频采集设备100还包括音频处理单元，音频处理单元可以对原始音频数据以及分离后的音频数据进行数据处理，该数据处理包括但不限于数据压缩、音频文件合并以及数据加密中的至少一种。

在一些实施方式中，音频传输设备200包括：数据接收单元、数据处理单元以及第二数据传输单元。其中，数据接收单元用于接收分离后的音频数据；数据处理单元与数据接收单元数据连接，数据处理单元用于对分离后的音频数据进行处理；第二数据传输单元与数据处理单元数据连接，第二数据传输单元用于将分离后的音频数据与处理后的音频数据传输至外部设备。上述结构中，音频采集设备100能够对音频数据进行采集和分离，并通过第一数据传输单元将分离好的音频数据传输给数据接收单元，数据接收单元将分离好的音频数据传输给数据处理单元，通过数据处理单元进行处理后由第二数据传输单元传输至外部设备，上述结构完成了音频数据的处理和传输，便于外部设备对音频数据进行进一步处理。在一些实施方式中，数据接收单元可包括多个数据连接端口，可同时与多个音频采集设备100连接，接收多个音频采集设备100分离后的音频数据，提升了数据传输效率。

在一些实施方式中，音频传输设备200还包括第二存储单元，第二存储单元与数据接收单元、数据处理单元以及第二数据传输单元数据连接，第二存储单元用于存储数据接收单元接收到的分离后的音频数据。上述结构中，第二存储单元能够存储数据接收单元接收到的分离后的音频数据以及数据处理单元处理后的音频数据，第二存储单元还能够与第二数据传输单元数据连接，便于将分离后的音频数据或者数据处理后的音频数据(即数据处理单元处理后的音频数据)传输至外部设备(服务器)中。

在一些实施方式中，音频传输设备200还包括用于为音频采集设备100充电的充电单元。充电单元能够给音频采集设备100充电，数据传输和充电可同时进行，这样提升了效率。

如图1和图15所示，本申请还提供了一种音频处理系统，其中，图1示出了音频处理系统的实施例的音频采集传输装置的立体结构示意图。音频处理系统包括音频采集传输装置以及用于接收音频采集传输装置的音频数据的服务器，其中，音频采集传输装置为上述的音频采集传输装置。上述的音频采集传输装置具有使用便捷、佩戴方便的优点，同时，可以在完成声音的采集之后就将收录的对话双方的声音进行分离，避免后期进行处理、分析操作复杂，能够有效地解决相关技术中的语音处理机器使用时会给后续的分析、处理带来不便的问题。因此，具有上述的音频采集传输装置的音频处理系统也具有上述的优点。同时，服务器能够存储大量的音频采集传输装置所收集、处理、传输的音频数据，便于后续对上述的音频数据进行分析。

如图2所示，音频采集传输装置的音频传输设备200可以为插槽式，音频传输设备200上阵列设置有多个容纳音频采集设备100的容纳槽，音频采集设备100完成音频数据的采集之后，可以插入至音频传输设备200上的容纳槽中进行数据传输以及为音频采集设备100进行充电。这样方便对音频采集设备100进行收纳，避免数据连接可能拉扯数据线等情况的发生。

如图3所示，音频采集传输装置的音频传输设备200可以与音频采集设备100通过USB进行数据连接，这样音频传输设备200占据空间较小。

如图16所示，本申请还提供了一种音频采集传输方法，根据本申请的音频采集传输方法的实施例包括：获取音频数据；将音频数据中的第一人声和第二人声进行分离，并将分离后的音频数据分别进行存储；传输分离后的音频数据。

应用本实施例的技术方案，先获取音频数据，然后直接对获取到的原始音频数据进行处理，抑制原始音频数据中的噪音(包括环境音等非目标声音)并分离出原始音频数据中的第一人声和第二人声，然后将分离出的第一人声和第二人声分别进行存储，并将上述分离后的第一人声和第二人声传输至相应的设备中(即上述的音频传输设备200)。如果在获取到音频数据之后直接传输，之后再进行目标声音的提取以及分离，这样整个过程中需要传输的数据会更多，同时后续的操作会更加复杂。在获取到原始音频数据的之后直接进行第一人声和第二人声的分离操作，这样操作简单便捷。

在一些实施方式中，通过音频采集设备100获取音频数据以及将音频数据中的第一人声和第二人声进行分离，通过音频采集设备100将分离后的音频数据传输至与音频采集设备100分体设置的音频传输设备200中，通过音频传输设备200传输分离后的音频数据。音频采集设备100和音频传输设备200分体设置，音频采集设备100体积小，携带方便。需要录音时仅需要佩戴音频采集设备100即可，同时音频采集设备100能够将采集到的原始音频数据中的第一人声和第二人声进行分离，无需后期再对采集到的原始音频数据进行复杂的处理即可获取到第一人声和第二人声。音频采集设备100完成原始音频数据采集以及进行分离处理得到分离后的音频数据之后，与音频传输设备200数据连接，即可将分离后的第一人声和第二人声传输至对应的服务器中进行后续的处理以及分析。

此外，还可以通过音频传输设备200为音频采集设备100充电。这样，可以在将音频采集设备100采集到的原始音频数据传输至音频传输设备200的同时，通过音频传输设备200为音频采集设备100充电，方便快捷。

在传输分离后的音频数据之前还包括：对分离后的音频数据进行数据处理。具体地，上述的数据处理包括数据压缩、数据加密、音频文件合并以及音频文件切块中的至少一种。在传输上述分离后的音频数据之前对分离后的音频数据进行数据压缩，能够在不丢失有用信息的情况下，缩减数据的数量以减少对存储空间的占用，提高后续的传输、存储以及处理效率。在传输上述处理后的音频数据之前对分离后的音频数据进行数据加密，利用密码技术对上述的音频数据进行加密，能够起到保护数据安全的作用。具体地，可以根据实际情况选择上述的数据处理方法中的一种或者多种。

本实施例的音频采集传输方法还包括：在获取音频数据的同时获取时间标签，时间标签用于记录音频数据的获取时间。通过上述的时间标签获取音频数据的具体采集时间，这样便于进行后续的分析。

本实施例的音频采集传输方法还包括：将音频数据中的第一人声和第二人声进行分离之后，通过无线通讯或者有线通讯方式传输分离后的音频数据。具体地，可以通过数据线连接，或者直接插接连接，或者通过无线连接，实现音频采集设备100与音频传输设备200之间的数据连接。

在本发明的描述中，需要理解的是，方位词如“前、后、上、下、左、右”、“横向、竖向、垂直、水平”和“顶、底”等所指示的方位或位置关系通常是基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，在未作相反说明的情况下，这些方位词并不指示和暗示所指的装置或元件必须具有特定的方位或者以特定的方位构造和操作，因此不能理解为对本发明保护范围的限制；方位词“内、外”是指相对于各部件本身的轮廓的内外。

为了便于描述，在这里可以使用空间相对术语，如“在……之上”、“在……上方”、“在……上表面”、“上面的”等，用来描述如在图中所示的一个器件或特征与其他器件或特征的空间位置关系。应当理解的是，空间相对术语旨在包含除了器件在图中所描述的方位之外的在使用或操作中的不同方位。例如，如果附图中的器件被倒置，则描述为“在其他器件或构造上方”或“在其他器件或构造之上”的器件之后将被定位为“在其他器件或构造下方”或“在其他器件或构造之下”。因而，示例性术语“在……上方”可以包括“在……上方”和“在……下方”两种方位。该器件也可以其他不同方式定位(旋转90度或处于其他方位)，并且对这里所使用的空间相对描述作出相应解释。

此外，需要说明的是，使用“第一”、“第二”等词语来限定零部件，仅仅是为了便于对相应零部件进行区别，如没有另行声明，上述词语并没有特殊含义，因此不能理解为对本发明保护范围的限制。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音合成方法、装置、设备及存储介质与流程

音频采集传输装置、音频处理系统以及音频采集传输方法与流程

相关文章

最热文献