受试者声音中的事件检测的制作方法

2023-02-16 13:19:10 来源：中国专利 TAG：

受试者声音中的事件检测
1.相关申请的交叉引用
2.本技术要求2020年6月18日提交的澳大利亚临时专利申请2020902025的优先权，其内容通过引用并入本文。
技术领域
3.本发明涉及医疗设备，并且更具体地涉及用于通过分析受试者声音的记录来检测特定声音事件的存在的系统、设备和方法，所述特定声音事件例如打鼾声或诸如喘鸣呼吸声。

背景技术：

4.对现有技术的方法、装置或文献的任何引用不应被认为构成它们过去或现在形成公知常识的一部分的任何证据或承认。
5.已知医疗设备包括用于将受试者的声音转换成电信号的换能器，并且还包括各种组件，所述各种组件响应于所述换能器并且协同处理所述受试者声音以生成对呼吸疾病存在的预测。在疾病的症状是诸如打鼾的事件或诸如喘鸣的呼吸声的情况下，如果医疗设备能够被改进使得其能够识别受试者声音的包含事件的片段，例如与背景噪声相反，则将是有利的。被安排成快速识别事件片段的医疗设备将使该设备更有效，因为该设备然后可以被安排成进一步仅处理包含事件的片段并且快速越过记录的其它部分。
6.已知有许多方法来识别受试者声音中的感兴趣的特定事件。
7.例如，一种这样的技术在文献“obstructive sleep apnea screening by integrating snore feature classes.abeyratne u 2013https://www.ncbi.nlm.nih.gov/pubmed/23343563”中描述，另一种技术在文献“dynamics of snoring sounds and its connection with obstructive sleep apnea.a.alencar2013”中描述。
8.这两种技术都需要从受试者的记录中检测打鼾和呼吸声。然而，相对于由换能器捕获的记录的背景噪声水平，打鼾和呼吸声的水平可以非常低。另外，用于检测打鼾的基于音调的技术不能检测没有可辨别音调的呼吸声。
9.情况可能是，与事件相关联的声音相对于背景噪声的信噪比相当低。因此，生产医疗设备以实现这种目的在技术上是困难的。受试者的记录具有非常低的音量水平，并且许多感兴趣的事件被隐藏在背景噪声中。
10.需要一种针对从可能存在大量背景噪声的受试者检测一种或多种类型的感兴趣声音事件的问题的解决方案，其是对当前可用的那些解决方案的改进或至少是有用的替代方案。

技术实现要素：

11.根据本发明的第一方面，提供了一种用于识别来自受试者的声音的数字音频记录
的片段的方法，其中，所述片段包含感兴趣的特定声音事件，所述方法包括：
12.基于所述声音事件的特性频率范围对所述数字音频记录进行滤波以产生经滤波的数字音频信号；
13.处理所述经滤波的数字音频信号以产生对应的信号包络；
14.将统计分布拟合到所述信号包络；
15.基于所述统计分布和预定概率水平来确定所述信号包络的阈值水平；以及
16.识别所述信号包络中高于所述阈值水平的片段，从而将来自所述受试者的声音的所述数字音频记录的对应片段识别为包含所述感兴趣的特定声音事件的所述数字音频记录的片段。
17.在一个实施例中，数字音频记录是由多个帧组成的数字音频信号的记录。例如，数字音频信号可以包括多个连续的、不重叠的帧。在一个示例中，帧各自具有五分钟的持续时间，尽管它们可以更短或更长。
18.在一个实施例中，数字音频信号以44.1khz的采样率产生。
19.在一个实施例中，该方法包括应用第一下采样以产生第一下采样数字音频信号，所述数字音频记录的采样率通过所述第一下采样被减小整数因子。例如，数字音频信号可以从44.1khz到14.7khz以因子为3进行下采样，使得第一下采样音频信号具有14.7khz的采样率。
20.在一个实施例中，在所述特性频率范围中对所述第一下采样数字音频信号进行滤波以选择所述感兴趣的声音事件，从而产生第一下采样和事件滤波的数字音频信号。
21.在一个实施例中，所述感兴趣事件包括呼吸声，并且其中，对所述数字音频记录进行滤波包括应用高通滤波器。
22.在一个实施例中，所述感兴趣事件包括打鼾声，并且其中，对所述数字音频记录进行滤波包括应用低通滤波器。
23.在一个实施例中，处理所述经滤波的数字音频信号以产生对应的信号包络是通过包络检测过程来实现的。
24.在一个实施例中，所述包络检测过程包括将绝对值滤波器应用于所述第一下采样和事件滤波信号以产生绝对值滤波信号。
25.在一个实施例中，所述绝对值滤波信号由正向和反向滤波器滤波以产生低通滤波绝对值信号。
26.在一个实施例中，该方法包括对所述低通滤波绝对值信号应用第二下采样以产生所述信号包络，所述信号包络包括第一信号包络，所述第一信号包络是所述音频记录的幅度的估计。
27.在一个实施例中，应用所述第二下采样包括从14.7khz向下到100hz重新采样。
28.在一个实施例中，该方法包括将对数压缩应用于所述第一信号包络以产生包括所述数字音频记录的功率估计的第二信号包络。
29.在一个实施例中，将所述统计分布拟合到所述信号包络包括将所述统计分布拟合到包括所述功率估计的所述第二信号包络。
30.在一个实施例中，将所述统计分布拟合到所述信号包络包括将构成所述信号包络的样本分类到多个区间中以产生直方图。例如，在一个实施例中可以有300个区间。
31.在一个实施例中，拟合所述统计分布包含选择所述直方图的模态区间，其中所述模态区间是已将最大数量的样本分类到其中的区间。
32.在一个实施例中，区间号n包含在n
×
步长 min到(n 1)
×
步长 min范围内的样本中。
33.在一个实施例中，所述统计分布包括具有λ参数的泊松分布，并且拟合所述统计分布包括将所述λ参数设定为所述模态区间的区间号。
34.在一个实施例中，基于所述统计分布和所述预定概率水平来确定所述信号包络的阈值水平包括计算关于所述统计分布的累积分布函数(cdf)。
35.在一个实施例中，确定所述信号包络的阈值水平包括找到阈值区间，所述阈值区间是对应于所述预定概率的区间，其中所述预定概率水平包括所述cdf上的概率水平。
36.在一个实施例中，确定所述阈值水平包括将所述阈值水平设定为来自所述阈值区间中的样本的幅度范围的值。
37.在一个实施例中，所述阈值水平被设定为所述阈值区间中的样本的幅度范围的上限。
38.在一个实施例中，应用时间滤波器来基于所述感兴趣事件剔除不落在预定持续时间范围内的片段。
39.在一个实施例中，所述感兴趣事件包括打鼾声，并且其中所述持续时间范围大于225ms且小于4s。
40.在一个实施例中，该方法包括以非易失性方式并且与所述数字音频记录相关联地记录指示所述信号包络的高于所述阈值水平的所述片段中的每个片段的开始时间和结束时间的信息。
41.根据本发明的另一方面，提供了一种包括声音事件识别机器的装置，所述声音事件识别机器被配置为识别包含感兴趣的特定声音事件的受试者的数字音频记录的部分，所述装置包括：
42.处理器，用于根据处理所述数字记录；
43.与所述处理器进行数据通信的数字存储器，所述数字存储器存储用于配置所述处理器的指令，所述指令包括用于配置所述处理器以进行以下操作的指令：
44.基于所述声音事件的特性频率范围对所述记录进行滤波；
45.处理经滤波的记录以产生对应的信号包络；
46.将统计分布拟合到所述信号包络，从而确定对应于预定概率水平的阈值水平；以及
47.识别所述信号包络的高于所述阈值的片段，从而将所述数字音频记录的对应片段识别为包含所述特定声音事件的片段。
48.在一个实施例中，该装置包括经配置以拾取所述受试者的声音的麦克风。
49.在一个实施例中，该装置包括音频接口，所述音频接口包括滤波器和模数转换器，所述模数转换器被配置为将所述受试者的声音转换为数字音频信号。
50.在一个实施例中，该装置经配置以将所述数字音频信号作为所述数字音频记录存储于所述处理器可存取的所述数字存储器中。
51.在一个实施例中，该装置包括人机接口。
52.在一个实施例中，存储在所述数字存储器中的所述指令包括配置所述处理器以在所述人机接口上显示信息的指令，所述信息包括识别含有所述感兴趣事件的数字音频记录中的片段的信息。
53.在一个实施例中，存储在所述数字存储器中的所述指令包括配置所述处理器以在所述人机接口上显示包含指示所述感兴趣事件的信息的指令。
54.在一个实施例中，显示在所述人机接口上的所述信息包括指示关于经识别以含有所述感兴趣事件的多个片段中的每个的开始时间及结束时间的信息。
55.在一个实施例中，所述数字存储器包括指令，所述指令配置所述处理器以非易失性方式写入每一所识别片段的所述开始时间及结束时间，以借此有形地标记含有关于所述数字音频记录的所述感兴趣事件的片段。
56.根据本发明的另一方面，提供了一种承载有形地、非暂态指令的机器可读介质，所述指令由一个或多个处理器执行以实现根据权利要求1所述的方法。
57.根据本发明的另一方面，提供了一种用于识别包含感兴趣的特定声音事件的受试者的数字记录部分的装置，所述装置包括：
58.换能器，用于将来自所述受试者的声音转换成对应的模拟电信号；
59.模数转换组件，用于从所述模拟电信号生成数字音频记录；
60.感兴趣事件滤波器，用于在感兴趣的特定声音事件的频率特性处对所述数字音频记录进行滤波，以产生感兴趣事件滤波的数字音频记录；
61.信号包络组件，用于处理经滤波的数字音频记录以产生对应的信号包络；
62.直方图生成器组件，响应于所述信号包络组件，用于将包括所述信号包络的数字样本按其幅度分类到多个区间中，并且识别所述多个区间中的模态区间；
63.统计概率分布生成器，其响应于所述直方图生成器，并且被布置成基于所识别的模态区间来计算统计概率分布，并且根据所述统计概率分布和预定概率水平来确定所述信号包络的阈值水平；以及
64.事件识别组件，其响应于所述统计概率生成器，并且被布置为识别所述信号包络中高于所述阈值水平的片段，并且有形地将所述数字记录的对应片段识别为包含所述感兴趣事件。
65.根据本发明的另一方面，提供了一种用于处理受试者的数字音频记录以识别其中的一个或多个感兴趣事件的方法，所述方法包括：
66.预处理所述数字音频记录，包括对其应用下采样和滤波，以产生包括多个数字样本的对应的信号包络；
67.将所述多个数字样本按其幅度分类到多个区间中；
68.确定所述多个区间中的模态区间，所述模态区间是包含最大数量的所述多个数字样本的区间，所述数字样本具有在所述区间范围内的幅度；
69.基于所识别的模态区间来计算统计概率分布；
70.确定阈值区间，所述阈值区间是与所述概率分布的预定概率水平相对应的区间；
71.将阈值水平设定为来自所述阈值区间范围的值；以及
72.确定所述信号包络中高于所述阈值水平的片段，以由此有形地识别所述数字音频记录中含有所述一个或多个感兴趣事件的对应片段。
73.在一个实施例中，信号包络包括用于数字音频记录的功率估计信号。
74.在一个实施例中，信号包络包括数字音频记录的幅度估计信号。
75.在一个实施例中，数字音频记录的下采样和滤波包括在正向和反向上将低通滤波器应用于数字音频记录。
76.在一个实施例中，数字音频记录的下采样和滤波包括应用高通滤波器，其中，感兴趣事件包括受试者的呼吸声。
77.在一个实施例中，数字音频记录的下采样和滤波包括应用低通滤波器，其中，感兴趣事件包括受试者的打鼾声。
78.在一个实施例中，基于所识别的模态区间计算统计概率分布包括使用模态区间的索引作为泊松分布的λ参数来计算泊松分布。
79.根据本发明的另一方面，提供了一种用于识别包含特定声音事件的受试者的数字记录的部分的装置，所述装置包括：
80.处理器，用于根据存储在所述处理器可访问的数字存储器中的指令来处理所述数字记录，所述指令包括用于所述处理器实现用于检测所述数字记录中包含感兴趣特定事件的片段的方法的指令。
81.应当理解，除非逻辑另外规定，否则其任何方面或实施例的特征或特性可以被并入到任何其它方面中。
附图说明
82.本发明的优选特征、实施例和变化可以从下面的详细描述中辨别，下面的详细描述为本领域技术人员提供了足够的信息来执行本发明。该详细描述不应被认为以任何方式限制本发明的前述发明内容的范围。所述详细描述将参考如下的多个附图：
83.图1是根据优选实施例的方法的流程图。
84.图2是在执行该方法期间记录的数字音频信号的帧的图。
85.图3描述了图2所示信号的最初22秒部分。
86.图4是在执行包括对应于图3的信号的幅度估计的方法期间产生的下采样、压缩和滤波波形的图。
87.图4a是图4所示信号的对数图，包括对应于图3的信号的功率估计。
88.图5是在执行该方法期间生成的图4的波形的直方图，该方法具有基于直方图的泊松分布曲线，并且还示出了泊松分布的cdf。
89.图6是对应于图4a的图，其上示出了事件阈值水平。
90.图7是图3的波形的图，其示出了被识别为包含与图6中指示的片段时间相对应的感兴趣事件的片段。
91.图8是根据一个实施例的用于识别受试者的音频信号中的感兴趣事件的装置的框图。
92.图9是根据一个实施例的事件识别机器的框图。
93.图10是图9的机器处于使用阶段的外部视图。
94.图11是图9所示机器在随后使用阶段的外部视图。
具体实施方式
95.将参考图1的流程图描述根据本发明优选实施例的自动事件检测方法。
96.总的来说，该方法涉及处理数字音频记录以识别包含感兴趣的特定声音事件的记录的片段。根据多个过程来处理数字音频记录，包括在框11处对数字音频记录进行滤波，以及处理经滤波的数字音频记录以产生对应的信号包络，如虚线框14所指示。然后，将统计分布拟合到信号包络，如虚线框16所指示，该统计分布通常是泊松分布，但也可以是诸如γ分布的另一统计分布。然后，如虚线18所指示，确定关于信号包络的阈值水平。基于统计分布和预定概率水平来确定阈值水平。然后，将信号包络中高于阈值水平的片段识别为例如每个这样的片段的开始和结束时间，从而还识别数字音频记录中包含感兴趣的特定声音事件的对应片段。例如，感兴趣的声音事件可以是诸如打鼾、或喘鸣或呼吸声的声音。
97.最初，在已经概述的方法开始之前，麦克风4形式的换能器将来自受试者1的模拟空中声波2转换为对应的模拟电信号3。随后在框5处通过抗混叠滤波器处理模拟电信号3，然后在框6处通过模数转换器处理模拟电信号3以形成对应的数字音频信号，在框9处来自adc6的数字音频信号被存储在电子数据存储组件中，诸如数字存储器，作为数字音频记录。随后，根据本方法的优选实施例，以数字音频信号8的形式检索数字音频记录，并由图1的流程图的后续框进行处理。在本实施例中，数字音频信号8由多个连续的、不重叠的五分钟的帧组成。图2示出了数字音频信号8的单个帧36，其在44.1khz的采样率下由44,100
×5×
60＝13,230个样本组成。图3更详细地示出了帧36中的数字音频信号8的前二十秒(在图2中标识为44)。
98.在框10，从数字存储器中检索数字音频信号8，并对其进行从其44.1khz的原始采样率到14.7khz的第一下采样，使得每秒的采样数减少三倍。以这种方式进行下采样产生包含较少样本的第一下采样数字音频信号40，以便进行后续处理。由于数字音频信号将被处理以检测噪声基底阈值，因此快速移动的瞬态是不重要的，并且因此下采样不会导致准确性的损失。在框11，通过应用带通、或低通、或高通滤波器来对第一下采样数字音频信号40进行滤波，以便为将在数字音频信号8中被有形地识别的感兴趣的声音事件进行频率选择。例如，在框11，如果感兴趣的特定声音事件是呼吸声，则可以对第一下采样数字音频信号40应用1000hz高通滤波器。可替代地，如果感兴趣的特定声音事件包括打鼾声，则可以应用1000hz的低通滤波器。
99.框13到19实现包络检测过程14，其在应用用于识别感兴趣事件的后续步骤之前预处理信号42，如将解释的。
100.在框13，将绝对值滤波器应用于下采样的、事件滤波的音频信号42，其将所有负样本翻转为正以产生对应的绝对值滤波的音频信号44。例如，在框7，adc以16位分辨率采样，则每个样本将具有在-32,768到 32,767幅度步长的范围内的整数幅度值。在框13处的绝对值滤波反转负幅度样本的符号，使得所有样本然后取0到 32,767范围内的整数幅度值。
101.然后，在框15，经过绝对值滤波的音频信号44被传递到7hz低通正向和反向滤波器。为了使框15的过程的反向滤波器部分工作，必须将经过绝对值滤波的音频信号44存储在数字存储器中。正向-反向滤波器实现低通滤波而不影响感兴趣内容的相位。
102.在框17，对滤波后的绝对值信号44应用第2下采样操作。第2下采样操作从14.7khz向下到100hz进行重新采样。
103.图4描述了在框15处生成的正向-反向滤波信号，其包括第一信号包络信号或更简单地“信号包络”，其对应于原始记录信号8并且是记录信号8的幅度的估计。
104.然后在框19处对幅度估计信号46应用对数压缩，以减小大的输入信号变化。在应用对数压缩之前，将功率比值小于10-5
的样本调整到10-5
的幅度，以便限制应用对数压缩之后的值的范围。框13处的绝对值滤波器、框15处的低通滤波器、框17处的下采样和框19处的对数压缩产生对应于原始数字记录8的第二信号包络47。第二信号包络47是功率估计信号，是原始数字音频信号8的功率的估计。
105.在框21，计算第二信号包络47在一帧(例如五分钟)上的采样幅度的直方图48(图5)。直方图48是通过将包括第二信号包络(功率估计信号)47的2000个样本按其幅度分类而生成的，每个样本被分类到300个幅度区间中的一个区间中。
106.当然，应当认识到，在其他实施例中，可以使用不同的下采样率，使得五分钟帧将包括少于或多于2000个样本。此外，尽管五分钟帧是优选的，但是帧可以更长或更短，并且其长度可以基于下采样率和要使用的区间的数量来调整。还将认识到，可以使用多于或少于300个的区间，尽管300是已发现对于当前描述的下采样率和帧长度工作良好的区间的优选数量。
107.虽然框21中的直方图计算过程最好是在第二信号包络47(其为功率估计信号)上执行，，但它也可以改为在第1信号包络上执行，即幅度估计信号46。在框19执行对数过程的原因是避免幅度信号包络的快速幅度变化，这种快速幅度变化将使随后的直方图和统计分布拟合步骤(将在下面说明)不太可靠。
108.对于包括图4a中所示的功率估计信号47的第二信号包络，每个采样落在-5.0到-2.9的范围内(是帧中的最小和最大功率估计)。组成功率估计信号47的样本可以被分类到300个区间中(顺序地被索引为“0”到“299”)，其步长为(max-min)/num个区间，即(-2.9-5.0)/300＝大约0.007。区间号n包含在n
×
步长 min到(n 1)
×
步长 min范围内的样本中。例如，区间号150包含在150
×
0.007 -5.0到(150 1)
×
0.007 -5.0，即-3.95到-3.94的功率估计范围内的样本中。
109.在框23，选择直方图48的模态区间。模态区间是帧中的最大数量的样本已经被分类到其中的区间。在图5中所示的示例中，包括五分钟帧上的第二信号包络47的30,000个样本中的几乎400个样本已经被分类到幅度区间135中，使得其包含比任何其它区间更多的样本，并且因此135号区间是模态区间。幅度区间135包含第二信号包络的样本，其幅度表示原始记录信号8在(135
×
0.007 -5.0)到((135 1)*0.007 -5.0)范围内，即-4.053到-4.046的功率估计。
110.在框25，泊松分布的λ参数被设定为用于将分布拟合到直方图的模态区间的区间号。也就是说，λ＝135，因为区间135包含最多的样本。在框27，计算具有λ＝135的泊松分布。泊松分布在图5中拟合在直方图48上的线50。在框29，计算泊松分布的累积分布函数(cdf)。cdf在图5的图中以曲线52示出。
111.在框31，找到直方图48的阈值区间，该区间对应于cdf 52上的非常高的概率水平。该概率水平被设定为非常高，因为希望能够以高置信度识别包含感兴趣事件的音频片段。在图5所示的情况下，概率水平已经被设置为cdf曲线1下的总概率的0.999999。发现0.999999概率水平对应于由虚垂直线51所指示的195号区间。因此，作为阈值区间的195号
区间包含具有表示195
×
0.007 -5.0到(195 1)*0.007 -5.0，即-3.632到-3.625的范围内的功率估计的幅度的样本。在框33，将区间195中的采样幅度的上限(即-3.625)设定为第二信号包络(即功率估计信号47)的阈值水平。
112.在框35，通过将构成第二信号包络47的每个采样与阈值水平进行比较，来确定包含幅度都高于阈值水平的采样的第二信号包络47的片段。
113.图6示出了叠加在第二信号包络(即功率估计信号)47上的阈值水平56。
114.可以看出，在阈值上方片段[t1，t2]；[t3，t4]；[t5，t6]；[t7，t8]；[t9，t10]；和[t11，t12]中，第二信号包络超过阈值。
[0115]
在框37处应用简单的时间滤波器，以基于事件必须具有比225ms更长的持续时间和比4s更短的持续时间来选择可能与作为感兴趣事件的睡眠声音相对应的阈值以上的片段。因此，间隔101被丢弃，使得被识别为包含特定睡眠事件的间隔剩下间隔100、102、103、104和105。
[0116]
这些片段被认为具有非常高的可能性对应于原始波形8中包含特定事件的样本的片段，该特定事件在框11中被过滤为感兴趣的事件。
[0117]
在框39，然后关于初始数字音频信号8将高于阈值水平的片段有形地标记为间隔100、101、102、103、104和105。“有形地”标记意味着每个高于阈值的片段的开始和结束时间或等效信息以与数字音频声音的记录相关联的非易失性方式被记录，使得高于阈值的片段可以容易地被识别并且在必要时被进一步处理。
[0118]
然后，可以进一步处理数字音频信号8以及标识信号中包含感兴趣事件的片段的标记。例如，如果感兴趣的事件是打鼾声，则标记为包含打鼾的片段可以使用现有技术方法来处理，以确定打鼾声是否指示睡眠呼吸暂停。类似地，如果感兴趣事件是喘鸣声音，则可以处理数字音频信号和标识包含喘鸣声音的片段的标签，以确定例如喘鸣是否指示哮喘。
[0119]
图8是根据先前已经描述的方法，用于识别受试者的数字记录中包含特定声音事件部分的装置600的框图。装置600包括麦克风601形式的换能器，用于将来自受试者1的声音3转换成对应的模拟电信号8(图2)。
[0120]
麦克风601连接到模数转换组件604，用于从模拟电信号生成数字音频记录。模数转换组件604包括抗混叠滤波器602和产生与来自受试者1的声音3对应的数字信号的模数转换器603。在本实施例中，模数转换组件1被设置成以16位分辨率产生44.1khz采样率信号。将认识到，在本发明的其它实施例中也可以使用其它采样率和位分辨率。
[0121]
模数转换组件604的输出端口将五分钟帧的数字信号提供给数字存储器605。输出端口还连接到第1下采样器607，其被布置为从44.1khz下采样到14.7khz。
[0122]
来自第1下采样器607的信号根据联动开关609a和609b的设置，通过打鼾声事件滤波器611或呼吸声事件滤波器613到达绝对值滤波器615。打鼾声事件滤波器611和呼吸声事件滤波器613分别是用于选择打鼾声事件的1000hz截止低通滤波器和用于选择呼吸声事件的1000hz高通滤波器。两个滤波器都是截止频率为1000hz的2阶巴特沃斯高通/低通iir滤波器。
[0123]
开关609b的输出耦合到绝对值滤波器615，其被设置成反转滤波的数字音频信号中的所有负样本的符号。绝对值滤波器615又耦合到数字存储器617，数字存储器617存储来自绝对值滤波器615的多帧经滤波的数字信号。
[0124]
正向-反向低通滤波器619耦合到数字存储器617，用于利用截止频率为7hz的2阶巴特沃斯低通iir滤波器在正向和反向两个方向上对所存储的信号进行滤波。信号被向前滤波两次，然后向后滤波以保持相位。
[0125]
第二下采样器619耦合到正向-反向lpf 619的输出侧，以执行信号到100hz的下采样，这产生幅度估计信号，诸如图4的信号46。
[0126]
对数放大器组件620耦合到第2下采样器621的输出侧。对数放大器组件产生功率估计信号，例如图4a的信号47。数字存储器622耦合到对数放大器组件620，并存储多帧功率估计信号。
[0127]
直方图生成器组件623耦合到第二下采样组件的输出侧。直方图生成器组件623被布置为将包括功率估计信号的数字样本按其幅度分类到多个幅度区间中，并且生成指示多个幅度区间中的模态幅度区间和针对分布的预设高概率阈值的泊松分布λ值的信号。
[0128]
提供统计概率分布生成器625，其响应于直方图生成器623，并且被布置为基于所识别的模态幅度区间来计算统计概率分布。直方图生成器组件623和分布生成器625可以由一个或多个fpga或微控制器实现，例如被配置为使用指示模态幅度区间的信号作为泊松分布的λ参数来计算诸如泊松分布的分布。
[0129]
提供事件识别组件627，其响应于统计概率生成器625，并且被安排为有形地识别数字存储器605中包含特定事件的数字记录片段，该片段是包含高于背景噪声样本值预定概率水平的样本的片段。
[0130]
事件识别组件627可以将元数据代码插入到存储原始音频信号的文件629中，或者可替换地它可以写入包含时间间隔序列的文件，所述时间间隔序列有效地标记包含感兴趣事件的音频信号的片段。
[0131]
作为泊松分布的替代，发明人还测试了其他对数正态分布，根据这些对数正态分布，发明人相信正态分布也将起作用。然而，泊松分布是优选的，因为它具有简单拟合的技术优点，因为仅有一个参数(即λ参数)要估计，而这是从直方图中直接提取的。
[0132]
对所选分布的要求是它可以拟合样本的直方图，并且噪声样本遵循该分布。
[0133]
例如，如果分布族被选择为γ，则拟合函数，诸如由scipy在以下链接https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.gamma.html提供的拟合函数可以被用来估计γ分布的参数。
[0134]
在使用中，装置600可以在用于手持的足够小的外壳中实现，其由操作者保持在距受试者面部几厘米的位置。在需要长时间记录的情况下，装置600可以在记录期间安装到三脚架。操作者配置联动开关609a、609b，以根据在记录的声音信号中要识别的感兴趣的事件的类型，选择打鼾声事件滤波器611或呼吸声事件滤波器613。随着记录的进行，数字声音记录被存储在数字存储器605中，其通常包括诸如sd卡的记录介质。同时，如前所述，信号还被装置600的各个块607至621进行各种下采样和滤波，以在第2下采样器621的输出侧产生功率估计信号。然后，直方图生成器623将组成功率估计信号的样本按照其幅度分类到多个区间中，以确定模态区间。概率分布生成器625使用模态区间的区间号作为泊松分布的λ参数，以便计算对应的泊松分布，并且根据该分布的cdf识别与包含高于噪声基底的样本的非常高的概率对应的区间。事件识别组件627响应于统计概率生成器625，被设置有形地识别包含特定事件的数字记录片段，该数字记录片段存储在数字存储器605中，而且是包含高于背
景噪声采样值预定概率水平的采样的片段。
[0135]
应当理解，在一个实施例中，提供了一种用于识别信号的记录的片段的方法，该信号包括来自包含感兴趣的特定声音事件的受试者的声音。该方法涉及基于声音事件的特征频率范围对记录进行滤波。例如，在感兴趣的声音事件主要是诸如打鼾的较低频率声音的情况下，使用较低的频率范围，这与诸如呼吸声的其他声音的较高频率范围形成对比。该方法然后包括处理滤波记录以产生相应的功率估计信号，该信号是原始记录的音频信号的功率的估计。然后，该方法包括将统计分布拟合到功率估计信号，例如泊松分布，并且使用高概率水平的分布(即噪声阈值水平确实高于关于感兴趣事件的信号的噪声基底)确定噪声基底阈值水平。然后，来自受试者的声音的记录的片段被识别为高于噪声基底阈值水平的片段。
[0136]
该方法在记录患者声音时快速识别很可能包含感兴趣事件的片段，从而可以花费时间和处理能力来进一步分析那些片段，而不会浪费时间来处理不包含感兴趣声音事件的片段。
[0137]
图9是根据本发明另一个实施例的声音事件识别机器751的框图，用于识别和标记包含感兴趣事件的声音记录片段，例如，所述感兴趣事件诸如是打鼾声或喘鸣声音。在当前描述的实施例中，使用智能电话的一个或多个处理器、麦克风和存储器来实现该装置。声音事件识别机器751包括访问电子存储器755的至少一个处理器753。电子存储器755包括操作系统758，诸如安卓操作系统或apple ios操作系统，例如用于由处理器753执行。电子存储器755还包括根据本发明优选实施例的声音事件识别软件产品或“app”756。咳嗽识别app 756包括可由处理器753执行的指令，以便声音事件识别机器751根据图1的方法处理来自受试者1的声音702。在其操作期间，处理器753在app 756的命令下处理声音702，并借助于lcd触摸屏接口761向操作者754呈现包含感兴趣的声音事件的片段的列表。如果需要，可以进一步处理所识别的声音事件。app 756可以被提供为承载在诸如光盘或磁盘750等计算机可读介质上的有形地、非瞬态机器可读指令，以供耦合到usb端口765的磁盘驱动器读取。可替代地，app也可以通过wan/wlan接口773从远程文件服务器下载。
[0138]
处理器753经由金属导体构成的数据总线757与多个外围组件759至773进行数据通信，如图9所示，数字信号200沿着金属导体在处理器和各种外围设备之间传送。因此，如果需要，声音事件识别机器751能够经由wan/wlan组件773和射频天线779与语音和/或数据通信网络781建立语音和数据通信。
[0139]
机器751还包括其它外围设备，诸如透镜和ccd组件759，其实现数字照相机，使得如果需要，可以捕获受试者752的图像以及使用来自gps模块767的数据获取图像的位置。机器751还包括用于为机器供电的电源适配器端口和电池管理组件769。提供lcd触摸屏接口761，其充当人机接口且允许操作者754读取结果且将命令和数据输入到机器751中。usb端口765被提供用于实现与诸如usb棒的外部存储设备的串行数据连接，或者用于进行与数据网络或外部屏幕和键盘等的电缆连接。如果需要，除了由存储器755促进的内部数据存储空间之外，还提供辅助存储卡764以用于额外的辅助存储。
[0140]
音频接口771将麦克风775耦合到数据总线757，并且包括抗混叠滤波电路和模数采样器，以将来自麦克风775的模拟电波形4(其对应于受试者声波3)转换为数字音频信号8，其作为记录存储在存储器755中的数字声音文件702中，并且用于在app 756的控制下由
处理器753处理。例如，处理器可以是由高通公司制造的骁龙865处理器，但是其它和较低功率的处理器也将是合适的。音频接口771还耦合到扬声器777。音频接口771包括用于将数字音频转换成模拟信号的数模转换器和连接到扬声器777的音频放大器，使得记录在存储器755或辅助存储器764中的音频702可被回放以供操作者754收听。
[0141]
机器751编程有app 756，使得其被配置为在受试者声音的记录中识别包含感兴趣事件的片段，感兴趣事件诸如喘鸣或打鼾。
[0142]
如先前所讨论的，尽管图9中所示的声音事件识别机器751是以由app 756唯一配置的智能手机硬件的形式提供的，但是其可以同样地利用诸如台式计算机、膝上型计算机或平板计算设备之类的一些其他类型的计算设备，或者甚至在云计算环境中实现，其中硬件包括用app 756专门编程的虚拟机。
[0143]
咳嗽识别机器751用于识别受试者752的记录702中包含感兴趣事件的片段的过程的实施例，并且其包括构成app 756的指令，在先前已经描述的图1的流程图中示出。
[0144]
在使用中，操作者754或受试者3从由os 758在lcd触摸屏接口761上生成的app选择屏幕中选择app756。响应于该选择，处理器753显示诸如图10的屏幕782的屏幕，以提示操作者754操作机器751以开始经由麦克风775和音频接口771记录来自受试者752的声音3。音频接口771将声音转换成数字信号200，该数字信号200沿着总线757传送并且由处理器753记录为存储器755和/或辅助存储sd卡764中的一个或多个数字文件702。在目前描述的优选实施例中，记录应该进行足以包括多个感兴趣的声音事件的持续时间。
[0145]
在记录完成之后，在包括实现图1的方法的app 756的指令的控制下，处理器753处理记录702并识别记录中包含感兴趣的事件的片段。然后，所识别的片段可以显示在屏幕778上，在本示例中，其识别270个包含感兴趣的声音事件的片段以及每个片段的开始和结束时间。处理器753在app 756的控制下还以非易失性方式将所识别的片段数以及开始和结束时间写入到也可以包含声波记录的文件753中，以便有形地标记关于声波记录的感兴趣的事件。
[0146]
由处理器753结合包括事件标记app 756的指令实现的方法快速识别受试者声音的记录702中的很可能包含感兴趣事件的片段。因此，如果需要，可以花费时间和处理能力来进一步分析这些片段，而不会在处理不包含感兴趣的声音事件的片段上浪费时间。
[0147]
按照法规，已经用或多或少地特定于结构或方法特征的语言描述了本发明。术语“包括”及其变体，诸如“包含”和“由...组成”以包括性的意义在全文中使用，并且不排除任何附加特征。
[0148]
应当理解，本发明不限于所示或所述的具体特征，因为本文所述的方法包括实施本发明的优选形式。因此，本发明要求保护在由本领域技术人员适当解释的所附权利要求的适当范围内的任何形式或修改。
[0149]
在整个说明书和权利要求书(如果存在)中，除非上下文另有要求，术语“基本上”或“大约”将被理解为不限于由术语限定的范围的值。
[0150]
本发明的任何实施例仅仅是说明性的，并不意味着限制本发明。因此，应该理解，在不脱离本发明的范围的情况下，可以对所描述的任何实施例进行各种其他改变和修改。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：用于医学透析设备的时间控制报警处理的制作方法

受试者声音中的事件检测的制作方法

相关文献

最热文献