一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音同一性鉴定装置的样品制备系统及鉴定能力评估方法与流程

2022-12-06 23:27:03 来源:中国专利 TAG:


1.本发明涉及司法鉴定仪器评估技术领域,具体涉及一种语音同一性鉴定装置的样品制备系统及鉴定能力评估方法。


背景技术:

2.语音同一性司法鉴定,是指通过比较和分析,对声像资料记载的语音的同一性问题进行鉴别和判断的专门技术。随着计算机技术的发展,语音同一性鉴定方法已发展至通过计算机技术对录制的语音检材进行声纹分析、特征提取,从而进行比较鉴定。但是,受限于实际的硬件条件限制,实际鉴定结果可能会因为鉴定装置本身的误差因素存在一定的错误。因此在进行语音同一性鉴定之前,有必要对鉴定装置进行能力验证。语音同一性能力验证是用于评价实施语音同一性鉴定的实验室能力的方法。通常采取“参加机构报名-组织者发出作业指南及需检样品-参加机构反馈检验结果-组织者评价”的方式进行。
3.现有技术中,用于对语音同一性鉴定装置进行评估的样品通常基于以下过程进行制备:能力验证计划专家确定考察要点、技术专家按计划方案制备样品并进行验证、添加唯一性标识并复制分发,从而得到可用于对语音同一性鉴定装置的鉴定能力进行评估的样品。
4.但是,在实际实施过程中,发明人发现,现有技术中存在有如下问题:
5.(1)制样过程随意:对于能力验证样品的内容及考察点没有统一的标准和预估,缺乏规范化的制作流程,对于评价结果无法预期;
6.(2)制样内容复用性差:每次制样仅能使用一次,在制样过程中制备的平行样品未能得到利用;
7.(3)工作量大:每次制备样品从设计到发出,需要专业的经验丰富的制备技术人员大量创造性工作,过程繁琐,试错及返工也需要耗费大量的工作时间。


技术实现要素:

8.针对现有技术中存在的上述问题,现提供一种语音同一性鉴定装置的样品制备系统;另一方面,还提供一种语音同一性鉴定装置的鉴定能力评估方法。
9.具体技术方案如下:
10.一种语音同一性鉴定装置的样品制备系统,包括:
11.参数生成模块,所述参数生成模块根据一评估需求生成目标参数;
12.语音生成模块,所述语音生成模块连接所述参数生成模块,所述样品生成模块根据所述目标参数生成语音数据;
13.样品输出模块,所述样品输出模块连接所述语音生成模块,所述样品输出模块接收所述语音数据并生成实验样品后输出。
14.优选地,所述参数生成模块包括:
15.难度控制子模块,所述难度控制子模块根据所述评估需求生成难度参数,并将所
述难度参数添加至所述目标参数中;
16.样品类型设定子模块,所述样品类型设定子模块根据所述评估需求生成样品类型参数,并将所述样品类型参数添加至所述目标参数中。
17.优选地,所述难度参数包括:考察点数量,考察点类型和考察点选取方式;
18.所述样品类型参数包括录音来源、录音方式和录音参数。
19.优选地,所述语音生成模块包括:
20.样本采集子模块,所述样本采集子模块获取录音样本并存储至样本数据库中;
21.筛选子模块,所述筛选子模块根据所述难度参数和所述样品类型参数自所述样本数据库中检索得到可用语音;
22.检查子模块,所述检查子模块连接所述筛选子模块,所述检查子模块根据所述评估需求对所述可用语音进行检查以生成所述语音数据。
23.优选地,所述检查子模块包括:
24.匹配程度检查子模块,所述匹配程度检查子模块对所述评估需求进行解析,以得到所述评估需求所需的所述实验样品的考察点期望样本,并基于所述考察点期望样本对所述语音数据中的所述考察点数量和所述考察点类型进行评价以生成第一检查结果;
25.考察点关联检查子模块,所述考察点关联检查子模块对所述评估需求进行解析以生成所述评估需求所需的所述实验样品的考察点分布,并基于所述考察点分布对所述考察点在所述语音数据中的分配情况进行评价以生成第二检查结果;
26.逻辑分析子模块,所述逻辑分析子模块对所述评估需求进行解析以生成所述评估需求所需的所述实验样品的简要案情信息,并基于所述简要案情信息对所述语音数据的语音内容进行逻辑关联性分析生成第三检查结果;
27.质量评价子模块,所述质量评价子模块分别连接所述匹配程度检查子模块、所述考察点关联检查子模块和所述逻辑分析子模块,所述质量评价子模块根据所述第一检查结果、所述第二检查结果和第三检查结果剔除不符合所述评估需求的所述可用语音。
28.优选地,所述质量评价子模块对所述第一检查结果、所述第二检查结果和所述第三检查结果进行加权求和,并将计算值与预先设置的检查阈值进行比较以剔除不符合所述评估需求的所述语音数据;
29.所述质量评价子模块还将所述第三检查结果与预先设置的逻辑检查阈值进行比较以剔除不符合所述逻辑关系的所述语音数据。
30.优选地,所述样品输出模块包括:
31.防串通子模块,所述防串通子模块连接所述语音生成模块,所述防串通子模块接收所述语音数据,并分别对每一组所述语音数据添加唯一性标识生成唯一性语音;
32.复制子模块,所述复制子模块连接所述防串通子模块,所述复制子模块根据所述评估需求对所述唯一性语音复制后作为所述实验样品输出。
33.优选地,所述样品输出模块还包括:
34.校验子模块,所述校验子模块连接所述复制子模块,所述校验子模块分别获取所述唯一性语音和所述实验样品并计算哈希值,用于验证所述唯一性语音和所述实验样品的一致性。
35.一种语音同一性鉴定装置的鉴定能力评估方法,采用上述的样品制备系统生成的
实验样品,包括:
36.步骤s1:针对所述语音同一性鉴定装置,生成对应于所述语音同一性鉴定装置的评估需求;
37.步骤s2:基于所述评估需求生成所述实验样品;
38.步骤s3:采用所述实验样品对所述语音同一性鉴定装置的鉴定能力进行评估。
39.上述技术方案具有如下优点或有益效果:通过在样品制备系统中添加参数生成模块对评估需求进行解析,并基于解析得到的目标参数依次构建语音数据、对语音数据进行处理后输出,使得实验样品能够更为符合对语音同一性鉴定装置的评估需求,能够更好地评估语音同一性鉴定装置的鉴定能力;同时,通过设置样品输出模块对语音数据进行处理并输出,实现了较好的样品复用性,且在这一过程中排除了人为因素的影响,提高了样品制备的质量。
附图说明
40.参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。
41.图1为本发明实施例中样品制备系统的原理框图;
42.图2为本方面实施例中检查子模块示意图;
43.图3为本方面实施例中鉴定能力评估方法示意图。
具体实施方式
44.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
46.下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
47.本发明包括:
48.一种语音同一性鉴定装置的样品制备系统,如图1所示,包括:
49.参数生成模块1,参数生成模块1根据一评估需求生成目标参数;
50.语音生成模块2,语音生成模块2连接参数生成模块1,样品生成模块2根据目标参数生成语音数据;
51.样品输出模块3,样品输出模块3连接语音生成模块2,样品输出模块3接收语音数据并生成实验样品后输出。
52.具体地,针对现有技术中对语音同一性鉴定装置的鉴定能力评估过程,通常采用人工制备样品的方式,且不具有特定的操作流程,导致样品制备过程随意性大,受人工因素影响较大质量不稳定的问题,本实施例中,通过构建上述的样品制备系统,并在样品制备系统中设置参数生成模块1,使得参数生成模块1 能够根据评估需求生成对应的目标参数;随后,采用语音生成模块2基于目标参数对语音样本进行采集、筛选,从而得到符合评估需求
的语音数据。在这一过程中,通过设置目标参数的方式实现了对不同类型、内容的语音数据的较好的选取,从而能够对语音同一性鉴定装置实现较为全面的评估效果。同时,通过调整目标参数也能够较为容易地控制生成的语音数据的难度、参数等,以此来使得实验样品更为符合评估需求。最后,通过样品输出模块3对语音数据进行复制、校验后作为实验样品输出,以此来实现语音数据较好的复用性,且保证了同一批次的实验样品较好的一致性。
53.在实施过程中,上述样品制备系统通常作为软件实施例设置在计算机系统中,其用于对评估需求进行解析从而实现语音样本的采集、处理过程,进而生成可用于对语音同一性鉴定装置的鉴定能力进行评估的实验样品。实验样品指在语音同一性鉴定装置的鉴定能力评估过程中需要用到的检材,其体现为一段具有特定的音频特征的数字音频文件,且为实现实验样品的唯一性,其还添加有用于标识不同样本的唯一性标识字符串。评估需求为基于语音同一性鉴定装置确定的需要进行考察的考察要点,其体现为不同的听觉特征、声谱特征、特征稳定性、录制方式等。目标参数为基于该评估需求确定的一种对实验样品的“期望参数”,其用于在提取语音数据的过程中,对获取到的语音样本进行判断,从而获取到实际所需要的语音数据。
54.在一种较优的实施例中,参数生成模块1包括:
55.难度控制子模块11,难度控制子模块11根据评估需求生成难度参数,并将难度参数添加至目标参数中;
56.信道参数设定子模块12,信道参数设定子模块12根据评估需求生成信道参数,并将信道参数添加至目标参数中。
57.具体地,针对现有技术中用于对语音同一性鉴定装置进行鉴定能力评估的样品主要由人工选取样品,其主观性较大,不能很好地覆盖评估需求的问题,本实施例中,通过分别设置难度控制子模块11和信道参数设定子模块12,对评估需求进行解析从而得到难度参数和信道参数,基于这两个维度的参数指导后续的语音数据的生成过程,以此来实现较好的实验样品制备效果,实现了对期望生成的语音数据较好的控制效果。
58.在一种较优的实施例中,难度参数包括:考察点数量,考察点类型和考察点选取方式;
59.信道参数包括录音来源、录音方式和录音参数中的至少一个。
60.在实施过程中,难度参数指基于考察要点确定的对语音同一性鉴定装置的鉴定能力所预期的考察难度,其通过语音同一性鉴定装置可用的考察点数量;考察点类型,即,检验时可用的检查角度;以及考察点的选取方式,通过考察点对应的听觉特征、声谱特征的数量等来体现。具体来说,检查角度指检查过程中可以针对整体音频文件中提取到的特定的符合特征及差异特征,包括“方言口音”、“停顿节奏”、“错误发音”、“语音瑕疵”、“音色”、“共振峰频率”等。其实际可用的检查角度取决于评估需求所对应的案情内容以及语音同一性鉴定装置本身的指标。考察点的选取方式指考察点对不同的语音特征的覆盖情况,比如,考察点是否在整段语音内容中均匀分布、考察点是否完整覆盖了所有的语音特征等。通过改变上述参数,可以使得语音同一性鉴定装置在进行鉴定能力评估过程中,根据不同的难易程度来采用不同的实验样品。信道参数指不同的语音样本的来源类型信息,用于表征不同的音频文件,包括录音来源,具体指电话录音、视频录音、即时通信软件录音和采用录音设备直接录制人声等方式;录音方式指直接获取该音频文件的方式,比如提取软件缓存、采用
录音设备二次录制、通过软件接口进行读取等;录音参数指用于表征该音频文件的基本音频信息,包括声道参数、采样率、位数等。
61.在一种较优的实施例中,语音生成模块2包括:
62.样本采集子模块21,样本采集子模块21获取录音样本并存储至样本数据库中;
63.筛选子模块22,筛选子模块22根据目标参数自样本数据库中检索得到可用语音;
64.检查子模块23,检查子模块23连接筛选子模块22,检查子模块23根据评估需求对可用语音进行检查以生成语音数据。
65.具体地,针对现有技术中用于对语音同一性鉴定装置进行鉴定能力评估的样品主要由人工选取样品,其主观性较大,不能很好地覆盖评估需求的问题,本实施例中,通过设置样本采集子模块21预先获取多个不同的录音样本存储至样本数据库中。随后,通过筛选子模块22根据上述的目标参数从样本数据库中进行字段筛选,从而查找到符合要求的可用语音,并由检查子模块23对提取到的一组可用语音进行检查,从而将符合评估需求的可用语音作为语音数据输出,以此来实现较好的语音数据生成效果。
66.在一种较优的实施例中,检查子模块23包括:
67.匹配程度检查子模块231,匹配程度检查子模块231对评估需求进行解析,以得到评估需求所需的实验样品的考察点期望样本,并基于考察点期望样本对语音数据中的考察点数量和考察点类型进行评价以生成第一检查结果;
68.在实施过程中,考察点期望样本为基于评估需求确定的用于表征考察点覆盖情况的期望分数;匹配程度检查子模块231自语音数据中获取标注的若干项考察点,并分别对每一个考察点的考察点类型进行匹配,获得对应于每一个考察点的考察点权重,基于考察点权重和考察点数量来进行加权计算,将计算结果与期望分数进行比较,从而得到第一检查结果,以此来判断考察点的覆盖情况是否符合预期。
69.在实施过程中,为实现对语音同一性鉴定装置的较好的评估效果,本实施例中通过对评估需求进行解析,得到该语音同一性鉴定装置在实际鉴定过程中需要鉴定的检材的考察点情况,作为考察点期望样本,并针对语音数据中的考察点数量和考察点类型进行评价来考察检材和样本的考察点匹配程度。
70.考察点关联检查子模块232,考察点关联检查子模块232对评估需求进行解析以生成评估需求所需的实验样品的考察点分布,并基于考察点分布对考察点在语音数据中的分布情况进行评价以生成第二检查结果;
71.在实施过程中,考察点分布包括:在整段语音数据中考察点在不同的语音特征上的分布情况。在预先进行的难度参数设置过程中,已预先提取得到了考察点的检查角度和选取方式。基于这两点可对音频数据中的语音特征进行提取,从而获取音频数据中的语音特征分布情况,并基于语音特征分布情况和考察点进行比较,从而判断出考察点是否有效覆盖了鉴定过程中所需要的所有语音特征,以及,针对同一项语音特征选取的考察点的数量是否足够。
72.逻辑分析子模块233,逻辑分析子模块233对评估需求进行解析以生成评估需求所需的实验样品的简要案情信息,并基于简要案情信息对语音数据的语音内容进行逻辑关联性分析生成第三检查结果;
73.质量评价子模块234,质量评价子模块234分别连接匹配程度检查子模块 231、考
察点关联检查子模块232和逻辑分析子模块233,质量评价子模块234 根据第一检查结果、第二检查结果和第三检查结果剔除不符合评估需求的可用语音。
74.具体地,针对现有技术中用于对语音同一性鉴定装置进行鉴定能力评估的样品主要由人工选取样品,其主观性较大,不能很好地覆盖评估需求的问题,本实施例中,通过设置检查子模块23,并基于考察点的数量、考察点分布和评估需求中的逻辑关系进行进一步检查,从而判断出可用语音是否符合评估需求,以此来剔除掉不符合评估需求的可用语音生成语音数据。
75.在实施过程中,评估需求在生成过程中,会提取得到作业指南中的简要案情信息。通过预先训练一nlp识别模型对简要案情信息和通过识别得到的语音内容进行处理,从而分别得到简要案情信息的第一语义向量和语音内容的第二语义向量,通过比对第一语义向量和第二语义向量可实现对二者的逻辑关系的量化计算。
76.在一种较优的实施例中,质量评价子模块234对第一检查结果、第二检查结果和第三检查结果进行加权求和,并将计算值与预先设置的检查阈值进行比较以剔除不符合评估需求的可用语音;
77.质量评价子模块234还将第三检查结果与预先设置的逻辑检查阈值进行比较以剔除不符合逻辑关系的可用语音。
78.具体地,为实现对可用语音较好的检查效果,本实施例中,通过对第一检查结果、第二检查结果和第三检查结果进行量化处理,随后,通过分别设置不同的权重,并进行加权求和,来实现对可用语音的评分,并设置检查阈值将分值过低的可用语音剔除以此来实现较好的筛选效果。同时,还可进一步地设置逻辑检查阈值来判断可用语音与简要案情信息之间是否存在强逻辑关联性。其在实施过程中可体现为,对第一语义向量和第二语义向量计算夹角,并对夹角设置逻辑检查阈值,当夹角大于逻辑检查阈值时表明二者的逻辑关系较弱,不适宜作为语音数据输出。
79.在实施过程中,上述第一检查结果、第二检查结果和第三检查结果还可分别设置有不同的评分范围,每一个评分范围分别对应有不同的分数值。比如,第一检查结果可区分为:多、较多、较少、少,通过对每一个等级设置不同的分数来实现量化处理。
80.在一种较优的实施例中,样品输出模块3包括:
81.防串通子模块31,防串通子模块31连接语音生成模块2,防串通子模块31 接收语音数据,并分别对每一组语音数据添加唯一性标识生成唯一性语音;
82.复制子模块32,复制子模块32连接防串通子模块31,复制子模块32根据评估需求对唯一性语音复制后作为实验样品输出。
83.具体地,针对现有技术中用于对语音同一性鉴定装置进行评估的实验样品,其在制备过程中样本的复用性较差的问题,本实施例中,通过在样品输出模块3 中依次添加防串通子模块31和复制子模块32,由防串通子模块31在接收到的每一组语音数据中分别添加唯一性标识,从而实现不同的实验样品的唯一性,并由复制子模块32对添加了唯一性标识的唯一性语音复制后作为实验样品输出,进而使得同一组实验样品可以复用至多次评估过程中。
84.在一种较优的实施例中,样品输出模块3还包括:
85.校验子模块33,校验子模块33连接复制子模块32,校验子模块33分别获取唯一性
语音和实验样品并计算哈希值,用于验证唯一性语音和实验样品的一致性。
86.具体地,针对实验样品在复制过程中可能出现错误,进而使得样品的准确度下降的问题,本实施例中,通过在复制子模块32后设置校验子模块33,对复制后生成的唯一性语音进行哈希值校验,从而使得实验样品和唯一性语音具有较好的一致性。
87.在一个实施例中,采用sha256哈希值对唯一性语音和实验样品的一致性进行验证。
88.一种语音同一性鉴定装置的鉴定能力评估方法,采用上述的样品制备系统生成的实验样品,如图3所示,包括:
89.步骤s1:针对语音同一性鉴定装置,生成对应于语音同一性鉴定装置的评估需求;
90.步骤s2:基于评估需求生成实验样品;
91.步骤s3:采用实验样品对语音同一性鉴定装置的鉴定能力进行评估。
92.具体地,针对现有技术中对语音同一性鉴定装置的鉴定能力的评估过程,其采用的样品准确度较差的问题,本实施例中,通过对待评估的语音同一性鉴定装置确定评估过程中需要用到的作业指南,并基于作业指南生成评估需求,随后采用上述的样品制备系统基于评估需求制备得到实验样品,从而实现了较好的评估效果。
93.本发明的有益效果在于:通过在样品制备系统中添加参数生成模块对评估需求进行解析,并基于解析得到的目标参数依次构建语音数据、对语音数据进行处理后输出,使得实验样品能够更为符合对语音同一性鉴定装置的评估需求,能够更好地评估语音同一性鉴定装置的鉴定能力;同时,通过设置样品输出模块对语音数据进行处理并输出,实现了较好的样品复用性,且在这一过程中排除了人为因素的影响,提高了样品制备的质量。
94.以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献