技术特征:
1.一种基于精神卫生访谈信息实现长文本语音识别增强处理的方法,其特征在于,所述的方法包括以下步骤:(1)接收访谈语音信号,对信号进行预处理,输出特征数据;(2)构建ctc声学模型,将语音信息转化为基本音素信息;(3)通过语言模型和发音字典将基本音素信息解码为中文信息,获取抑郁症访谈文本。2.根据权利要求1所述的基于精神卫生访谈信息实现长文本语音识别增强处理的方法,其特征在于,所述的步骤(1)具体包括以下步骤:(1.1)接收访谈语音信号;(1.2)对语音信号进行处理;(1.3)对语音信号中的特征信息进行处理,输出特征数据。3.根据权利要求1所述的基于精神卫生访谈信息实现长文本语音识别增强处理的方法,其特征在于,所述的步骤(3)具体包括以下步骤:(3.1)通过抑郁症热词库构建针对医疗数据的transformer语言模型;(3.2)通过语言模型和发音字典将基本音素信息解码为中文信息。4.根据权利要求1所述的基于精神卫生访谈信息实现长文本语音识别增强处理的方法,其特征在于,所述的方法还包括调试语言模型的步骤,具体包括以下步骤:(4)根据抑郁症访谈文本,调整词汇出现的概率,更新抑郁症热词库。5.根据权利要求1所述的基于精神卫生访谈信息实现长文本语音识别增强处理的方法,其特征在于,所述的方法还包括预处理文本词汇的步骤,具体为:抑郁症智能诊断与病例系统预先设置常用的精神病文本和词汇,并设置词汇出现的概率。6.一种用于实现基于精神卫生访谈信息的长文本语音识别增强处理的装置,其特征在于,所述的装置包括:处理器,被配置成执行计算机可执行指令;存储器,存储一个或多个计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现权利要求1至5中任一项所述的基于精神卫生访谈信息实现长文本语音识别增强处理的方法的各个步骤。7.一种用于实现基于精神卫生访谈信息的长文本语音识别增强处理的处理器,其特征在于,所述的处理器被配置成执行计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现权利要求1至5中任一项所述的基于精神卫生访谈信息实现长文本语音识别增强处理的方法的各个步骤。8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述的计算机程序可被处理器执行以实现权利要求1至5中任一项所述的基于精神卫生访谈信息实现长文本语音识别增强处理的方法的各个步骤。
技术总结
本发明涉及一种基于精神卫生访谈信息实现长文本语音识别增强处理的方法,包括以下步骤:接收访谈语音信号,对信号进行预处理,输出特征数据;构建CTC声学模型,将语音信息转化为基本音素信息;通过语言模型和发音字典将基本音素信息解码为中文信息,获取抑郁症访谈文本。本发明还涉及一种用于实现基于精神卫生访谈信息的长文本语音识别增强处理的装置、处理器及其计算机可读存储介质。采用了本发明的基于精神卫生访谈信息实现长文本语音识别增强处理的方法、装置、处理器及其计算机可读存储介质,可以识别常见抑郁症句型,达到快速,准确识别症状词汇的效果,识别准确率达到90%以上。上。上。
技术研发人员:沈一峰 魏宇梅 盛钦润 李华芳
受保护的技术使用者:上海市精神卫生中心(上海市心理咨询培训中心)
技术研发日:2022.02.21
技术公布日:2022/5/31
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。