一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

佛学主题词识别方法、装置、设备及存储介质与流程

2021-07-06 18:47:00 来源:中国专利 TAG:主题词 人工智能 佛学 识别 装置

技术特征:

1.一种佛学主题词识别方法,其特征在于,所述佛学主题词识别方法包括:

获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;

根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;

对所述诵读语音进行语音识别,得到至少一个第二主题词;

基于所述第一主题词和所述第二主题词,创建主题词备选集;

将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;

若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。

2.根据权利要求1所述的佛学主题词识别方法,其特征在于,所述根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词包括:

根据预设的佛学知识图谱,对所述佛经内容进行分词识别,得到分词后的文本数据;

利用预设的词频计算工具,对所述分词后的文本数据中的词语进行词频统计计算,得到词频排序;

基于所述词频排序,选择排序靠前的词语进行主题词识别,得到至少一个第一主题词。

3.根据权利要求1所述的佛学主题词识别方法,其特征在于,所述对所述诵读语音进行语音识别,得到至少一个第二主题词包括:

对所述诵读语音进行语音识别,得到与所述诵读语音相对应的语音波形;

根据所述语音波形,确定所述诵读语音中各个字符的语调特征,其中所述各个字符的语调特征通过该字符所包含的音素的频谱特征表征;

基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量;

基于预设的各字符的语调变化特征量与所述佛经内容的映射关系,根据各个字符的语调变化特征量,从所述佛经内容中查找到至少一个第二主题词。

4.根据权利要求3所述的佛学主题词识别方法,其特征在于,所述基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量包括:

对所述选择的人物语音样本进行语音识别,得到与所述人物语音样本对应的语音样本波形;

利用预设的语音识别声学模型,对所述语音样本波形进行识别,得到所述人物语音样本中针对于人物预定的音素的频谱特征;

将所确定的针对于所述人物预定的音素的频谱特征作为发音特征;

基于所述发音特征和所述语调特征,确定所述诵读语音中各个字符的语调变化特征量。

5.根据权利要求1-4中任一项所述的佛学主题词识别方法,其特征在于,所述将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果包括:

将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,利用所述主题词识别模型中预设的语体属性划分工具,对所述主题词备选集进行语体属性划分,得到非通用词汇和通用词汇,并将所述通用词汇添加到所述过滤词表中;

基于所述主题词识别模型,对所述非通用词汇进行主题词识别,得到识别结果。

6.根据权利要求5中所述的佛学主题词识别方法,其特征在于,所述基于所述主题词识别模型,对所述非通用词汇进行主题词识别,得到识别结果包括:

对非通用词汇进行分词处理,得到分词后的词汇;

基于所述主题词识别模型中预设的图排序模型算法,根据所述分词后的词汇,构建一个字与词的连接矩阵;

基于预设的字与词的权重,对所述字与词的连接矩阵中的字与词进行权值计算,得到一个权值排序;

基于所述权值排序,进行主题词识别,得到识别结果。

7.根据权利要求1-4中任一项所述的佛学主题词识别方法,其特征在于,在预设一个过滤词表,将所述主题词备选集和所述过滤词表输入至预设的主题词识别模型进行主题词识别处理,生成最终的主题词之前,还包括:

获取通用词汇,并基于所述通用词汇创建过滤词表;

从预设的历史文本中获取相应的文本内容和主题词数据;

将所述过滤词表、所述文本内容和所述主题词数据作为训练语料,对主题词识别工具进行训练,得到主题词识别模型。

8.一种佛学主题词识别装置,其特征在于,所述佛学主题词识别装置包括:

获取模块,用于获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;

分词识别模块,用于根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;

语音识别模块,用于对所述诵读语音进行语音识别,得到至少一个第二主题词;

主题词备选集创建模块,用于基于所述第一主题词和所述第二主题词,创建主题词备选集;

主题词识别模块,用于将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;

主题词输出模块,用于若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。

9.一种佛学主题词识别设备,其特征在于,所述佛学主题词识别设备包括:

存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;

所述至少一个处理器调用所述存储器中的所述指令,以使得所述佛学主题词识别设备执行如权利要求1-7中任一项所述的佛学主题词识别方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述的佛学主题词识别方法的步骤。


技术总结
本发明涉及人工智能领域,公开了一种佛学主题词识别方法、装置、设备及存储介质,该方法包括:通过获取待识别的佛经内容,并根据佛经内容得到诵读语音,对佛经内容进行分词识别,得到第一主题词,对诵读语音进行语音识别得到第二主题词,并将第一主题词和第二主题词汇集成主题词备选集,经由主题词识别装置进行主题词识别得到识别结果,根据识别结果判断是否满足佛学主题词组合规则,最后输出满足于佛学主题词组合规则的主题词;本发明从语音识别维度和模型识别维度上解决了佛学主题词的识别问题,满足了用户所需,并且识别出的主题词更具精准性。此外,本发明还涉及区块链技术,佛学内容和主题词可存储于区块链中。

技术研发人员:郝凯风;杨艾琳;李剑锋
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2021.03.24
技术公布日:2021.07.06
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜