一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种语义分析方法及装置与流程

2021-11-03 12:32:00 来源:中国专利 TAG:

技术特征:
1.一种语义分析方法,其特征在于,所述语义分析方法包括:s1:获取具有语义的文本信息;s2:对所述文本信息进行多种不同的分词方法分词操作,获得多种分词标签,若多种分词方法中的某一分词方法中的某一分词相对应的分词标签在所述某一分词方法之外的其他分词方法出现的次数大于第一预设数量,将所述某一分词和所述分词标签作为关键字字典元素保存至关键字字典中;s3:统计所述关键字字典元素在语义信息的单句中的次数,提取所述关键字字典元素出现的次数大于第二预设数量的单句作为语义摘要信息;以及s4:基于所述语义信息的单句的相似性度量,对语义信息的单句进行排序作为相似语义信息推荐顺序。2.根据权利要求1所述的语义分析方法,其特征在于,在步骤s1中,所述文本信息包括:从网页或文本中获取的文本信息、利用光学字符识别提取的图像中的文本信息、和/或利用语音识别技术转化获得的文本信息。3.根据权利要求1所述的语义分析方法,其特征在于,在步骤s2中,比较所述多种分词方法所使用词性标签,并按词性标签重复性降序排列所述多种分词方法,并从所述词性标签中选择第三预设数量的共同的标签标记,初始化关键字字典。4.根据权利要求3所述的语义分析方法,其特征在于,在步骤s2中,若多种分词方法中的某一分词方法中的某一分词相对应的分词标签在所述某一分词方法之外的其他分词方法出现的次数在所述第一预设数量和小于所述第一预设数量的第四预设数量之间时,对所述分词进行扩展,并且若扩展后的分词在所述某一分词方法之外的其他分词方法出现的次数大于所述第一预设数量,将所述扩展后的分词及其相对应的分词标签作为关键字字典元素保存至关键字字典中。5.根据权利要求1所述的语义分析方法,其特征在于,在步骤s3中,根据预设符号将所述语义信息分割成单句,所述预设符号包括句号、问号以及感叹号中的一种或多种。6.根据权利要求1所述的语义分析方法,其特征在于,在步骤s4中,对任意两个所述语义信息的单句生成相应关键字字典,求出两类关键字字典的杰卡德距离作为语义信息的单句的相似性值,基于所述语义信息的单句的相似性值,确定所述语义信息的单句的相似性度量。7.一种语义分析装置,其特征在于,包括:获取模块,用于获取具有语义的文本信息;操作模块,用于对所述文本信息进行多种不同的分词方法分词操作,获得多种分词标签,若多种分词方法中的某一分词方法中的某一分词相对应的分词标签在所述某一分词方法之外的其他分词方法出现的次数大于第一预设数量,将所述某一分词和所述分词标签作为关键字字典元素保存至关键字字典中;统计提取模块,用于统计所述关键字字典元素在语义信息的单句中的次数,提取所述关键字字典元素出现的次数大于第二预设数量的单句作为语义摘要信息;以及排序模块,用于基于所述语义信息的单句的相似性度量,对语义信息的单句进行排序作为相似语义信息推荐顺序。8.根据权利要求7所述的语义分析装置,其特征在于,所述文本信息包括:从网页或文
本中获取的文本信息、利用光学字符识别提取的图像中的文本信息、和/或利用语音识别技术转化获得的文本信息。9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的语义分析方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的语义分析方法的步骤。

技术总结
本发明提出了一种语义分析方法及装置,其中,本发明的语义分析方法包括:S1:获取具有语义的文本信息;S2:对所述文本信息进行多种不同的分词方法分词操作,获得多种分词标签,若多种分词方法中的某一分词方法中的某一分词相对应的分词标签在所述某一分词方法之外的其他分词方法出现的次数大于第一预设数量,将所述某一分词和所述分词标签作为关键字字典元素保存至关键字字典中;S3:统计所述关键字字典元素在语义信息的单句中的次数,提取所述关键字字典元素出现的次数大于第二预设数量的单句作为语义摘要信息;以及S4:基于所述语义信息的单句的相似性度量,对语义信息的单句进行排序作为相似语义信息推荐顺序。进行排序作为相似语义信息推荐顺序。进行排序作为相似语义信息推荐顺序。


技术研发人员:张煇 彭晋春 李龙 陈宏涛
受保护的技术使用者:山西长河科技股份有限公司
技术研发日:2021.08.04
技术公布日:2021/11/2
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献