一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种特定领域内的智能问答机器人系统的制作方法

2022-11-30 10:18:14 来源:中国专利 TAG:


1.本发明涉及智能问答技术领域,具体为一种特定领域内的智能问答机器人系统。


背景技术:

2.随着资讯的发展,信息呈现爆炸式增长,现有的电话问答方式无法展示电子文档,过多依赖人工进行回答,且人工回答因为人员对所提问题的相关知识了解程度参差不齐造成回答的认可度相差较大。
3.现有的检索相关信息太多,用户很难快速准确地定位到所需的信息。同时很难以几个关键词的逻辑组合来表达清楚用户的检索意图;以关键词为基础的索引匹配算法尽管简单易行,毕竟其停留在语言的表层而没有触及语义,因此效果很难进一步提高,从而使得问答系统的回答准确度和正确性较低。


技术实现要素:

4.针对现有技术的不足,本发明提供了一种特定领域内的智能问答机器人系统,解决了上述背景技术中提出的问题。
5.为实现以上目的,本发明通过以下技术方案予以实现:一种特定领域内的智能问答机器人系统,包括浏览器、语句处理模块、数据处理模块、信息检索匹配模块与数据库管理系统;
6.所述浏览器,用于对提问问题答案进行搜索;
7.所述语句处理模块,用于系统对提问语句进行分词处理;
8.所述信息检索匹配模块,用于通过对问句进行分词处理提取出来的关键词,在答案集合中查找相关的答案,并返回一个最相似的结果;
9.所述数据处理模块,用于对最相似的结果进行处理后生成最终结果;
10.所述数据库管理系统,用于储存有问答系统中的问题以及答案。
11.可选的,所述语句处理模块包括分词处理单元、关键词提取单元与语义匹配单元,所述分词处理单元,用于系统对提问语句进行分词处理;所述关键词提取单元,用于根据对问句的处理,获得关键词索引集合,确定问句的类型,根据问句的类型,设置关键词索引的权值;所述语义匹配单元,用于中文问答系统时,对问句进行词性标注。
12.可选的,所述数据处理模块包括数据持久化单元,所述数据持久化单元,用于对得到的最相似的结果答案进行处理。
13.可选的,所述信息检索匹配模块包括关键词查询单元、答案获取单元与相关问题获取单元,所述关键词查询单元,用于通过提取的问题关键词信息进行检索;所述答案获取单元,用于获得通过问题关键词信息进行检索得到的答案;所述相关问题获取单元,用于推荐出与该问题相关的问题和答案。
14.可选的,所述语义匹配单元用于中文问答系统时,对问句进行词性标注。
15.可选的,所述信息检索匹配模块在根据该关键词信息检索出答案,同时通过关键
词查询出与该关键词相关的问题和答案的过程中通过对词语及语句的相似度计算,关键词的权值比较等方法进行使用,方能实现信息检索匹配模块的功能。
16.可选的,所述词语及语句的相似度计算采用余弦相似度算法,通过计算两个向量的夹角余弦值来评估他们的相似度。
17.可选的,多个所述关键词时前面的词的权重大于后面的词。
18.可选的,所述对本系统的问答信息范围进行组织管理,本系统中的每一个问题都是关于此特定领域项目的,对答案的组织管理,可以提高对问题的检索速度和准确定位。
19.本发明提供了一种特定领域内的智能问答机器人系统,具备以下有益效果:
20.该特定领域内的智能问答机器人系统,通过互联网实现线上问答,电子文件的展示,减少了咨询等待时间,提高了便捷性,同时通过对问句进行词性标注,从而提高问答系统的回答准确度和正确性,系统的问题和答案库也随着用户的问答活动不断丰富和完善。系统会提供越来越准确的答案给用户。
附图说明
21.图1为本发明模块结构示意图;
22.图2为本发明流程图。
23.图中:1、浏览器;2、语句处理模块;3、分词处理单元;4、关键词提取单元;5、语义匹配单元;6、数据处理模块;7、数据持久化单元;8、信息检索匹配模块;9、关键词查询单元;10、答案获取单元;11、相关问题获取单元;12、数据库管理系统。
具体实施方式
24.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
25.请参阅图1至图2,本发明提供一种技术方案:一种特定领域内的智能问答机器人系统,包括浏览器1、语句处理模块2、数据处理模块6、信息检索匹配模块8与数据库管理系统12;
26.浏览器1,用于对提问问题答案进行搜索;
27.语句处理模块2,用于系统对提问语句进行分词处理;
28.信息检索匹配模块8,用于通过对问句进行分词处理提取出来的关键词,在答案集合中查找相关的答案,并返回一个最相似的结果;
29.数据处理模块6,用于对最相似的结果进行处理后生成最终结果;
30.数据库管理系统12,用于储存有问答系统中的问题以及答案。
31.进一步,语句处理模块2包括分词处理单元3、关键词提取单元4与语义匹配单元5,分词处理单元3,用于系统对提问语句进行分词处理;关键词提取单元4,用于根据对问句的处理,获得关键词索引集合,确定问句的类型,根据问句的类型,设置关键词索引的权值;语义匹配单元5,用于中文问答系统时,对问句进行词性标注,因对用户提出的问题进行意义理解是问答系统的基础,系统首先对提问语句分词处理,分词处理后的结果直接决定着后面的答案检索、匹配等功能的精确性。
32.进一步,数据处理模块6包括数据持久化单元7,数据持久化单元7,用于对得到的
最相似的结果答案进行处理。
33.进一步,信息检索匹配模块8包括关键词查询单元9、答案获取单元10与相关问题获取单元11,关键词查询单元9,用于通过提取的问题关键词信息进行检索;答案获取单元10,用于获得通过问题关键词信息进行检索得到的答案;相关问题获取单元11,用于推荐出与该问题相关的问题和答案。
34.进一步,语义匹配单元5用于中文问答系统时,对问句进行词性标注的过程中,由于中文语句不像英文语句那样可以通过空格来分解单词,因此对中文语句进行分词提供常用的词库进行搜索匹配,从而能够达到较好的分词效果。
35.进一步,信息检索匹配模块8在根据该关键词信息检索出答案,同时通过关键词查询出与该关键词相关的问题和答案的过程中通过对词语及语句的相似度计算,关键词的权值比较等方法进行使用,方能实现信息检索匹配模块8的功能。
36.进一步,词语及语句的相似度计算采用余弦相似度算法,通过计算两个向量的夹角余弦值来评估他们的相似度。
37.进一步,多个关键词时前面的词的权重大于后面的词。
38.进一步,对本系统的问答信息范围进行组织管理,本系统中的每一个问题都是关于此特定领域项目的,对答案的组织管理,可以提高对问题的检索速度和准确定位。
39.综上,该特定领域内的智能问答机器人系统,使用时,用户提出问题,然后通过分词处理单元3对提问语句进行分词处理,接着根据对问句的处理,获得关键词索引集合,确定问句的类型,根据问句的类型,设置关键词索引的权值,接着对问句进行词性标注,通过对问句进行分词处理提取出来的关键词,从问题集合中查找相关的问题,在答案集合中查找相关的答案,并返回一个最相似的结果,对最相似的结果进行处理后生成最终结果,然后将答案进行输出,问题库中存储有此领域的不同问题;答案库中存储有此领域不同问题的答案,随着问答的进行,问题库和答案库也随着用户的问答活动不断丰富和完善。
40.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献