一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

问答对评分方法、装置、设备及存储介质与流程

2021-10-20 00:00:00 来源:中国专利 TAG:答对 数据处理 装置 评分 方法


1.本发明涉及数据处理领域,尤其涉及一种问答对评分方法、装置、设备 及存储介质。


背景技术:

2.目前,针对于问答对的评分系统已经渗透到了各行各业。例如知识论坛 等领域都可以采用对于问答对的评分系统来对其中的问答对进行评分。但是 由于某些特殊领域专业知识晦涩难懂,所以针对于问答对的评分系统不能很 好的运用于所有领域。
3.现有的常规评分系统无法很好的评估语义,且常规评分系统所包含的评 分特征较为有限且无相关特殊领域特定知识,无法更完整评估答案的质量, 常规评分系统也未考虑问题与答案、答案与答案之间的关联性,导致评分结 果的准确度不高、可靠性不强。


技术实现要素:

4.本发明的主要目的在于解决现有技术中评分方案忽略了语义和问题与答 案的相关性导致评分结果准确度不高、可靠性不强的技术问题。
5.本发明第一方面提供了一种问答对评分方法,包括:
6.获取待评分的问答对文本,其中所述问答对文本包括问题文本和答案文 本;
7.根据预设的文本评分特征分类规则,分别提取所述问答对文本中问题文 本和答案文本的文本特征信息,得到至少一个文本特征信息;
8.利用预设的评分模型,对所述至少一个文本特征信息进行初步评分,得 到初步特征评分;
9.根据所述文本特征信息,对所述待评分的问答对文本的问答相关性进行 评估,得到评估结果;
10.将所述初步特征评分和所述评估结果输入至所述评分模型中进行二次评 分,输出最终评分。
11.可选的,在本发明第一方面的第一种实现方式中,所述根据预设的文本 评分特征分类规则,分别提取所述问答对文本中问题文本和答案文本的文本 特征信息,得到至少一个文本特征信息包括:
12.基于预设的分词规则,对所述问答对文本中问题文本和答案文本分别进 行分词处理,得到分词序列;
13.利用预设的词向量生成模型,对所述分词序列进行向量化处理,得到向 量矩阵;
14.从所述向量矩阵中提取至少一个文本特征信息。
15.可选的,在本发明第一方面的第二种实现方式中,所述利用预设的评分 模型,对所述至少一个文本特征信息进行初步评分,得到初步特征评分包括:
16.提取所述至少一个文本特征信息中的关键词特征,对所述关键词特征进 行相似度特征计算,得到关键词相似度特征参数;
17.提取所述至少一个文本特征信息中的语义特征,对所述语义特征进行相 似度特征计算,得到语义相似度特征参数;
18.将所述关键词相似度特征参数和语义相似度特征参数输入至所述评分模 型中,进行初步评分,得到初步特征评分。
19.可选的,在本发明第一方面的第三种实现方式中,所述提取所述至少一 个文本特征信息中的关键词特征,对所述关键词特征进行相似度特征计算, 得到关键词相似度特征参数包括:
20.基于预设的词频

逆文档算法,从所述问答对文本中问题文本的文本特征 信息中提取出至少一个第一关键词;
21.基于预设的词频

逆文档算法,从所述问答对文本中答案文本的文本特征 信息中提取出至少一个第二关键词;
22.分别提取所述至少一个第一关键词和所述至少一个第二关键词的关键词 特征,得到第一关键词特征和第二关键词特征;
23.利用预设的关键词特征相似度算法,计算所述第一关键词特征和第二关 键词特征的相似度特征,得到所述问答对文本中的关键词相似度特征参数。
24.可选的,在本发明第一方面的第四种实现方式中,所述提取所述至少一 个文本特征信息中的语义特征,对所述语义特征进行相似度特征计算,得到 语义相似度特征参数包括:
25.利用预设的卷积神经网络和双向长短期记忆网络,对所述文本特征信息 进行词汇级别特征提取,得到词汇级别特征;
26.对所述词汇级别特征引入注意力机制,得到词汇级别语义特征;
27.基于所述词汇级别语义特征,在语义空间计算语义相似度,得到语义相 似度特征参数。
28.可选的,在本发明第一方面的第五种实现方式中,所述根据所述文本特 征信息,对所述待评分的问答对文本的问答相关性进行评估,得到评估结果 包括:
29.提取所述文本特征信息中的至少一个特征参数;
30.基于预设的切词处理规则,对所述待评分问答对文本进行切词处理,得 到特征分词;
31.基于预设的特征参数和特征分词的权重,对所述特征参数和特征分词进 行权值计算,得到关于所述待评分的问答对文本中问题与对应的答案的相关 性的评估结果。
32.可选的,在本发明第一方面的第五种实现方式中,在将所述特征评分和 所述评估结果输入至所述评分模型中进行二次评分,输出最终评分之前,还 包括:
33.获取相关知识和技术;
34.将所述相关知识和技术以及所述文本特征信息作为训练语料;
35.利用预设的评分工具对所述训练语料进行学习,得到评分模型。
36.本发明第二方面提供了一种问答对评分装置,包括:
37.获取模块,用于获取待评分的问答对文本,其中所述问答对文本包括问 题文本和答案文本;
38.提取模块,用于根据预设的文本评分特征分类规则,分别提取所述问答 对文本中
问题文本和答案文本的文本特征信息,得到至少一个文本特征信息;
39.初步评分模块,用于利用预设的评分模型,对所述至少一个文本特征信 息进行初步评分,得到初步特征评分;
40.评估模块,用于根据所述文本特征信息,对所述待评分的问答对文本的 问答相关性进行评估,得到评估结果;
41.二次评分模块,用于将所述初步特征评分和所述评估结果输入至所述评 分模型中进行二次评分,输出最终评分。
42.可选的,在本发明第二方面的第一种实现方式中,所述提取模块具体用 于:
43.基于预设的分词规则,对所述问答对文本中问题文本和答案文本分别进 行分词处理,得到分词序列;
44.利用预设的词向量生成模型,对所述分词序列进行向量化处理,得到向 量矩阵;
45.从所述向量矩阵中提取至少一个文本特征信息。
46.可选的,在本发明第二方面的第二种实现方式中,所述初步评分模块包 括:
47.关键词相似度特征计算单元,用于提取所述至少一个文本特征信息中的 关键词特征,对所述关键词特征进行相似度特征计算,得到关键词相似度特 征参数;
48.语义相似度特征计算单元,用于提取所述至少一个文本特征信息中的语 义特征,对所述语义特征进行相似度特征计算,得到语义相似度特征参数;
49.初步评分单元,用于将所述关键词相似度特征参数和语义相似度特征参 数输入至所述评分模型中,进行初步评分,得到初步特征评分。
50.可选的,在本发明第二方面的第三种实现方式中,所述关键词相似度特 征计算单元具体用于:
51.基于预设的词频

逆文档算法,从所述问答对文本中问题文本的文本特征 信息中提取出至少一个第一关键词;
52.基于预设的词频

逆文档算法,从所述问答对文本中答案文本的文本特征 信息中提取出至少一个第二关键词;
53.分别提取所述至少一个第一关键词和所述至少一个第二关键词的关键词 特征,得到第一关键词特征和第二关键词特征;
54.利用预设的关键词特征相似度算法,计算所述第一关键词特征和第二关 键词特征的相似度特征,得到所述问答对文本中的关键词相似度特征参数。
55.可选的,在本发明第二方面的第四种实现方式中,所述语义相似度特征 计算单元具体用于:
56.利用预设的卷积神经网络和双向长短期记忆网络,对所述文本特征信息 进行词汇级别特征提取,得到词汇级别特征;
57.对所述词汇级别特征引入注意力机制,得到词汇级别语义特征;
58.基于所述词汇级别语义特征,在语义空间计算语义相似度,得到语义相 似度特征参数。
59.可选的,在本发明第二方面的第五种实现方式中,所述评估模块具体用 于:
60.提取所述文本特征信息中的至少一个特征参数;
61.基于预设的切词处理规则,对所述待评分问答对文本进行切词处理,得 到特征分
词;
62.基于预设的特征参数和特征分词的权重,对所述特征参数和特征分词进 行权值计算,得到关于所述待评分的问答对文本中问题与对应的答案的相关 性的评估结果。
63.可选的,在本发明第二方面的第六种实现方式中,所述问答对评分装置 还包括模型构建模块,所述模型构建模块具体用于:
64.获取相关知识和技术;
65.将所述相关知识和技术以及所述文本特征信息作为训练语料;
66.利用预设的评分工具对所述训练语料进行学习,得到评分模型。
67.本发明第三方面提供了一种问答对评分设备,包括:存储器和至少一个 处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中 的所述指令,以使得所述问答对评分设备执行上述的问答对评分方法的步骤。
68.本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存 储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的问答 对评分方法的步骤。
69.本发明提供的技术方案中,通过获取待评分的问答对文本,其中问答对 文本包括问题文本和答案文本;根据预设的文本文本特征信息分类规则,分 别提取问答对文本中问题文本和答案文本的文本特征信息,得到至少一个文 本特征信息;利用预设的评分模型,对至少一个文本特征信息进行初步评分, 得到初步特征评分;根据文本特征信息,对待评分的问答对文本的问答相关 性进行评估,得到评估结果;将初步特征评分和评估结果输入至评分模型中 进行二次评分,输出最终评分。本发明提供的技术方案通过量化评分解决了 多答案选择问题,同时完善了评分体系,并且对问答对中答案的质量进行了 有效评估。
附图说明
70.图1为本发明实施例中问答对评分方法的第一个实施例示意图;
71.图2为本发明实施例中问答对评分方法的第二个实施例示意图;
72.图3为本发明实施例中问答对评分方法的第三个实施例示意图;
73.图4为本发明实施例中问答对评分方法的第四个实施例示意图;
74.图5为本发明实施例中问答对评分装置的一个实施例示意图;
75.图6为本发明实施例中问答对评分装置的另一个实施例示意图;
76.图7为本发明实施例中问答对评分设备的一个实施例示意图。
具体实施方式
77.本发明实施例提供了一种问答对评分方法、装置、设备及存储介质,通 过获取待评分的问答对文本,其中问答对文本包括问题文本和答案文本;根 据预设的文本评分特征分类规则,分别提取问答对文本中问题文本和答案文 本的文本特征信息,得到至少一个文本特征信息;利用预设的评分模型,对 至少一个文本特征信息进行初步评分,得到初步特征评分;根据文本特征信 息,对待评分的问答对文本的问答相关性进行评估,得到评估结果;将初步 特征评分和评估结果输入至评分模型中进行二次评分,输出最终评分。本发 明提供的技术方案通过量化评分解决了多答案选择问题,同时完善了评分体 系,并且对问答对中答案的质量进行了有效评估。
78.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第 三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的 顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这 里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外, 术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含 了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出 的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、 产品或设备固有的其它步骤或单元。
79.为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本 发明实施例中问答对评分方法的第一个实施例包括:
80.101,获取待评分的问答对文本,其中问答对文本包括问题文本和答案文 本;
81.获取用户提供的所需要被评分的问答对文本,其中,获取到的问答对文 本中包含有问题文本和答案文本。
82.102,根据预设的文本评分特征分类规则,分别提取问答对文本中问题文 本和答案文本的文本特征信息,得到至少一个文本特征信息;
83.获取到待评分的问答对文本之后,分别对待评分的问答对文本中的问题 文本和答案文本进行切词处理,去除停用词、重复词、标点符号和特殊符号, 得到问题文本和答案文本的词汇数据。然后根据预设的文本评分特征分类规 则,分别提取问题文本和答案文本的词汇数据中包含的文本特征信息,问题 文本和答案文本的词汇数据中都至少包含一个文本特征信息,其中,对文本 内容进行分词处理属于现有技术,在此不再赘述。
84.103,利用预设的评分模型,对至少一个文本特征信息进行初步评分,得 到初步特征评分;
85.将提取到的至少一个文本特征信息输入至预先设置好的评分模型中,利 用评分模型中的对于文本特征的评分规则,对文本特征信息进行初步评分, 输出一个初步特征评分。
86.104,根据文本特征信息,对待评分的问答对文本的问答相关性进行评估, 得到评估结果;
87.根据问题文本对应的文本特征信息和答案文本所对应的文本特征信息, 根据预设的权重计算公式,计算问题文本所包含的每个文本特征信息和答案 文本所包含的每个文本特征信息的权重,根据所计算出的权重,利用预设的 加权公式进行相关性的计算,以此判断该问答对文本中问题与答案的相关性, 得到一个评估结果。其中,预设的权重计算公式和加权公式可以根据实际情 况进行设定,在此不做赘述。
88.105,将初步特征评分和评估结果输入至评分模型中进行二次评分,输出 最终评分。
89.将得到的初步特征评分和对于问答相关性的评估结果输入至评分模型 中,利用此评分模型进行二次评分,该二次评分过程主要是利用预设的初步 特征评分和评估结果的权重进行权值计算,将计算出的权值相加,由此得到 评分结果,并将此评分结果作为最终评分。其中,预设的初步特征评分和评 估结果的权重可以根据实际情况进行设定,在此不做赘述。
90.在本发明实施例中,通过获取待评分的问答对文本;根据预设的文本评 分特征分
类规则,分别提取问答对文本中问题文本和答案文本的文本特征信 息,得到至少一个文本特征信息;利用预设的评分模型,对至少一个文本特 征信息进行初步评分,得到初步特征评分;根据文本特征信息,对待评分的 问答对文本的问答相关性进行评估,得到评估结果;将初步特征评分和评估 结果输入至评分模型中进行二次评分,输出最终评分。本实施例通过量化评 分解决了多答案选择问题,同时完善了评分体系,并且对问答对中答案的质 量进行了有效评估。
91.请参阅图2,本发明实施例中问答对评分方法的第二个实施例包括:
92.201,获取待评分的问答对文本,其中问答对文本包括问题文本和答案文 本;
93.获取用户提供的所需要被评分的问答对文本,其中,获取到的问答对文 本中包含有问题文本和答案文本。
94.202,基于预设的分词规则,对问答对文本中问题文本和答案文本分别进 行分词处理,得到分词序列;
95.根据预设的分词规则,对所获取的待评分的问答对文本中的问题文本和 答案文本分别进行分词处理,去除停用词、重复词、标点符号和特殊符号, 对应得到两组分词序列,其中两组分词序列的长度一致。
96.203,利用预设的词向量生成模型,对分词序列进行向量化处理,得到向 量矩阵;
97.利用预先设置好的词向量生成模型,对得到的分词序列进行向量化处理, 得到向量矩阵,其中,向量化处理就是利用词向量生成模型把一个词表示成 一个向量,然后利用表示出的向量构建一个向量矩阵。
98.其中,词向量生成模型包括有word2vec模型等,可以根据实际情况选择 相应的词向量生成模型,在本实施例中以word2vec模型为例,其具体过程为: 通过训练将每个词映射成k维实数向量(k一般为模型中的超参数)。其采 用一个三层的神经网络,输入层

隐层

输出层。有个核心的技术是根据词频用 哈夫曼编码,使得所有词频相似的词隐藏层激活的内容基本一致,出现频率 越高的词语,他们激活的隐藏层数目越少,这样有效的降低了计算的复杂度。 其中,利用词向量生成模型对分词序列进行向量化处理属于现有技术,在此 不做赘述。
99.204,从向量矩阵中提取至少一个文本特征信息,其中文本特征信息中包 含有关键词特征和语义特征;
100.根据词向量生成模型将分词序列进行向量化处理,生成一个向量矩阵, 其向量矩阵存在的向量空间内包含有文本特征信息,从中提取出至少一个文 本特征信息,其中文本特征信息中包含有关键词特征和语义特征。
101.205,提取至少一个文本特征信息中的关键词特征,对关键词特征进行相 似度特征计算,得到关键词相似度特征参数;
102.从问答对文本的问题文本和答案文本中的文本特征信息中提取出关键词 特征,基于预设的关键词特征相似度计算公式,对提取出的问题文本的关键 词特征和答案文本的关键词特征进行相似度特征计算,得到关键词相似度特 征参数。其中,关键词特征相似度计算公式可以根据实际情况进行设定,在 此不做赘述。
103.206,提取至少一个文本特征信息中的语义特征,对语义特征进行相似度 特征计算,得到语义相似度特征参数;
104.从问答对文本的问题文本和答案文本中的文本特征信息中提取出语义特 征,利用词向量生成模型将分词序列向量化之后,得到的向量矩阵所在的向 量空间上的相似度可以用来表示文本语义上的相似,即通过词之间的距离(比 如cosine相似度、欧氏距离等)来判断它们之间的语义相似度。然后基于预 设的语义特征相似度计算公式,对提取出的问题文本的语义特征和答案文本 的语义特征进行相似度特征计算,得到语义相似度特征参数。其中语义特征 相似度计算公式可以根据实际情况进行设定,在此不做赘述。
105.207,将关键词相似度特征参数和语义相似度特征参数输入至评分模型 中,进行初步评分,得到初步特征评分;
106.将待评分的问答对文本中问题文本和答案文本的关键词相似度特征参数 和语义相似度特征参数输入至评分模型中,利用评分模型中设置的对于相似 度特征参数的评分规则,对关键词相似度特征参数和语义相似度特征参数进 行评分,输出一个初步特征评分。其中,评分模型中设置的相似度特征参数 评分规则可以根据实际情况进行设定,在此不做赘述。
107.208,根据文本特征信息,对待评分的问答对文本的问答相关性进行评估, 得到评估结果;
108.根据提取出的问题文本的语义特征和答案文本的文本特征信息,利用预 设的权重计算公式,计算问题文本所包含的每个文本特征信息和答案文本所 包含的每个文本特征信息的权重,根据所计算出的权重,利用预设的加权公 式进行相关性的计算,以此判断该问答对文本中问题与答案的相关性,得到 一个评估结果。
109.209,将初步特征评分和评估结果输入至评分模型中进行二次评分,输出 最终评分。
110.将得到的初步特征评分和对于问答相关性的评估结果输入至评分模型 中,利用此评分模型进行二次评分,由此得到评分结果,并将此评分结果作 为最终评分。
111.本发明实施例,通过提取问答对文本的文本特征信息中的关键词特征和 语义特征,并进行相似度特征计算,得到对应的相似度特征参数,利用此相 似度特征参数和评分模型进行初步评分,可以得到初步特征评分。该实施例 通过量化评分解决了多答案选择问题,提高了评分的准确度。
112.请参阅图3,本发明实施例中问答对评分方法的第三个实施例包括:
113.301,获取待评分的问答对文本,其中问答对文本包括问题文本和答案文 本;
114.获取用户提供的所需要被评分的问答对文本,其中,获取到的问答对文 本中包含有问题文本和答案文本。
115.302,根据预设的文本评分特征分类规则,分别提取问答对文本中问题文 本和答案文本的文本特征信息,得到至少一个文本特征信息;
116.获取到待评分的问答对文本之后,分别对待评分的问答对文本中的问题 文本和答案文本进行切词处理,得到问题文本和答案文本的词汇数据。然后 根据预设的文本评分特征分类规则,分别提取问题文本和答案文本的词汇数 据中包含的文本特征信息,其中,问题文本和答案文本的词汇数据中都至少 包含一个文本特征信息。
117.303,基于预设的词频

逆文档算法,从问答对文本中问题文本的文本特征 信息中提取出至少一个第一关键词;
118.基于预设的词频

逆文档算法,从问答对文本中问题文本的文本特征信息 中提取出至少一个关键词。其具体过程是,利用词频

逆文档算法,统计一个 词在问题文本中出现的次数。利用词频

逆文档算法进行频次计算的过程包含 两个步骤,一个步骤是统计一个词在整个问题文本中出现的频次,另一个步 骤是统计一个词在文本集的多少个文本中出现。经此计算之后可以得到一个 词频

逆文档值,根据问题文本中各个词的词频

逆文档值的排序来提取关键 词,并作为第一关键词。
119.304,基于预设的词频

逆文档算法,从问答对文本中答案文本的文本特征 信息中提取出至少一个第二关键词;
120.从答案文本中提取出关键词的步骤跟上一步骤的从问题文本中提取关键 词的步骤一致,故在此不做赘述。
121.305,分别提取至少一个第一关键词和至少一个第二关键词的关键词特 征,得到第一关键词特征和第二关键词特征;
122.根据所得到的第一关键词和第二关键词,对该第一关键词和第二关键词 做向量化处理,从向量空间内提取出相对应的特征向量作为关键词特征,从 而得到第一关键词特征和第二关键词特征。
123.306,利用预设的关键词特征相似度算法,计算第一关键词特征和第二关 键词特征的相似度特征,得到问答对文本中的关键词相似度特征参数;
124.利用预设的关键词特征相似度算法中的关键词特征相似度计算公式,对 提取出第一关键词特征和第二关键词特征进行相似度特征计算,得到关键词 相似度特征参数。其中,关键词特征相似度计算公式可以根据实际情况进行 设定,在此不做赘述。
125.307,利用预设的卷积神经网络和双向长短期记忆网络,对文本特征信息 进行词汇级别特征提取,得到词汇级别特征;
126.利用预设的卷积神经网络对文本特征信息进行词汇级别的特征提取,得 到卷积神经网络层的词汇级别特征;利用预设的双向长短期记忆网络对文本 特征信息进行词汇级别的特征提取,得到双向长短期记忆网络层的词汇级别 特征。将卷积神经网络层的词汇级别特征和双向长短期记忆网络层的词汇级 别特征汇进行汇集,得到词汇级别特征。
127.308,对词汇级别特征引入注意力机制,得到词汇级别语义特征;
128.对词汇级别特征引入注意力机制,得到词汇级别的语义向量表示,从该 词汇级别的语义向量表示中提取语义特征,得到词汇级别语义特征。
129.309,基于词汇级别语义特征,在语义空间计算语义相似度,得到语义相 似度特征参数;
130.获取到词汇级别语义特征之后,将其置于语义空间中,并在语义空间内 计算语义相似度,即通过词之间的距离(比如cosine相似度、欧氏距离等) 来判断它们之间的语义相似度,从而得到语义相似度特征参数。
131.310,将关键词相似度特征参数和语义相似度特征参数输入至评分模型 中,进行初步评分,得到初步特征评分;
132.将关键词相似度特征参数和语义相似度特征参数输入至评分模型中,利 用评分模型中设置的对于相似度特征参数的评分规则,对关键词相似度特征 参数和语义相似度特征参数进行评分,输出一个初步特征评分。
133.311,根据文本特征信息,对待评分的问答对文本的问答相关性进行评估, 得到评估结果;
134.根据提取出的问题文本的语义特征和答案文本的文本特征信息,利用预 设的权重计算公式,计算问题文本所包含的每个文本特征信息和答案文本所 包含的每个文本特征信息的权重,根据所计算出的权重,利用预设的加权公 式进行相关性的计算,以此判断该问答对文本中问题与答案的相关性,得到 一个评估结果。
135.312,将初步特征评分和评估结果输入至评分模型中进行二次评分,输出 最终评分。
136.将得到的初步特征评分和对于问答相关性的评估结果输入至评分模型 中,利用此评分模型进行二次评分,由此得到评分结果,并将此评分结果作 为最终评分。
137.本发明实施例中,通过预设的词频

逆文档算法从问答对文本中提取出相 应的关键词,然后利用提取出的关键词进行特征提取,并计算关键词特征相 似度,得到关键词相似度特征参数,从文本特征信息中提取词汇级别特征, 并引入注意力机制,得到词汇级别语义特征,对其计算语义相似度,得到语 义相似度特征参数,并将关键词相似度特征参数和语义相似度特征参数输入 至评分模型中进行初步评分,可以得到初步特征评分。该实施例提高了评分 的准确度,使其得到的评分结果更具可靠性。
138.请参阅图4,本发明实施例中问答对评分方法的第四个实施例包括:
139.401,获取待评分的问答对文本,其中问答对文本包括问题文本和答案文 本;
140.402,根据预设的文本评分特征分类规则,分别提取问答对文本中问题文 本和答案文本的文本特征信息,得到至少一个文本特征信息;
141.获取用户提供的所需要被评分的问答对文本,其中,获取到的问答对文 本中包含有问题文本和答案文本。
142.分别对待评分的问答对文本中的问题文本和答案文本进行切词处理,得 到问题文本和答案文本的词汇数据。然后根据预设的文本评分特征分类规则, 分别提取问题文本和答案文本的词汇数据中包含的文本特征信息。
143.403,利用预设的评分模型,对至少一个文本特征信息进行初步评分,得 到初步特征评分;
144.将文本特征信息输入至评分模型中,评分模型会依据模型中设置好的评 分规则对其进行初步评分,从而输出初步特征评分。
145.404,提取文本特征信息中的至少一个特征参数;
146.将文本特征信息进行向量化处理,可以得到一个向量矩阵,从该向量矩 阵中选择至少一个向量参数,将其作为特征参数。
147.405,基于预设的切词处理规则,对待评分问答对文本进行切词处理,得 到特征分词;
148.根据预设的切词处理规则,对待评分的问答对文本进行切词处理,得到 至少一个特征分词。其中,特征分词可以为专有名词等,在此不对特征分词 进行限制,特征参数和特征分词的权重可以根据实际情况进行设定,在此不 做设定。
149.406,基于预设的特征参数和特征分词的权重,对特征参数和特征分词进 行权值计算,得到关于待评分的问答对文本中问题与对应的答案的相关性的 评估结果;
150.根据预设的特征参数和特征分词的权重,对特征参数和特征分词进行相 应的权值计算,根据其得到的权值计算结果,判断问答对文本中问题与对应 的答案之间的相关性,并得到相关性的评估结果。
151.407,将初步特征评分和评估结果输入至评分模型中进行二次评分,输出 最终评分。
152.将得到的初步特征评分和对于问答相关性的评估结果输入至评分模型 中,利用此评分模型进行二次评分,该二次评分过程主要是利用预设的初步 特征评分和评估结果的权重进行权值计算,将计算出的权值相加,由此得到 评分结果,并将此评分结果作为最终评分。
153.本发明实施例中,从文本特征信息中提取出特征参数,从问答对文本中 提取出特征分词,然后利用预设的特征参数和特征分词的权重,对其进行权 值计算,由此评估问题与答案之间的相关性,根据此相关性的评估结果和初 步特征评分进行二次评分,并将评分结果作为最终评分。该实施例通过问答 对文本中问题与答案的相关性的评估结果和初步特征评分结合得到最终评 分,提高了评分的质量和评分结果的准确度。
154.上面对本发明实施例中问答对评分方法进行了描述,下面对本发明实施 例中问答对评分装置进行描述,请参阅图5,本发明实施例中问答对评分装置 一个实施例包括:
155.获取模块501,用于获取待评分的问答对文本,其中所述问答对文本包括 问题文本和答案文本;
156.提取模块502,用于根据预设的文本评分特征分类规则,分别提取所述问 答对文本中问题文本和答案文本的文本特征信息,得到至少一个文本特征信 息;
157.初步评分模块503,用于利用预设的评分模型,对所述至少一个文本特征 信息进行初步评分,得到初步特征评分;
158.评估模块504,用于根据所述文本特征信息,对所述待评分的问答对文本 的问答相关性进行评估,得到评估结果;
159.二次评分模块505,用于将所述初步特征评分和所述评估结果输入至所述 评分模型中进行二次评分,输出最终评分。
160.本发明实施例中,利用上述装置运行上述的问答对评分方法,提取问答 对中的文本特征信息,利用预设的评分模型对其进行评分,得到初步特征评 分,然后根据此文本特征信息评估问答对中问题与答案的相关性,结合相关 性的评估结果和初步特征评分进行二次评分,得到最终评分。本发明实施例 中的装置实现了自动评分,且提高了评分的准确度。
161.请参阅图6,本发明实施例中问答对评分装置的另一个实施例包括:
162.获取模块501,用于获取待评分的问答对文本,其中所述问答对文本包括 问题文本和答案文本;
163.提取模块502,用于根据预设的文本评分特征分类规则,分别提取所述问 答对文本中问题文本和答案文本的文本特征信息,得到至少一个文本特征信 息;
164.初步评分模块503,用于利用预设的评分模型,对所述至少一个文本特征 信息进行初步评分,得到初步特征评分;
165.评估模块504,用于根据所述文本特征信息,对所述待评分的问答对文本 的问答
相关性进行评估,得到评估结果;
166.二次评分模块505,用于将所述初步特征评分和所述评估结果输入至所述 评分模型中进行二次评分,输出最终评分。
167.在本实施例中,提取模块502具体用于:
168.基于预设的分词规则,对所述问答对文本中问题文本和答案文本分别进 行分词处理,得到分词序列;
169.利用预设的词向量生成模型,对所述分词序列进行向量化处理,得到向 量矩阵;
170.从所述向量矩阵中提取至少一个文本特征信息。
171.在本实施例中,初步评分模块503包括:
172.关键词相似度特征计算单元5031,用于提取所述至少一个文本特征信息 中的关键词特征,对所述关键词特征进行相似度特征计算,得到关键词相似 度特征参数;
173.语义相似度特征计算单元5032,用于提取所述至少一个文本特征信息中 的语义特征,对所述语义特征进行相似度特征计算,得到语义相似度特征参 数;
174.初步评分单元5033,用于将所述关键词相似度特征参数和语义相似度特 征参数输入至所述评分模型中,进行初步评分,得到初步特征评分。
175.在本实施例中,关键词相似度特征计算单元5031具体用于:
176.基于预设的词频

逆文档算法,从所述问答对文本中问题文本的文本特征 信息中提取出至少一个第一关键词;
177.基于预设的词频

逆文档算法,从所述问答对文本中答案文本的文本特征 信息中提取出至少一个第二关键词;
178.分别提取所述至少一个第一关键词和所述至少一个第二关键词的关键词 特征,得到第一关键词特征和第二关键词特征;
179.利用预设的关键词特征相似度算法,计算所述第一关键词特征和第二关 键词特征的相似度特征,得到所述问答对文本中的关键词相似度特征参数。
180.在本实施例中,语义相似度特征计算单元5032具体用于:
181.利用预设的卷积神经网络和双向长短期记忆网络,对所述文本特征信息 进行词汇级别特征提取,得到词汇级别特征;
182.对所述词汇级别特征引入注意力机制,得到词汇级别语义特征;
183.基于所述词汇级别语义特征,在语义空间计算语义相似度,得到语义相 似度特征参数。
184.在本实施例中,评估模块504具体用于:
185.提取所述文本特征信息中的至少一个特征参数;
186.基于预设的切词处理规则,对所述待评分问答对文本进行切词处理,得 到特征分词;
187.基于预设的特征参数和特征分词的权重,对所述特征参数和特征分词进 行权值计算,得到关于所述待评分的问答对文本中问题与对应的答案的相关 性的评估结果。
188.可选的,模型构建模块506具体用于:
189.获取相关知识和技术;
190.将所述相关知识和技术以及所述文本特征信息作为训练语料;
191.利用预设的评分工具对所述训练语料进行学习,得到评分模型。
192.本发明实施例中,通过增加一个模型构建模块,实现评分模型的构建, 从而利用构建好的评分模型对问答对文本进行评分,提高了评分的准确性, 使其得到的评分结果更具可靠性。
193.上面图5和图6从模块化功能实体的角度对本发明实施例中的问答对评 分装置进行详细描述,下面从硬件处理的角度对本发明实施例中问答对评分 设备进行详细描述。
194.图7是本发明实施例提供的一种问答对评分设备的结构示意图,该问答 对评分设备700可因配置或性能不同而产生比较大的差异,可以包括一个或 一个以上处理器(central processing units,cpu)710(例如,一个或一个以上 处理器)和存储器720,一个或一个以上存储应用程序733或数据732的存储 介质730(例如一个或一个以上海量存储设备)。其中,存储器720和存储介 质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一 个或一个以上模块(图示没标出),每个模块可以包括对问答对评分设备700 中的一系列指令操作。更进一步地,处理器710可以设置为与存储介质730 通信,在问答对评分设备700上执行存储介质730中的一系列指令操作。
195.问答对评分设备700还可以包括一个或一个以上电源740,一个或一个以 上有线或无线网络接口750,一个或一个以上输入输出接口760,和/或,一个 或一个以上操作系统731,例如windows serve,mac os x,unix,linux, freebsd等等。本领域技术人员可以理解,图7示出的问答对评分设备结构 并不构成对问答对评分设备的限定,可以包括比图示更多或更少的部件,或 者组合某些部件,或者不同的部件布置。
196.本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算 法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中 心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块 中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成 下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服 务层等。
197.本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为 非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算 机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计 算机上运行时,使得计算机执行所述问答对评分方法的步骤。
198.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描 述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应 过程,在此不再赘述。
199.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售 或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本 发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的 全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个 存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机, 服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步 骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read

only memory, rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘 等各种可以存储程序代码的介质。
200.以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制; 尽管参照
前述实施例对本发明进行了详细的说明,本领域的普通技术人员应 当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其 中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案 的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜