一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于人工智能的对话推荐方法及相关设备与流程

2023-02-01 21:02:19 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,尤其涉及一种基于人工智能的对话推荐方法及相关设备。


背景技术:

2.随着信息技术的发展,基于语音的信息处理技术得到了迅猛的发展并具有广泛的应用。为了使得对话用户(例如,医生、销售、客服等)能快速地投入到自己的工作中,提升工作效率,不少公司为对话用户设定了相应的话术,以便于对话用户在与用户(例如,患者、顾客)交流时可以采用相应的话术进行回答。
3.在实现本技术的过程中,申请人发现现有技术存在如下问题:目前的一些话术都是事先固定的,在实际现场对话场景中的情况是复杂多样的,而事先设置的话术无法全面覆盖到,对话推荐的准确性较差。
4.因此,有必要提供一种对话推荐方法,能够提高对话推荐的准确性。


技术实现要素:

5.鉴于以上内容,有必要提出一种基于人工智能的对话推荐方法及相关设备,能够提高对话推荐的准确性。
6.本技术实施例第一方面提供一种基于人工智能的对话推荐方法,所述基于人工智能的对话推荐方法包括:
7.获取对话内容;
8.从预设主题集中选取所述对话内容对应的当前主题;
9.确定所述当前主题对应的下一主题为所述对话内容对应的目标主题;
10.确定所述目标主题对应的初始候选话语集,其中,所述初始候选话语集中包含若干初始候选话语;
11.根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,得到目标候选话语;
12.将所述目标候选话语推荐至预设端口。
13.进一步地,在本技术实施例提供的上述基于人工智能的对话推荐方法中,所述从预设主题集中选取所述对话内容对应的当前主题,包括:
14.对所述对话内容进行标签化处理,得到所述对话内容对应的若干标签,组成标签集;
15.从预设主题集中确定所述标签集中每一标签对应的预设主题;
16.确定所述预设主题包含的标签数量;
17.选取所述标签数量最多的预设主题作为所述对话内容对应的当前主题。
18.进一步地,在本技术实施例提供的上述基于人工智能的对话推荐方法中,所述确定所述当前主题对应的下一主题为所述对话内容对应的目标主题,包括:
19.确定所述对话内容对应的目标对话用户;
20.确定所述目标对话用户的对话偏好信息;
21.根据所述对话偏好信息确定所述预设主题集中的预设主题的排序方式;
22.根据所述排序方式确定所述当前主题对应的下一主题为目标主题。
23.进一步地,在本技术实施例提供的上述基于人工智能的对话推荐方法中,在所述确定所述目标主题对应的初始候选话语集之前,所述方法还包括:
24.获取历史对话内容集;
25.从预设主题集中确定所述历史对话内容集中每一历史对话内容对应的预设主题;
26.以所述预设主题为类别对所述历史对话内容集进行聚类分析,得到各个所述预设主题对应的若干初始历史对话内容;
27.预处理所述初始历史对话内容,得到若干目标历史对话内容,组成候选话语集。
28.进一步地,在本技术实施例提供的上述基于人工智能的对话推荐方法中,所述预处理所述初始历史对话内容,得到若干目标历史对话内容,组成候选话语集,包括:
29.分别对所述初始历史对话内容进行向量化处理,得到若干初始历史对话内容向量,组成初始历史对话内容向量集;
30.计算所述初始历史对话内容向量集中的第一初始历史对话内容向量与第二初始历史对话内容向量间的距离;
31.检测所述距离是否超过预设距离阈值;
32.当检测结果为所述距离超过所述预设距离阈值时,保留所述第一初始历史对话内容向量对应的第一初始历史对话内容以及所述第二初始历史对话内容向量对应的第二初始历史对话内容;
33.当检测结果为所述距离未超过所述预设距离阈值时,删除所述第一初始历史对话内容向量对应的第一初始历史对话内容或者删除所述第二初始历史对话内容向量对应的第二初始历史对话内容;
34.根据所述检测结果得到并组合所述预设主题下的若干目标历史对话内容,得到候选话语集。
35.进一步地,在本技术实施例提供的上述基于人工智能的对话推荐方法中,所述确定所述目标主题对应的初始候选话语集,包括:
36.获取预先设置的主题与候选话语集的映射关系;
37.遍历所述映射关系,得到所述目标主题对应的初始候选话语集。
38.进一步地,在本技术实施例提供的上述基于人工智能的对话推荐方法中,所述根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,得到目标候选话语,包括:
39.对所述对话内容进行向量化处理,得到对话内容向量;
40.对所述初始候选话语集中任一初始候选话语进行向量化处理,得到初始候选话语向量;
41.将所述对话内容向量与所述初始候选话语向量输入至预设对话召回模型中,得到相关性分数值;
42.选取所述相关性分数值最高的候选话语向量对应的候选话语为目标候选话语。
43.本技术实施例第二方面还提供一种基于人工智能的对话推荐装置,所述基于人工智能的对话推荐装置包括:
44.对话获取模块,用于获取对话内容;
45.主题选取模块,用于从预设主题集中选取所述对话内容对应的当前主题;
46.主题确定模块,用于确定所述当前主题对应的下一主题为所述对话内容对应的目标主题;
47.话语确定模块,用于确定所述目标主题对应的初始候选话语集,其中,所述初始候选话语集中包含若干初始候选话语;
48.话语匹配模块,用于根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,得到目标候选话语;
49.话语推荐模块,用于将所述目标候选话语推荐至预设端口。
50.本技术实施例第三方面还提供一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任意一项所述的基于人工智能的对话推荐方法。
51.本技术实施例第四方面还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于人工智能的对话推荐方法。
52.本技术实施例提供的上述基于人工智能的对话推荐方法、对话推荐装置、计算机设备以及计算机可读存储介质,通过从预设主题集中选取对话内容对应的当前主题,并确定当前主题对应的下一主题为对话内容对应的目标主题,确定目标主题下的候选话语作为对话推荐,能够灵活地根据对话内容提供对话推荐,避免按照固定主题顺序提供对话推荐,能够提高对话推荐的准确性;且本技术实施例在进行对话推荐时,根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,得到目标候选话语,保证候选话语与对话内容的相关度,进一步提高对话推荐的准确性。本技术可应用于智慧政务、智慧交通等智慧城市的各个功能模块中,比如智慧政务的基于人工智能的对话推荐模块等,能够促进智慧城市的快速发展。
附图说明
53.图1是本技术实施例一提供的基于人工智能的对话推荐方法的流程图。
54.图2是本技术一实施例提供的主题选取方法的流程图。
55.图3是本技术一实施例提供的主题确定方法的流程图。
56.图4是本技术一实施例提供的候选话语确定方法的流程图。
57.图5是本技术实施例二提供的基于人工智能的对话推荐装置的结构图。
58.图6是本技术实施例三提供的计算机设备的结构示意图。
59.如下具体实施方式将结合上述附图进一步说明本技术。
具体实施方式
60.为了能够更清楚地理解本技术的上述目的、特征和优点,下面结合附图和具体实施例对本技术进行详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例
中的特征可以相互组合。
61.在下面的描述中阐述了很多具体细节以便于充分理解本技术,所描述的实施例是本技术一部分实施例,而不是全部的实施例。
62.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术。
63.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
64.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
65.本发明实施例提供的基于人工智能的对话推荐方法由计算机设备执行,相应地,基于人工智能的对话推荐装置运行于计算机设备中。图1是本技术实施例一提供的基于人工智能的对话推荐方法的流程图。如图1所示,所述基于人工智能的对话推荐方法可以包括如下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略:
66.s11,获取对话内容。
67.在本技术的至少一实施例中,所述对话内容可以为一对一、一对多或者多对一形式的对话,在此不做限制。本技术实施例以所述对话内容为一对一形式为例,所述对话内容可以通过线上对话的方式产生,例如,用户a与用户b通过文字或者语音的方式在预设平台进行交流,通过对预设平台上的语音进行转文字处理,在按照对话时间戳的顺序采集文字内容作为所述对话内容。所述对话内容还可以通过线下对话的方式产生,例如,用户a与用户b通过语音的方式在预设平台进行交流,通过对预设平台中的语音进行采集,并将采集后的语音进行转文字处理,将文字内容作为所述对话内容。所述对话内容的应用场景不做限制,例如,所述对话内容可以应用于用户与客服的场景、用户与销售的场景以及医疗场景。本技术实施例以医疗场景为例,所述对话内容为问诊内容,可以包括病情问询、拟诊、讨论用药、开处方、讨论病情发展、生活建议以及回答患者疑问等方面内容。
68.可选地,当所述对话内容为线上对话时,所述获取对话内容包括:
69.当接收到对话开启指令时,按照预设时间间隔采集初始对话内容;
70.监测所述初始对话内容中是否存在语音形式对话;
71.当监测结果为所述初始对话内容中存在所述语音形式对话时,将所述语音形式对话转化为文字形式对话,得到对话内容。
72.其中,所述对话开启指令用于标识对话内容开启,所述对话开启指令可以是发出首个对话内容的指令,也可以是正在编辑软键盘的指令,还可以是正在语音输入的指令,在此不做限制。所述预设时间间隔为预先设置的用于获取对话内容的时间间隔,例如,所述预设时间间隔可以为0秒(也即实时采集初始对话内容)、30秒。将语音形式对话转化为文字形式对话为现有技术,在此不做赘述。
73.可选地,当所述对话内容为线下对话时,所述获取对话内容包括:
74.当接收到对话开启指令时,按照预设时间间隔采集初始对话内容,所述初始对话内容为语音形式对话;
75.将所述语音形式对话转化为文字形式对话,得到对话内容。
76.s12,从预设主题集中选取所述对话内容对应的当前主题。
77.在本技术的至少一实施例中,在医疗场景下,所述预设主题集中包含若干预设主题,所述预设主题可以为病情问询、拟诊、讨论用药、开处方、讨论病情发展、生活建议以及回答患者疑问等主题。所述对话内容按照所述预设主题展开,每一段所述对话内容均存在与之对应的预设主题。所述预设主题在问诊过程中可能仅出现一次,也可能出现多次。
78.结合图2说明当前主题选取方法的流程。可选地,所述从预设主题集中选取所述对话内容对应的当前主题,包括:
79.s120,对所述对话内容进行标签化处理,得到所述对话内容对应的若干标签,组成标签集;
80.s121,从预设主题集中确定所述标签集中每一标签对应的预设主题;
81.s122,确定所述预设主题包含的标签数量;
82.s123,选取所述标签数量最多的预设主题作为所述对话内容对应的当前主题。
83.其中,所述对话内容中包含若干预设主题关键词,所述预设主题关键词为预先设置的与所述预设主题相关度较高的关键词,以所述预设主题为病情问询为例,所述预设主题关键词可以为“病情”、“不舒服”、“怎么了”等词。将所述预设主题关键词作为所述对话内容的标签,对所述对话内容进行标签化处理。所述预设主题关键词存储于预设数据库中,考虑到数据存储的可靠性与隐私性,所述预设数据库可以为区块链中的目标节点。
84.所述对话内容可以为一句话对话,也可以为多句话对话。在一实施例中,当所述对话内容为一句话内容时,也即所述对话内容包含对话用户a的一句话以及对话用户b的一句话,可选地,所述对所述对话内容进行标签化处理,得到所述对话内容对应的若干标签,组成标签集,包括:
85.对所述对话内容进行分词处理,得到分词结果;
86.检测所述分词结果中是否存在与预设主题关键词语义相近的目标词语;
87.当检测结果为所述分词结果中存在与所述预设主题关键词语义相近的目标词语时,确定所述目标词语对应的所述预设主题关键词作为标签,组成标签集。
88.其中,分词处理技术为现有技术,在此不做赘述。所述语义相近是指词语与所述预设主题关键词的语义相似度超过预设相似度阈值,所述预设相似度阈值为预先设置的用于评估两个词语是否语义相近的阈值。
89.在其他实施例中,当所述对话内容为多句话内容时,也即所述对话内容包含对话用户a的多句话以及对话用户b的多句话,由于时间戳最近的对话更能体现对话内容的当前主题,本技术实施例还可以通过设置权重的方式将时间戳最近的对话设置较高权重,提高当前主题确定的准确性,进而提高对话推荐的准确性。可选地,所述对所述对话内容进行标签化处理,得到所述对话内容对应的若干标签,组成标签集,包括:
90.对所述对话内容进行分词处理,得到分词结果;
91.检测所述分词结果中是否存在与预设主题关键词语义相近的目标词语;
92.当检测结果为所述分词结果中存在与所述预设主题关键词语义相近的目标词语时,确定所述目标词语在所述对话内容中的时间戳信息;
93.遍历预先设置的时间戳与权重的映射关系,得到所述时间戳信息对应所述目标词语的权重;
94.根据所述权重将所述目标词语对应的所述预设主题关键词作为标签,组成标签集。
95.其中,所述时间戳与权重间存在映射关系,所述时间戳越近的对话的权重越高,所述时间戳越远的对话的权重越低。所述时间戳的远近是与结束对话的时间比较得到的,例如,一段对话内容的开始时间为8:00,结束时间为8:05,将距离结束时间近的赋值更高的权重,将距离结束时间远的赋值更低的权重。示例性地,对于时间戳为8:05的目标词语对应的预设主题关键词,对应的权重为5,此时可以将所述预设主题关键词的数量*5,以增加所述预设主题关键词在标签集中的数量。
96.可选地,所述检测所述分词结果中是否存在与预设主题关键词语义相近的目标词语可以包括:
97.确定所述分词结果中每一分词与所述预设主题关键词的语义相似度;
98.检测所述语义相似度是否超过预设相似度阈值;
99.当所述语义相似度超过所述预设相似度阈值时,确定所述分词结果中存在与所述预设主题关键词语义相近的目标词语;
100.当所述语义相似度未超过所述预设相似度阈值时,确定所述分词结果中不存在与所述预设主题关键词语义相近的目标词语。
101.其中,所述语义相似度可以通过预先训练好的语义相似度计算模型处理得到,所述语义相似度计算模型的输入为分词与所述预设主题关键词,输出为语义相似度。模型训练过程为现有技术,在此不做赘述。
102.s13,确定所述当前主题对应的下一主题为所述对话内容对应的目标主题。
103.在本技术的至少一实施例中,确定所述预设主题集中的预设主题的排序方式,按照所述排序方式选取所述当前主题对应的下一主题为所述对话内容对应的目标主题。所述排列方式可以根据对话用户的对话偏好信息确定,根据对话用户的对话偏好信息确定预设主题的排序方式,继而确定目标主题,最后对所述目标主题下的候选话语进行推荐,能够提高对话推荐的准确性。
104.结合图3说明目标主题确定的流程。可选地,所述确定所述当前主题对应的下一主题为所述对话内容对应的目标主题,包括:
105.s130,确定所述对话内容对应的目标对话用户;
106.s131,确定所述目标对话用户的对话偏好信息;
107.s132,根据所述对话偏好信息确定所述预设主题集中的预设主题的排序方式;
108.s133,根据所述排序方式确定所述当前主题对应的下一主题为目标主题。
109.其中,所述目标对话用户为对话过程中处于主导地位的用户,用于引导对话流程。在医疗场景下,以对话内容为医患对话内容为例,在问诊过程中,一般医生为对话主导,用于引领患者沟通病情,所述目标对话用户为医生。所述对话偏好信息是指医生偏好的问诊流程,所述对话偏好信息中包含预设主题的问诊顺序等信息。在一实施例中,所述对话偏好
信息可以从该医生的历史问诊数据中得到。在其他实施例中,可以预先建立医生画像,基于所述医生画像确定所述对话偏好信息。
110.在一实施例中,所述确定所述目标对话用户的对话偏好信息,包括:
111.获取所述目标对话用户的历史问诊数据;
112.确定所述历史问诊数据包含的预设主题以及所述预设主题的排序方式;
113.按照预设数据格式标记所述排序方式,得到对话偏好信息。
114.其中,所述历史问诊数据是指所述目标对话用户与历史接诊过的患者间的完整对话内容,所述历史问诊数据存储于所述预设数据库中。所述确定所述历史问诊数据包含的预设主题已在上文描述,在此不做赘述。所述预设数据格式为所述排序方式的标记方式,例如,所述预设数据格式可以为{预设主题1,预设主题2,

,预设主题n}。
115.在其他实施例中,所述确定所述目标对话用户的对话偏好信息,包括:
116.确定所述目标对话用户的用户信息;
117.根据所述用户信息构建所述目标对话用户的目标用户画像;
118.遍历预先设置的用户画像与对话偏好信息的映射关系,得到所述目标用户画像对应的对话偏好信息。
119.其中,所述用户信息可以为所述目标对话用户的年龄信息、性别信息、学历信息等内容。
120.在本技术的至少一实施例中,所述对话内容对应的目标主题还可以通过预设主题预测模型预测得到,所述预设主题预测模型可以基于循环神经网络构建得到。所述预设主题预测模型的输入为对话内容以及所述对话内容对应的当前主题,输出为目标主题。
121.s14,确定所述目标主题对应的初始候选话语集,其中,所述初始候选话语集中包含若干初始候选话语。
122.在本技术的至少一实施例中,所述初始候选话语集中包含若干初始候选话语,所述初始候选话语可以为一句话内容,也可以为一段话内容,在此不做限制。
123.可选地,在所述确定所述目标主题对应的初始候选话语集之前,所述方法还包括:
124.获取历史对话内容集;
125.从预设主题集中确定所述历史对话内容集中每一历史对话内容对应的预设主题;
126.以所述预设主题为类别对所述历史对话内容集进行聚类分析,得到各个所述预设主题对应的若干初始历史对话内容;
127.预处理所述初始历史对话内容,得到若干目标历史对话内容,组成候选话语集。
128.其中,所述历史对话内容集可以为不同医生对不同患者的历史问诊数据,所述历史对话内容集可以通过爬虫技术从预设平台中爬取得到。所述历史对话内容集中每一历史对话内容均存在与之对应的预设主题,确定与对话内容对应的预设主题在上文已描述,在此不做赘述。预处理所述初始历史对话内容,得到若干目标历史对话内容,组成候选话语集也即对所述预设主题的所述初始历史对话内容进行相似性去重处理。
129.可选地,所述预处理所述初始历史对话内容,得到若干目标历史对话内容,组成候选话语集,包括:
130.分别对所述初始历史对话内容进行向量化处理,得到若干初始历史对话内容向量,组成初始历史对话内容向量集;
131.计算所述初始历史对话内容向量集中的第一初始历史对话内容向量与第二初始历史对话内容向量间的距离;
132.检测所述距离是否超过预设距离阈值;
133.当检测结果为所述距离超过所述预设距离阈值时,保留所述第一初始历史对话内容向量对应的第一初始历史对话内容以及所述第二初始历史对话内容向量对应的第二初始历史对话内容;
134.当检测结果为所述距离未超过所述预设距离阈值时,删除所述第一初始历史对话内容向量对应的第一初始历史对话内容或者删除所述第二初始历史对话内容向量对应的第二初始历史对话内容;
135.根据所述检测结果得到并组合所述预设主题下的若干目标历史对话内容,得到候选话语集。
136.其中,向量间的距离可以为欧氏距离。所述预设距离阈值为预先设置的用于评估向量间距离的阈值。所述第一初始历史对话内容向量与所述第二初始历史对话内容向量为所述初始历史对话内容向量集中任意两个向量。
137.示例性地,所述初始历史对话内容的数量为10,将所述初始历史对话内容进行向量化处理,得到的初始历史对话内容向量的数量也为10,分别记作初始历史对话内容向量1、2、3

、10,从初始历史对话内容向量集中任意选取初始历史对话内容向量1与初始历史对话内容向量2进行距离计算,当检测结果为距离超过所述预设距离阈值时,保留初始历史对话内容向量1对应的初始历史对话内容与初始历史对话内容向量2对应的初始历史对话内容;当检测结果为所述距离未超过所述预设距离阈值时,删除初始历史对话内容向量1对应的初始历史对话内容或者删除初始历史对话内容向量2对应的初始历史对话内容,此时所述初始历史对话内容向量集中的向量得到第一次更新。以保留初始历史对话内容向量1对应的初始历史对话内容与初始历史对话内容向量2对应的初始历史对话内容为例,再从第一次更新后的初始历史对话内容向量集中任意选取初始历史对话内容向量1与初始历史对话内容向量3进行距离计算,根据检测结果对初始历史对话内容向量集中的向量进行第二次更新。以删除初始历史对话内容向量1对应的初始历史对话内容为例,再从第二次更新后的初始历史对话内容向量集中任意选取初始历史对话内容向量2与初始历史对话内容向量4进行距离计算,根据检测结果对初始历史对话内容向量集中的向量进行第三次更新,以此类推,直至对初始历史对话内容向量集中任意两个向量均进行距离计算后,得到最后更新的初始历史对话内容向量集,作为目标历史对话内容向量集,所述目标历史对话内容向量集对应于目标历史对话内容,将若干目标历史对话内容组成候选话语集。
138.可选地,所述确定所述目标主题对应的初始候选话语集,包括:
139.获取预先设置的主题与候选话语集的映射关系;
140.遍历所述映射关系,得到所述目标主题对应的初始候选话语集。
141.s15,根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,得到目标候选话语。
142.在本技术的至少一实施例中,根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,选取相关性最强的候选话语作为目标候选话语进行对话推荐。在一实施例中,所述相关性匹配可以通过预设对话召回模型计算相关性分数值的方式
得到。所述预设对话召回模型的输入为对话内容向量与初始候选话语向量,输出为两个向量间的相关性分数值。所述预设对话召回模型的训练方式为现有技术,在此不做赘述。
143.结合图4说明目标候选话语的确定流程。可选地,所述根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,得到目标候选话语,包括:
144.s150,对所述对话内容进行向量化处理,得到对话内容向量;
145.s151,对所述初始候选话语集中任一初始候选话语进行向量化处理,得到初始候选话语向量;
146.s152,将所述对话内容向量与所述初始候选话语向量输入至预设对话召回模型中,得到相关性分数值;
147.s153,选取所述相关性分数值最高的候选话语向量对应的候选话语为目标候选话语。
148.其中,可以按照预设格式组合所述对话内容向量与所述初始候选话语向量,例如,所述预设格式可以为{对话内容向量,初始候选话语向量}。
149.s16,将所述目标候选话语推荐至预设端口。
150.在本技术的至少一实施例中,所述预设端口可以为所述目标对话用户对应的端口,以医患问诊为例,所述预设端口为医生端口,将所述目标候选话语推荐至预设端口,显示在预设端口的显示屏上,供医生参考。
151.本技术实施例提供的上述基于人工智能的对话推荐方法,通过从预设主题集中选取对话内容对应的当前主题,并确定当前主题对应的下一主题为对话内容对应的目标主题,确定目标主题下的候选话语作为对话推荐,能够灵活地根据对话内容提供对话推荐,避免按照固定主题顺序提供对话推荐,能够提高对话推荐的准确性;且本技术实施例在进行对话推荐时,根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,得到目标候选话语,保证候选话语与对话内容的相关度,进一步提高对话推荐的准确性。本技术可应用于智慧政务、智慧交通等智慧城市的各个功能模块中,比如智慧政务的对话推荐模块等,能够促进智慧城市的快速发展。本技术可应用于智慧政务、智慧交通等智慧城市的各个功能模块中,比如智慧政务的对话推荐模块等,能够促进智慧城市的快速发展。
152.请参阅图5,图5是本技术实施例二提供的基于人工智能的对话推荐装置的结构图。
153.在一些实施例中,所述基于人工智能的对话推荐装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的对话推荐装置20中的各个程序段的计算机程序可以存储于计算机设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)对话推荐的功能。
154.本实施例中,所述基于人工智能的对话推荐装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:对话获取模块201、主题选取模块202、主题确定模块203、话语确定模块204、话语匹配模块205以及话语推荐模块206。本技术所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
155.所述对话获取模块201可以用于获取对话内容。
156.在本技术的至少一实施例中,所述对话内容可以为一对一、一对多或者多对一形
式的对话,在此不做限制。本技术实施例以所述对话内容为一对一形式为例,所述对话内容可以通过线上对话的方式产生,例如,用户a与用户b通过文字或者语音的方式在预设平台进行交流,通过对预设平台上的语音进行转文字处理,在按照对话时间戳的顺序采集文字内容作为所述对话内容。所述对话内容还可以通过线下对话的方式产生,例如,用户a与用户b通过语音的方式在预设平台进行交流,通过对预设平台中的语音进行采集,并将采集后的语音进行转文字处理,将文字内容作为所述对话内容。所述对话内容的应用场景不做限制,例如,所述对话内容可以应用于用户与客服的场景、用户与销售的场景以及医疗场景。本技术实施例以医疗场景为例,所述对话内容为问诊内容,可以包括病情问询、拟诊、讨论用药、开处方、讨论病情发展、生活建议以及回答患者疑问等方面内容。
157.可选地,当所述对话内容为线上对话时,所述获取对话内容包括:
158.当接收到对话开启指令时,按照预设时间间隔采集初始对话内容;
159.监测所述初始对话内容中是否存在语音形式对话;
160.当监测结果为所述初始对话内容中存在所述语音形式对话时,将所述语音形式对话转化为文字形式对话,得到对话内容。
161.其中,所述对话开启指令用于标识对话内容开启,所述对话开启指令可以是发出首个对话内容的指令,也可以是正在编辑软键盘的指令,还可以是正在语音输入的指令,在此不做限制。所述预设时间间隔为预先设置的用于获取对话内容的时间间隔,例如,所述预设时间间隔可以为0秒(也即实时采集初始对话内容)、30秒。将语音形式对话转化为文字形式对话为现有技术,在此不做赘述。
162.可选地,当所述对话内容为线下对话时,所述获取对话内容包括:
163.当接收到对话开启指令时,按照预设时间间隔采集初始对话内容,所述初始对话内容为语音形式对话;
164.将所述语音形式对话转化为文字形式对话,得到对话内容。
165.所述主题选取模块202可以用于从预设主题集中选取所述对话内容对应的当前主题。
166.在本技术的至少一实施例中,在医疗场景下,所述预设主题集中包含若干预设主题,所述预设主题可以为病情问询、拟诊、讨论用药、开处方、讨论病情发展、生活建议以及回答患者疑问等主题。所述对话内容按照所述预设主题展开,每一段所述对话内容均存在与之对应的预设主题。所述预设主题在问诊过程中可能仅出现一次,也可能出现多次。
167.可选地,所述从预设主题集中选取所述对话内容对应的当前主题,包括:
168.对所述对话内容进行标签化处理,得到所述对话内容对应的若干标签,组成标签集;
169.从预设主题集中确定所述标签集中每一标签对应的预设主题;
170.确定所述预设主题包含的标签数量;
171.选取所述标签数量最多的预设主题作为所述对话内容对应的当前主题。
172.其中,所述对话内容中包含若干预设主题关键词,所述预设主题关键词为预先设置的与所述预设主题相关度较高的关键词,以所述预设主题为病情问询为例,所述预设主题关键词可以为“病情”、“不舒服”、“怎么了”等词。将所述预设主题关键词作为所述对话内容的标签,对所述对话内容进行标签化处理。所述预设主题关键词存储于预设数据库中,考
虑到数据存储的可靠性与隐私性,所述预设数据库可以为区块链中的目标节点。
173.所述对话内容可以为一句话对话,也可以为多句话对话。在一实施例中,当所述对话内容为一句话内容时,也即所述对话内容包含对话用户a的一句话以及对话用户b的一句话,可选地,所述对所述对话内容进行标签化处理,得到所述对话内容对应的若干标签,组成标签集,包括:
174.对所述对话内容进行分词处理,得到分词结果;
175.检测所述分词结果中是否存在与预设主题关键词语义相近的目标词语;
176.当检测结果为所述分词结果中存在与所述预设主题关键词语义相近的目标词语时,确定所述目标词语对应的所述预设主题关键词作为标签,组成标签集。
177.其中,分词处理技术为现有技术,在此不做赘述。所述语义相近是指词语与所述预设主题关键词的语义相似度超过预设相似度阈值,所述预设相似度阈值为预先设置的用于评估两个词语是否语义相近的阈值。
178.在其他实施例中,当所述对话内容为多句话内容时,也即所述对话内容包含对话用户a的多句话以及对话用户b的多句话,由于时间戳最近的对话更能体现对话内容的当前主题,本技术实施例还可以通过设置权重的方式将时间戳最近的对话设置较高权重,提高当前主题确定的准确性,进而提高对话推荐的准确性。可选地,所述对所述对话内容进行标签化处理,得到所述对话内容对应的若干标签,组成标签集,包括:
179.对所述对话内容进行分词处理,得到分词结果;
180.检测所述分词结果中是否存在与预设主题关键词语义相近的目标词语;
181.当检测结果为所述分词结果中存在与所述预设主题关键词语义相近的目标词语时,确定所述目标词语在所述对话内容中的时间戳信息;
182.遍历预先设置的时间戳与权重的映射关系,得到所述时间戳信息对应所述目标词语的权重;
183.根据所述权重将所述目标词语对应的所述预设主题关键词作为标签,组成标签集。
184.其中,所述时间戳与权重间存在映射关系,所述时间戳越近的对话的权重越高,所述时间戳越远的对话的权重越低。所述时间戳的远近是与结束对话的时间比较得到的,例如,一段对话内容的开始时间为8:00,结束时间为8:05,将距离结束时间近的赋值更高的权重,将距离结束时间远的赋值更低的权重。示例性地,对于时间戳为8:05的目标词语对应的预设主题关键词,对应的权重为5,此时可以将所述预设主题关键词的数量*5,以增加所述预设主题关键词在标签集中的数量。
185.可选地,所述检测所述分词结果中是否存在与预设主题关键词语义相近的目标词语可以包括:
186.确定所述分词结果中每一分词与所述预设主题关键词的语义相似度;
187.检测所述语义相似度是否超过预设相似度阈值;
188.当所述语义相似度超过所述预设相似度阈值时,确定所述分词结果中存在与所述预设主题关键词语义相近的目标词语;
189.当所述语义相似度未超过所述预设相似度阈值时,确定所述分词结果中不存在与所述预设主题关键词语义相近的目标词语。
190.其中,所述语义相似度可以通过预先训练好的语义相似度计算模型处理得到,所述语义相似度计算模型的输入为分词与所述预设主题关键词,输出为语义相似度。模型训练过程为现有技术,在此不做赘述。
191.所述主题确定模块203可以用于确定所述当前主题对应的下一主题为所述对话内容对应的目标主题。
192.在本技术的至少一实施例中,确定所述预设主题集中的预设主题的排序方式,按照所述排序方式选取所述当前主题对应的下一主题为所述对话内容对应的目标主题。所述排列方式可以根据对话用户的对话偏好信息确定,根据对话用户的对话偏好信息确定预设主题的排序方式,继而确定目标主题,最后对所述目标主题下的候选话语进行推荐,能够提高对话推荐的准确性。
193.可选地,所述确定所述当前主题对应的下一主题为所述对话内容对应的目标主题,包括:
194.确定所述对话内容对应的目标对话用户;
195.确定所述目标对话用户的对话偏好信息;
196.根据所述对话偏好信息确定所述预设主题集中的预设主题的排序方式;
197.根据所述排序方式确定所述当前主题对应的下一主题为目标主题。
198.其中,所述目标对话用户为对话过程中处于主导地位的用户,用于引导对话流程。在医疗场景下,以对话内容为医患对话内容为例,在问诊过程中,一般医生为对话主导,用于引领患者沟通病情,所述目标对话用户为医生。所述对话偏好信息是指医生偏好的问诊流程,所述对话偏好信息中包含预设主题的问诊顺序等信息。在一实施例中,所述对话偏好信息可以从该医生的历史问诊数据中得到。在其他实施例中,可以预先建立医生画像,基于所述医生画像确定所述对话偏好信息。
199.在一实施例中,所述确定所述目标对话用户的对话偏好信息,包括:
200.获取所述目标对话用户的历史问诊数据;
201.确定所述历史问诊数据包含的预设主题以及所述预设主题的排序方式;
202.按照预设数据格式标记所述排序方式,得到对话偏好信息。
203.其中,所述历史问诊数据是指所述目标对话用户与历史接诊过的患者间的完整对话内容,所述历史问诊数据存储于所述预设数据库中。所述确定所述历史问诊数据包含的预设主题已在上文描述,在此不做赘述。所述预设数据格式为所述排序方式的标记方式,例如,所述预设数据格式可以为{预设主题1,预设主题2,

,预设主题n}。
204.在其他实施例中,所述确定所述目标对话用户的对话偏好信息,包括:
205.确定所述目标对话用户的用户信息;
206.根据所述用户信息构建所述目标对话用户的目标用户画像;
207.遍历预先设置的用户画像与对话偏好信息的映射关系,得到所述目标用户画像对应的对话偏好信息。
208.其中,所述用户信息可以为所述目标对话用户的年龄信息、性别信息、学历信息等内容。
209.在本技术的至少一实施例中,所述对话内容对应的目标主题还可以通过预设主题预测模型预测得到,所述预设主题预测模型可以基于循环神经网络构建得到。所述预设主
题预测模型的输入为对话内容以及所述对话内容对应的当前主题,输出为目标主题。
210.所述话语确定模块204可以用于确定所述目标主题对应的初始候选话语集,其中,所述初始候选话语集中包含若干初始候选话语。
211.在本技术的至少一实施例中,所述初始候选话语集中包含若干初始候选话语,所述初始候选话语可以为一句话内容,也可以为一段话内容,在此不做限制。
212.可选地,在所述确定所述目标主题对应的初始候选话语集之前,所述话语确定模块204还包括:
213.获取历史对话内容集;
214.从预设主题集中确定所述历史对话内容集中每一历史对话内容对应的预设主题;
215.以所述预设主题为类别对所述历史对话内容集进行聚类分析,得到各个所述预设主题对应的若干初始历史对话内容;
216.预处理所述初始历史对话内容,得到若干目标历史对话内容,组成候选话语集。
217.其中,所述历史对话内容集可以为不同医生对不同患者的历史问诊数据,所述历史对话内容集可以通过爬虫技术从预设平台中爬取得到。所述历史对话内容集中每一历史对话内容均存在与之对应的预设主题,确定与对话内容对应的预设主题在上文已描述,在此不做赘述。预处理所述初始历史对话内容,得到若干目标历史对话内容,组成候选话语集也即对所述预设主题的所述初始历史对话内容进行相似性去重处理。
218.可选地,所述预处理所述初始历史对话内容,得到若干目标历史对话内容,组成候选话语集,包括:
219.分别对所述初始历史对话内容进行向量化处理,得到若干初始历史对话内容向量,组成初始历史对话内容向量集;
220.计算所述初始历史对话内容向量集中的第一初始历史对话内容向量与第二初始历史对话内容向量间的距离;
221.检测所述距离是否超过预设距离阈值;
222.当检测结果为所述距离超过所述预设距离阈值时,保留所述第一初始历史对话内容向量对应的第一初始历史对话内容以及所述第二初始历史对话内容向量对应的第二初始历史对话内容;
223.当检测结果为所述距离未超过所述预设距离阈值时,删除所述第一初始历史对话内容向量对应的第一初始历史对话内容或者删除所述第二初始历史对话内容向量对应的第二初始历史对话内容;
224.根据所述检测结果得到并组合所述预设主题下的若干目标历史对话内容,得到候选话语集。
225.其中,向量间的距离可以为欧氏距离。所述预设距离阈值为预先设置的用于评估向量间距离的阈值。所述第一初始历史对话内容向量与所述第二初始历史对话内容向量为所述初始历史对话内容向量集中任意两个向量。
226.示例性地,所述初始历史对话内容的数量为10,将所述初始历史对话内容进行向量化处理,得到的初始历史对话内容向量的数量也为10,分别记作初始历史对话内容向量1、2、3

、10,从初始历史对话内容向量集中任意选取初始历史对话内容向量1与初始历史对话内容向量2进行距离计算,当检测结果为距离超过所述预设距离阈值时,保留初始历史
对话内容向量1对应的初始历史对话内容与初始历史对话内容向量2对应的初始历史对话内容;当检测结果为所述距离未超过所述预设距离阈值时,删除初始历史对话内容向量1对应的初始历史对话内容或者删除初始历史对话内容向量2对应的初始历史对话内容,此时所述初始历史对话内容向量集中的向量得到第一次更新。以保留初始历史对话内容向量1对应的初始历史对话内容与初始历史对话内容向量2对应的初始历史对话内容为例,再从第一次更新后的初始历史对话内容向量集中任意选取初始历史对话内容向量1与初始历史对话内容向量3进行距离计算,根据检测结果对初始历史对话内容向量集中的向量进行第二次更新。以删除初始历史对话内容向量1对应的初始历史对话内容为例,再从第二次更新后的初始历史对话内容向量集中任意选取初始历史对话内容向量2与初始历史对话内容向量4进行距离计算,根据检测结果对初始历史对话内容向量集中的向量进行第三次更新,以此类推,直至对初始历史对话内容向量集中任意两个向量均进行距离计算后,得到最后更新的初始历史对话内容向量集,作为目标历史对话内容向量集,所述目标历史对话内容向量集对应于目标历史对话内容,将若干目标历史对话内容组成候选话语集。
227.可选地,所述确定所述目标主题对应的初始候选话语集,包括:
228.获取预先设置的主题与候选话语集的映射关系;
229.遍历所述映射关系,得到所述目标主题对应的初始候选话语集。
230.所述话语匹配模块205可以用于根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,得到目标候选话语;
231.在本技术的至少一实施例中,根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,选取相关性最强的候选话语作为目标候选话语进行对话推荐。在一实施例中,所述相关性匹配可以通过预设对话召回模型计算相关性分数值的方式得到。所述预设对话召回模型的输入为对话内容向量与初始候选话语向量,输出为两个向量间的相关性分数值。所述预设对话召回模型的训练方式为现有技术,在此不做赘述。
232.可选地,所述根据所述对话内容对所述初始候选话语集中任一初始候选话语进行相关性匹配,得到目标候选话语,包括:
233.对所述对话内容进行向量化处理,得到对话内容向量;
234.对所述初始候选话语集中任一初始候选话语进行向量化处理,得到初始候选话语向量;
235.将所述对话内容向量与所述初始候选话语向量输入至预设对话召回模型中,得到相关性分数值;
236.选取所述相关性分数值最高的候选话语向量对应的候选话语为目标候选话语。
237.其中,可以按照预设格式组合所述对话内容向量与所述初始候选话语向量,例如,所述预设格式可以为{对话内容向量,初始候选话语向量}。
238.所述话语推荐模块206可以用于将所述目标候选话语推荐至预设端口。
239.参阅图6所示,为本技术实施例三提供的计算机设备的结构示意图。在本技术较佳实施例中,所述计算机设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
240.本领域技术人员应该了解,图6示出的计算机设备的结构并不构成本技术实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机设备3还可以包括比图示更
多或更少的其他硬件或者软件,或者不同的部件布置。
241.在一些实施例中,所述计算机设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述计算机设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
242.需要说明的是,所述计算机设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本技术,也应包含在本技术的保护范围以内,并以引用方式包含于此。
243.在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的对话推荐方法中的全部或者部分步骤。所述存储器31包括只读存储器(read-only memory,rom)、可编程只读存储器(programmable read-only memory,prom)、可擦除可编程只读存储器(erasable programmable read-only memory,eprom)、一次可编程只读存储器(one-time programmable read-only memory,otprom)、电子擦除式可复写只读存储器(electrically-erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
244.进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
245.本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
246.在一些实施例中,所述至少一个处理器32是所述计算机设备3的控制核心(control unit),利用各种接口和线路连接整个计算机设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行计算机设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本技术实施例中所述的基于人工智能的对话推荐方法的全部或者部分步骤;或者实现基于人工智能的对话推荐装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
247.在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
248.尽管未示出,所述计算机设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或
交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机设备3还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
249.上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,计算机设备,或者网络设备等)或处理器(processor)执行本技术各个实施例所述方法的部分。
250.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
251.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
252.另外,在本技术各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
253.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其他的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
254.最后应说明的是,以上实施例仅用以说明本技术的技术方案而非限制,尽管参照较佳实施例对本技术进行了详细说明,本领域的普通技术人员应当理解,可以对本技术的技术方案进行修改或等同替换,而不脱离本技术技术方案的精神和范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献