话术预测的方法、装置以及存储介质与流程

2022-04-20 22:02:58 来源：中国专利 TAG：

本申请涉及互联网技术领域，特别是涉及一种话术预测的方法、装置以及存储介质。

背景技术

由于人工智能技术发展，出现许多通过机器人与人进行语音交流系统，特别是语音客服，智能电销，智能催收，智能音箱等语音交互场景应用非常广泛。当机器人能够与人语音交流后，如何提升交流后效果，就成为一个难点(比如在智能提醒中，如何提升机器人提醒有效率)。除了人工优化机器人话术意外，我们也期望能够根据用户画像进行用户精准营销，达到千人千面的营销效果。

例如，对于额度敏感的人，和利息敏感的人，是需要不同营销卖点话术的，而对于主动型和被动性用户，可能需要建议性话术和强势型话术进行针对性应对，对于优柔寡断型用户则需要带催促类话术，对于爱占小便宜的客户则需要已优惠类话术为主，对于年龄较大用户可能需要更慢的更清晰的话术等等。

在进行外呼时，有些外呼名单会比较多，比如回访、催收逾期7天内、注册用户还未申请贷款等名单。而有的名单会比较少，比如逾期三个月以上和用户生日活动名单等。对于同一个机器人，由于交互伦次越多，愿意继续沟通的越少，所以轮次越深到达的数量就越少。因此，现在的机器学习数据量对模型效果有非常大的影响，数据越多效果越好，对于名单量大的外呼任务，精准影响模型能很好的学到用户与话术的关系，而对于数据量少的话术，则模型效果较差，预测精准度低。

针对上述的现有技术中存在的在用户外呼数据较少或者对话节点达到较少时，用于预测话术用语的预测模型无法获取足够的样本训练，使得预测模型学习不足，导致预测精准度低的技术问题，目前尚未提出有效的解决方案。

技术实现要素：

本公开的实施例提供了一种话术预测的方法、装置以及存储介质，以至少解决现有技术中存在的在用户外呼数据较少或者对话节点达到较少时，用于预测话术用语的预测模型无法获取足够的样本训练，使得预测模型学习不足，导致预测精准度低的技术问题。

根据本公开实施例的一个方面，提供了一种话术预测的方法，用于从由多个话术用语组成的话术用语集合中确定与用户相匹配的目标话术用语，包括：获取与用户相关联的用户特征信息；利用预先设置的用于针对指定业务目标预测话术用语的业务目标值的指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值；以及根据业务目标值，从话术用语集合中确定与用户相匹配的目标话术用语，其中不同的业务目标对应于不同的业务场景，指定业务目标预测模型基于第一样本数据和第二样本数据训练得到，第一样本数据为与指定业务目标对应的目标业务场景不同的其他业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据。

根据本公开实施例的另一个方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时由处理器执行以上任意一项所述的方法。

根据本公开实施例的另一个方面，还提供了一种话术预测的装置，用于从由多个话术用语组成的话术用语集合中确定与用户相匹配的目标话术用语，包括：获取模块，用于获取与用户相关联的用户特征信息；第一确定模块，用于利用预先设置的用于针对指定业务目标预测话术用语的业务目标值的指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值；以及第二确定模块，用于根据业务目标值，从话术用语集合中确定与用户相匹配的目标话术用语，其中不同的业务目标对应于不同的业务场景，指定业务目标预测模型基于第一样本数据和第二样本数据训练得到，第一样本数据为与指定业务目标对应的目标业务场景不同的其他业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据。

根据本公开实施例的另一个方面，还提供了一种话术预测的装置，用于从由多个话术用语组成的话术用语集合中确定与用户相匹配的目标话术用语，包括：处理器；以及存储器，与处理器连接，用于为处理器提供处理以下处理步骤的指令：获取与用户相关联的用户特征信息；利用预先设置的用于针对指定业务目标预测话术用语的业务目标值的指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值；以及根据业务目标值，从话术用语集合中确定与用户相匹配的目标话术用语，其中不同的业务目标对应于不同的业务场景，指定业务目标预测模型基于第一样本数据和第二样本数据训练得到，第一样本数据为与指定业务目标对应的目标业务场景不同的其他业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据。

在本公开实施例中，由于指定业务目标预测模型是基于数据量大的与指定业务目标对应的目标业务场景不同的其他业务场景产生的第一样本数据以及与指定业务目标对应的目标业务场景产生的第二样本数据共同训练得到的，因此在第二样本数据较少的情况下，可以在数据量大的第一样本数据上对指定业务目标预测模型进行预训练，以此来提高指定业务目标预测模型的学习量，然后再在对应的数据量较少的第二样本数据上进行微调训练来提高指定业务目标预测模型的预测精准度。因此，在指定业务目标对应的目标业务场景产生的样本数据较少的情况下，也能够保证训练得到的指定业务目标预测模型的学习量和预测效果。从而，在将用户特征信息输入指定业务目标预测模型后，所输出的话术用语集合中每个话术用语对应于指定业务目标的业务目标值的精准度高。达到了在指定业务目标对应的用户外呼数据较少或者对话节点达到较少的情况下，仍然能够为指定业务目标预测模型提供足够的样本训练，提高指定业务目标预测模型的学习量，从而提高指定业务目标预测模型的预测精准度的技术效果。进而解决了现有技术中存在的在用户外呼数据较少或者对话节点达到较少时，用于预测话术用语的预测模型无法获取足够的样本训练，使得预测模型学习不足，导致预测精准度低的技术问题。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图；

图2是根据本公开实施例1所述的话术预测的方法的流程示意图；

图3是根据本公开实施例1所述的指定业务目标预测模型的一个具体训练方式的流程示意图；

图4是根据本公开实施例1所述的指定业务目标预测模型的另一个具体训练方式的流程示意图；

图5是根据本公开实施例1所述的训练指定业务目标预测模型的整体流程示意图；

图6是根据本公开实施例2所述的话术预测的装置的示意图；以及

图7是根据本公开实施例3所述的话术预测的装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本公开的技术方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本实施例，提供了一种话术预测的方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现话术预测的方法的计算设备的硬件结构框图。如图1所示，计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算设备还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器可用于存储应用软件的软件程序以及模块，如本公开实施例中的话术预测的方法对应的程序指令/数据存储装置，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的话术预测的方法。存储器可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中，传输装置包括一个网络适配器(NetworkInterfaceController，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算设备的用户界面进行交互。

此处需要说明的是，在一些可选实施例中，上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是，图1仅为特定具体实例的一个实例，并且旨在示出可存在于上述计算设备中的部件的类型。

在上述运行环境下，根据本实施例的第一个方面，提供了一种话术预测的方法，用于从由多个话术用语组成的话术用语集合中确定与用户相匹配的目标话术用语。该方法例如可以应用到智能客服系统，可以针对不同的用户确定采用的不同话术用语。图2示出了该方法的流程示意图，参考图2所示，该方法包括：

S202：获取与用户相关联的用户特征信息；

S204：利用预先设置的用于针对指定业务目标预测话术用语的业务目标值的指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值；以及

S206：根据业务目标值，从话术用语集合中确定与用户相匹配的目标话术用语，其中

不同的业务目标对应于不同的业务场景，指定业务目标预测模型基于第一样本数据和第二样本数据训练得到，第一样本数据为与指定业务目标对应的目标业务场景不同的其他业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据。

正如背景技术中所述的，在进行外呼时，有些外呼名单会比较多，比如回访、催收逾期7天内、注册用户还未申请贷款等名单。而有的名单会比较少，比如逾期三个月以上和用户生日活动名单等。对于同一个机器人，由于交互伦次越多，愿意继续沟通的越少，所以轮次越深到达的数量就越少。因此，现在的机器学习数据量对模型效果有非常大的影响，数据越多效果越好，对于名单量大的外呼任务，精准影响模型能很好的学到用户与话术的关系，而对于数据量少的话术，则模型效果较差。

针对背景技术中存在的技术问题，本实施例所提出的技术方案在步骤S202中，在需要针对用户进行话术营销的情况下，智能客服系统首先获取与用户相关联的用户特征信息。其中用户特征信息可以包括多个信息，例如：年龄、性别、爱好等个人用户信息(用户画像)。

进一步地，在步骤S204中，智能客服系统利用预先设置的指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值。其中，指定业务目标预测模型用于针对指定业务目标预测话术用语的业务目标值。不同的业务目标对应于不同的业务场景。例如：在电销业务场景下指定业务目标例如可以为电销转化率，对应的业务目标值为电销转化率的值；在催收业务场景下指定业务目标例如可以为催回率，对应的业务目标值为催回率的值；在回访业务场景下指定业务目标例如可以为问题完成率，对应的业务目标值为问题完成率的值等等，此处不做具体的限定。

并且，指定业务目标预测模型基于第一样本数据和第二样本数据训练得到，第一样本数据为与指定业务目标对应的目标业务场景不同的其他业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据。其中，假设指定业务目标对应的目标业务场景为消费金融电销场景，具体为一款循环额度的消费分期产品在生日活动场景中实现精准营销，此场景的业务目标是电销转化率。此时，第一样本数据可以为催收业务场景产生的样本数据，也可以为回访业务场景产生的样本数据，同样也可以为催收业务场景和回访业务场景产生的样本数据。第二样本数据则为电销业务场景产生的样本数据。在第一样本数据的选择上，可以选择用户外呼数据大量以及对话节点达到多的样本数据，例如，在催收业务场景中催收逾期7天内的外呼名单较多，在首次借款智能电销场景中注册用户还未申请贷款的外呼名单较多。

进一步地，由于指定业务目标预测模型是基于大量的与指定业务目标对应的目标业务场景不同的其他业务场景产生的样本数据以及与指定业务目标对应的目标业务场景产生的样本数据共同训练得到的，因此在与指定业务目标对应的目标业务场景产生的样本数据较少的情况下，仍然可以在大量的与指定业务目标对应的目标业务场景不同的其他业务场景产生的样本数据上对指定业务目标预测模型进行预训练，以此来提高指定业务目标预测模型的学习量，然后再在对应的数据量较少的与指定业务目标对应的目标业务场景产生的样本数据上进行微调训练来提高指定业务目标预测模型的预测效果。因此，即使在指定业务目标对应的目标业务场景产生的样本数据较少的情况下，也能够保证训练得到的指定业务目标预测模型的学习量和预测效果。

从而，在训练完成之后，可以将待预测的用户对应的用户特征信息作为输入数据，输入到指定业务目标预测模型之中，输出话术用语集合中每个话术用语对应于指定业务目标的业务目标值。其中，话术用语可以分为多个主题类型的话术用语(例如：开场白主题、利益告知主题、使用说明主题)，每个主题下包含多条话术，例如：开场白主题包括：“询问机主本人”、“姓核身”、“产品名称介绍”等话术用语。在将用户特征信息输入指定业务目标预测模型后，输出话术用语集合中每个话术用语对应于指定业务目标的业务目标值。例如但不限于：“询问机主本人”这一话术用语对应的电销转化率的值为0.2，“姓核身”这一话术用语对应的电销转化率的值为0.3，“产品名称介绍”这一话术用语对应的电销转化率的值为0.5。

最终，在步骤S206中，智能客服系统根据每个话术用语对应的业务目标值，从话术用语集合中确定与用户相匹配的目标话术用语。即选择业务目标值最高的话术用语作为与用户相匹配的目标话术用语。

从而通过这种方式，由于指定业务目标预测模型是基于数据量大的与指定业务目标对应的目标业务场景不同的其他业务场景产生的第一样本数据以及与指定业务目标对应的目标业务场景产生的第二样本数据共同训练得到的，因此在第二样本数据较少的情况下，可以在数据量大的第一样本数据上对指定业务目标预测模型进行预训练，以此来提高指定业务目标预测模型的学习量，然后再在对应的数据量较少的第二样本数据上进行微调训练来提高指定业务目标预测模型的预测精准度。因此，在指定业务目标对应的目标业务场景产生的样本数据较少的情况下，也能够保证训练得到的指定业务目标预测模型的学习量和预测效果。从而，在将用户特征信息输入指定业务目标预测模型后，所输出的话术用语集合中每个话术用语对应于指定业务目标的业务目标值的精准度高。达到了在指定业务目标对应的用户外呼数据较少或者对话节点达到较少的情况下，仍然能够为指定业务目标预测模型提供足够的样本训练，提高指定业务目标预测模型的学习量，从而提高指定业务目标预测模型的预测精准度的技术效果。进而解决了现有技术中存在的在用户外呼数据较少或者对话节点达到较少时，用于预测话术用语的预测模型无法获取足够的样本训练，使得预测模型学习不足，导致预测精准度低的技术问题。

可选地，多个话术用语由多个话术节点包含的话术用语组成，多个话术节点分别包含至少一个话术用语，指定业务目标预测模型包括分别对应于多个话术节点的多个业务目标预测模型，并且利用指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值的操作，包括：分别利用多个业务目标预测模型，根据用户特征信息确定多个话术节点中的每个话术用语对应于指定业务目标的业务目标值。

具体地，多个话术用语由多个话术节点包含的话术用语组成。其中，不同的话术节点对应于不同的主题类型，例如话术节点1对应于开场白主题，话术节点2对应于利益告知主题，话术节点3对应于使用说明主题。每个话术节点包含至少一个话术用语，例如话术节点1包括“询问机主本人”、“姓核身”、“产品名称介绍”等话术用语。并且，指定业务目标预测模型包括分别对应于多个话术节点的多个业务目标预测模型，例如包括对应于话术节点1的业务目标预测模型a、对应于话术节点2的业务目标预测模型b以及对应于话术节点3的业务目标预测模型c。需要特别说明的是，业务目标预测模型a在话术节点1上获得最优的预测效果，业务目标预测模型b在话术节点2上获得最优的预测效果，业务目标预测模型c在话术节点3上获得最优的预测效果。

从而，可以分别利用多个业务目标预测模型，根据用户特征信息确定多个话术节点中的每个话术用语对应于指定业务目标的业务目标值。即，利用业务目标预测模型a，根据用户特征信息确定话术节点1中的每个话术用语对应于指定业务目标(例如，电销转化率)的业务目标值。利用业务目标预测模型b，根据用户特征信息确定话术节点2中的每个话术用语对应于指定业务目标(例如，电销转化率)的业务目标值。利用业务目标预测模型c，根据用户特征信息确定话术节点3中的每个话术用语对应于指定业务目标(例如，电销转化率)的业务目标值。通过这种方式，分别使用不同的业务目标预测模型应用于各个话术节点，使得业务目标预测模型在各个话术节点上获得最优的预测效果，进一步提高了业务目标预测模型的预测精准率。

可选地，利用指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值的操作，包括：获取与多个话术用语分别对应的多个话术用语特征信息；将用户特征信息分别与多个话术用语特征信息组合，生成与用户以及各个话术用语对应的多个特征组；以及利用指定业务目标预测模型对多个特征组进行预测，确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值。

具体地，利用指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值的操作中，智能客服系统首先获取与多个话术用语分别对应的多个话术用语特征信息，其中每条话术用语的话术用语特征信息可以用0和1进行标记，1代表应用该条话术用语，0代表未应用该条话术用语。

进一步地，将用户特征信息分别与多个话术用语特征信息组合，生成与用户以及各个话术用语对应的多个特征组，其中采用的话术用语标记为1，未采用的话术用语标记为0。即，用户特征信息话术用语特征信息作为特征组进行输入。

最终，利用指定业务目标预测模型对多个特征组进行预测，确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值。即将多个话术与用户特征信息组成的特征组输入到指定业务目标预测模型中，确定每条话术用于对于该指定业务目标的业务目标值。从而，通过这种方式，能够提升指定业务目标预测模型的预测速度，实现快速地、准确地确定每条话术用于对于该指定业务目标的业务目标值的目的。

可选地，还包括根据以下步骤训练指定业务目标预测模型：获取第一样本数据和第二样本数据，其中第一样本数据为与指定业务目标对应的目标业务场景不同的第一业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据；根据第一样本数据和与第一业务场景对应的第一业务目标，对用于针对第一业务目标预测话术用语的业务目标值的第一业务目标预测模型进行训练；以及根据第二样本数据和指定业务目标，对训练后的第一业务目标预测模型进行微调，生成指定业务目标预测模型。

具体地，在对指定业务目标预测模型进行训练的过程中，智能客服系统首先获取第一样本数据和第二样本数据。其中，第一样本数据包括与指定业务目标(例如，电销转化率)对应的业务场景(例如，生日活动智能电销场景)不同的第一业务场景(例如，催收业务场景)产生的样本数据。第二样本数据包括与指定业务目标(即，电销转化率)对应的业务场景(即，生日活动智能电销场景)产生的样本数据。

进一步地，参照图3所示，智能客服系统根据第一样本数据和与第一业务场景对应的第一业务目标，对用于针对第一业务目标预测话术用语的业务目标值的第一业务目标预测模型进行训练。其中，在第一样本数据为催收业务场景产生的样本数据的情况下，第一业务目标为催回率，第一业务目标预测模型用于针对催回率预测话术用语的催回率的值。通过第一样本数据和第一业务目标训练第一业务目标预测模型，使得模型能够学习外部数据知识。

然后，智能客服系统根据第二样本数据和指定业务目标，对训练后的第一业务目标预测模型进行微调，生成指定业务目标预测模型。由于训练后的第一业务目标预测模型的最后一层是针对于第一业务目标进行预测的预测层，因此在进行微调过程中，只需要将第一业务目标预测模型中的最后一层去掉，后接一层针对于指定业务目标进行预测的预测层，从而生成指定业务目标预测模型。然后使用第二样本数据和指定业务目标对指定业务目标预测模型进行训练，让指定业务目标预测模型学习与指定业务目标对应的指定业务场景中的数据知识，使得训练得到的指定业务目标预测模型在该指定业务场景中取得最优的预测效果。

可选地，第一样本数据包括在第一业务场景内的与非智能机器人的目标用户相关的第一非智能样本数据和在第一业务场景内的与智能机器人的目标用户相关的第一智能样本数据，其中第一智能样本数据包括第一用户特征信息、第一业务数据和第一话术特征信息，并且根据第一样本数据和与第一业务场景对应的第一业务目标，对第一业务目标预测模型进行训练的操作，包括：根据第一非智能样本数据，对第一业务目标预测模型进行预训练；根据第一用户特征信息和第一业务数据，对预训练后的第一业务目标预测模型进行训练；以及根据第一用户特征信息、第一话术特征信息和第一业务目标，对训练后的第一业务目标预测模型进行微调。

具体地，在第一业务场景为催收业务场景的情况下，第一样本数据包括催收业务场景内的非智能催收数据(对应于第一非智能样本数据)和智能催收数据(对应于第一智能样本数据)。其中这里的非智能催收数据为在催收业务场景内的非智能机器人催收操作产生的样本数据，例如人工催收、短信催收、自然还款等产生的样本数据。这里的智能催收数据为在催收业务场景内的智能机器人催收操作产生的样本数据。第一智能样本数据包括第一用户特征信息、第一业务数据和第一话术特征信息。其中第一用户特征信息为催收业务场景中的用户的用户特征信息，第一业务数据为催收业务场景中的用户的还款与否信息，第一话术特征信息为催收业务场景中的各个话术用语的特征信息。

进一步地，对于催收业务场景，智能机器人催收产生的样本数据相对少于人工催收、短信催收、自然还款等产生的样本数据。因此，参照图4所示，智能客服系统在根据第一样本数据和与第一业务场景对应的第一业务目标，对第一业务目标预测模型进行训练的操作过程中，需要先使用样本数据量相对较大的第一非智能样本数据对第一业务目标预测模型进行预训练，然后根据第一用户特征信息和第一业务数据(即，还款与否信息)，对第一业务目标预测模型进行训练，让模型学习用户特征之间的关联知识。

进一步地，智能客服系统根据第一用户特征信息、第一话术特征信息和第一业务目标，对训练后的第一业务目标预测模型进行微调。即，使用上述模型训练好的第一用户特征信息与还款与否信息的基础关系，去掉还款预测层后和话术特征编码层进行拼接，然后再接一层催回率预测层，使用催回智能电销数据，第一用户特征信息和第一话术特征信息作为x，催回率作为y训练微调后的第一业务目标预测模型(对应于催回率预测模型)，让模型学习用户特征信息与话术特征信息之间的关联关系。

可选地，在目标业务场景内的与非智能机器人的目标用户相关的第二非智能样本数据和在目标业务场景内的与智能机器人的目标用户相关的第二智能样本数据，其中第二智能样本数据包括第二用户特征信息、第二业务数据和第二话术特征信息，并且根据第二样本数据和指定业务目标，对训练后的第一业务目标预测模型进行微调的操作，包括：根据第二非智能样本数据，对使用第一样本数据训练后的第一业务目标预测模型进行预训练；根据第二用户特征信息和第二业务数据，对使用第二非智能样本数据预训练后的第一业务目标预测模型进行微调；以及根据第二用户特征信息、第二话术特征信息和指定业务目标，对微调后的第一业务目标预测模型进行微调。

具体地，在指定业务场景为生日活动智能电销场景的情况下，第二样本数据包括智能电销场景内的非智能电销数据(对应于第二非智能样本数据)和智能电销数据(对应于第二智能样本数据)。其中这里的非智能电销数据为在智能电销场景内的非智能机器人电销操作产生的样本数据，例如人工电销、短信电销等产生的样本数据。这里的智能电销数据为在智能电销业务场景内的智能机器人电销操作产生的样本数据。第二样本数据包括第二用户特征信息、第二业务数据和第二话术特征信息。其中第二用户特征信息为生日活动智能电销场景中的用户的用户特征信息，第二业务数据为生日活动智能电销场景中的用户的提现与否信息，第二话术特征信息为生日活动智能电销场景中的各个话术用语的特征信息。

进一步地，参照图4所示，在基于第一样本数据通过上述步骤完成对第一业务目标预测模型的训练后，智能客服系统去掉上述模型中的催回率预测层，只保留用户特征编码和话术特征编码拼接层，后接一层提现与否预测层，得到一个转化率模型。然后使用第二非智能样本数据对该转化率模型进行预训练，在此基础上，使用第二用户特征信息作为x，话术特征编码层固定不训练，提现与否信息作为y，训练转化率模型，让模型学习用户特征信息与转化率之间的关联关系。

进一步地，智能客服系统根据第二用户特征信息、第二话术特征信息和指定业务目标，对微调后的第一业务目标预测模型(即，转化率模型)进行微调。具体为，利用第二用户特征信息和第二话术特征信息作为x，转化与否作为y，训练转化率预测模型，让模型学习用户特征信息和话术特征信息共同与转化率之间关系。通过这种方式，能够让模型更精准的学习指定业务场景中的用户特征信息和话术特征信息共同与转化率之间的关联关系。

可选地，第二话术特征信息由多个话术节点所包含的话术用语对应的话术特征信息组成，并且生成指定业务目标预测模型之后，还包括：分别利用多个话术节点所包含的话术用语对应的话术特征信息，对指定业务目标预测模型进行微调，生成与多个话术节点对应的多个指定业务目标预测模型。

具体地，通过上述一系列训练操作后，指定业务目标预测模型已经学会了大量用户特征信息之间的关系，用户特征信息与话术特征信息之间的关系，用户特征信息和话术特征信息共同与转化率之间的关系。此时再在各个话术节点少量数据上分别微调模型，就能在各个话术节点上获得较好效果。即，分别利用多个话术节点所包含的话术用语对应的话术特征信息，对指定业务目标预测模型进行微调，生成与多个话术节点对应的多个指定业务目标预测模型。通过这种方式，能够获得不同的业务目标预测模型应用于各个话术节点，使得业务目标预测模型在各个话术节点上获得最优的预测效果，进一步提高了业务目标预测模型的预测精准率。

此外，参照图4所示，在对指定业务目标预测模型进行训练的过程中，智能客服系统可以从离指定业务目标较远的数据到离指定业务目标较近的数据依次进行训练。其中，离指定业务目标较远的数据为与指定业务目标对应的目标业务场景差异较大的其他业务场景产生的样本数据，离指定业务目标较近的数据为与指定业务目标对应的目标业务场景类似的其他业务场景产生的样本数据。例如：在指定业务目标为电销转化率以及对应的业务场景为生日活动智能电销场景的情况下，离指定业务目标较远的数据可以为催收业务场景产生的数据，离指定业务目标较近的数据可以为首次借款智能电销场景产生的数据。

其中，参照图4所示，使用从离指定业务目标较远的数据到离指定业务目标较近的数据依次进行训练指定业务目标预测模型的具体操作如下：对于每一个和指定业务目标相关的数据进行模型预训练，学习外部数据知识，和指定业务目标关系越密切的数据越晚训练，这样可以让模型更符合业务目标。如果有用户特征信息与业务目标直接关联大量数据，则可以先训练用户特征与业务目标预测模型。利用上一步模型加上话术特征信息，训练用户特征加话术特征微调话术节点业务目标预测模型。最后，为了能够在各个话术节点上效果最优，在第一步得到的通用模型上，利用各个话术节点数据微调最后的模型，让模型能够在各个话术节点达到最优。

参照图5所示，下面用消费金融电销场景举例，具体为一款循环额度的消费分期产品在生日活动场景中实现精准营销的案例，此场景的业务目标是电销转化率，对指定业务目标预测模型进行训练的具体操作步骤如下：

1)在催收业务场景和首次借款智能电销场景进行预训练，得到用户特征话术特征与业务目标的基础模型。

a)使用所有有过还款行为的用户的用户特征作信息为x，还款与否信息作为y，构建用户特征信息到还款与否信息的还款预测模型，让模型学习用户特征信息之间的关联知识。其中所有有过还款行为的用户包括有过催收动作的用户和不催收就自动还款的用户，其中有过催收动作的用户例如包括智能机器人催收的用户、人工催收的用户以及短信催收的用户等等。

b)使用上述模型训练好的用户特征与还款与否的基础关系，去掉目标层(还款与否预测层)后和话术编码层进行拼接，然后再接一层与催回与否预测层(催回率预测层)，使用催回智能电销数据中的用户特征信息和话术特征信息作为x，催回与否信息作为y训练催回率预测模型，让模型学习用户特征信息与话术特征信息之间的关联关系。

c)去掉上述模型的催回率预测层，只保留用户特征编码和话术特征编码拼接层，后接一层提现与否预测层，使用用户特征信息作为x，话术特征编码层固定不训练，提现与否信息作为y，训练转化率模型，学习用户特征信息与转化率之间的关联关系。

d)直接使用上述模型，使用用户首次借款智能电销数据中的用户特征信息和话术特征信息作为x，转化与否信息作为y训练转化率预测模型，让模型学习用户特征信息和话术特征信息共同与转化率之间的关系。

e)由于已经使用了用户特征信息与提现与否信息进行微调，这里不再微调，直接进行下一步。

f)这一步和步骤d)一样，只是数据换成了目标话术的数据，让模型更精准的学习目标业务场景中的用户特征信息和话术特征信息共同与转化率之间的关系。

2)通过上面两个场景数据预训练与微调，模型已经学会了大量用户特征信息之间关系，用户特征信息与话术特征信息之间的关系，用户特征信息和话术特征信息共同与转化率之间的关系，此时再在生日活动智能电销场景中的各个话术节点少量数据上分别微调模型，就能在各个话术节点上获得较好效果。

从而，本申请所提出的话术预测的方法能够实现以下有益效果：

1)由于在智能电销才开始使用时，外呼的数据量非常少，此时使用少量数据训练模型效果会比较差。但此时历史沉淀的用户特征与用户申请循环额度消费的数据的数据量十分庞大，因此可以使用数据量庞大的用户特征与用户申请循环额度消费的数据对模型进行预训练，增加模型对用户是否申请额度的理解，提高智能电销冷启动模型的效果。从而解决了无电销数据冷启动问题。

2)如果在智能电销前，已经有大量智能催收的数据，则可以利用智能催收的数据，让模型学习用户特征加话术与催回与否的关系，让模型理解用户特征与话术共同建模的信息，提高智能电销冷启动模型的效果。从而解决了跨业务场景冷启动问题。

3)在智能电销提醒用户首次借款场景有大量的外呼数据，而在智能电销用户生日活动促效场景数据就非常少，此时可以利用用户首次借款场景模型学习到的知识，提高用户生日活动促效场景的效果。从而解决了场景类话术量较少问题。

4)在智能电销外呼一定时间后，为了提升效果，需要尝试新的话术方案时，此时可以利用旧模型学到的一些知识，提高新话术在较少外呼量时的效果。从而解决了新话术冷启动问题。

5)在智能电销外呼一定时间后，同一个机器人中不同话术节点到达的数据量不同，则可以利用所有节点话术外呼数据让模型学习用户特征加话术特征与转化与否之间的通用关系，让话术节点到达量比较少的节点效果提升。从而解决了多轮对话较深话术节点到达少问题。

需要补充说明的是，本申请所提出的技术方案首先利用用户特征与业务目标在大量非业务目标数据上进行预训练，学习用户特征与业务目标通用关系，然后再在对应任务小数据上进行微调训练来提高目标任务的效果。并且，本申请还可以根据智能外呼特点，把智能外呼相关数据与业务目标按相关性顺序预训练，尽可能学习用户特征之间的关联知识，用户特征与话术特征之间的关联知识，提升各种阶段小样本模型效果。此外，本方案包括但不限于深度学习模型，只要能够在特定数据上预训练，然后在后续数据微调的模型都可以。并且本申请所提出的技术方案适用于所有智能语音话术预测场景，包括但不限于智能外呼、呼入、语音催收、回访、电销等场景，也适用于文本多轮对话话术预测场景。

此外，参考图1所示，根据本实施例的第二个方面，提供了一种存储介质。存储介质包括存储的程序，其中，在程序运行时由处理器执行以上任意一项所述的方法。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

图6示出了根据本实施例所述的话术预测的装置600，该装置600与根据实施例1的第一个方面所述的方法相对应，用于从由多个话术用语组成的话术用语集合中确定与用户相匹配的目标话术用语。参考图6所示，该装置600包括：获取模块610，用于获取与用户相关联的用户特征信息；第一确定模块620，用于利用预先设置的用于针对指定业务目标预测话术用语的业务目标值的指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值；以及第二确定模块630，用于根据业务目标值，从话术用语集合中确定与用户相匹配的目标话术用语，其中不同的业务目标对应于不同的业务场景，指定业务目标预测模型基于第一样本数据和第二样本数据训练得到，第一样本数据为与指定业务目标对应的目标业务场景不同的其他业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据。

可选地，多个话术用语由多个话术节点包含的话术用语组成，多个话术节点分别包含至少一个话术用语，指定业务目标预测模型包括分别对应于多个话术节点的多个业务目标预测模型，并且第一确定模块620包括：确定子模块，用于分别利用多个业务目标预测模型，根据用户特征信息确定多个话术节点中的每个话术用语对应于指定业务目标的业务目标值。

可选地，第一确定模块620包括：第一获取子模块，用于获取与多个话术用语分别对应的多个话术用语特征信息；生成子模块，用于将用户特征信息分别与多个话术用语特征信息组合，生成与用户以及各个话术用语对应的多个特征组；以及确定子模块，用于利用指定业务目标预测模型对多个特征组进行预测，确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值。

可选地，装置600还包括训练模块，用于训练指定业务目标预测模型，并且训练模块包括：第二获取子模块，用于获取第一样本数据和第二样本数据，其中第一样本数据为与指定业务目标对应的目标业务场景不同的第一业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据；训练子模块，用于根据第一样本数据和与第一业务场景对应的第一业务目标，对用于针对第一业务目标预测话术用语的业务目标值的第一业务目标预测模型进行训练；以及微调子模块，用于根据第二样本数据和指定业务目标，对训练后的第一业务目标预测模型进行微调，生成指定业务目标预测模型。

可选地，第一样本数据包括在第一业务场景内的与非智能机器人的目标用户相关的第一非智能样本数据和在第一业务场景内的与智能机器人的目标用户相关的第一智能样本数据，其中第一智能样本数据包括第一用户特征信息、第一业务数据和第一话术特征信息，并且训练子模块，包括：第一预训练单元，用于根据第一非智能样本数据，对第一业务目标预测模型进行预训练；训练单元，用于根据第一用户特征信息和第一业务数据，对预训练后的第一业务目标预测模型进行训练；以及第一微调单元，用于根据第一用户特征信息、第一话术特征信息和第一业务目标，对训练后的第一业务目标预测模型进行微调。

可选地，第二样本数据包括在目标业务场景内的与非智能机器人的目标用户相关的第二非智能样本数据和在目标业务场景内的与智能机器人的目标用户相关的第二智能样本数据，其中第二智能样本数据包括第二用户特征信息、第二业务数据和第二话术特征信息，并且微调子模块，包括：第二预训练单元，用于根据第二非智能样本数据，对使用第一样本数据训练后的第一业务目标预测模型进行预训练；第二微调单元，用于根据第二用户特征信息和第二业务数据，对使用第二非智能样本数据预训练后的第一业务目标预测模型进行微调；以及第三微调单元，用于根据第二用户特征信息、第二话术特征信息和指定业务目标，对微调后的第一业务目标预测模型进行微调。

可选地，训练模块还包括：生成子模块，用于分别利用多个话术节点所包含的话术用语对应的话术特征信息，对指定业务目标预测模型进行微调，生成与多个话术节点对应的多个指定业务目标预测模型。

从而根据本实施例，由于指定业务目标预测模型是基于数据量大的与指定业务目标对应的目标业务场景不同的其他业务场景产生的第一样本数据以及与指定业务目标对应的目标业务场景产生的第二样本数据共同训练得到的，因此在第二样本数据较少的情况下，可以在数据量大的第一样本数据上对指定业务目标预测模型进行预训练，以此来提高指定业务目标预测模型的学习量，然后再在对应的数据量较少的第二样本数据上进行微调训练来提高指定业务目标预测模型的预测精准度。因此，在指定业务目标对应的目标业务场景产生的样本数据较少的情况下，也能够保证训练得到的指定业务目标预测模型的学习量和预测效果。从而，在将用户特征信息输入指定业务目标预测模型后，所输出的话术用语集合中每个话术用语对应于指定业务目标的业务目标值的精准度高。达到了在指定业务目标对应的用户外呼数据较少或者对话节点达到较少的情况下，仍然能够为指定业务目标预测模型提供足够的样本训练，提高指定业务目标预测模型的学习量，从而提高指定业务目标预测模型的预测精准度的技术效果。进而解决了现有技术中存在的在用户外呼数据较少或者对话节点达到较少时，用于预测话术用语的预测模型无法获取足够的样本训练，使得预测模型学习不足，导致预测精准度低的技术问题。

实施例3

图7示出了根据本实施例所述的话术预测的装置700，该装置700与根据实施例1的第一个方面所述的方法相对应，用于从由多个话术用语组成的话术用语集合中确定与用户相匹配的目标话术用语。参考图7所示，该装置700包括：处理器710；以及存储器720，与处理器710连接，用于为处理器710提供处理以下处理步骤的指令：获取与用户相关联的用户特征信息；利用预先设置的用于针对指定业务目标预测话术用语的业务目标值的指定业务目标预测模型，根据用户特征信息确定话术用语集合中每个话术用语对应于指定业务目标的业务目标值；以及根据业务目标值，从话术用语集合中确定与用户相匹配的目标话术用语，其中不同的业务目标对应于不同的业务场景，指定业务目标预测模型基于第一样本数据和第二样本数据训练得到，第一样本数据为与指定业务目标对应的目标业务场景不同的其他业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据。

可选地，存储器720还用于为处理器710提供处理以下处理步骤的指令：根据以下步骤训练指定业务目标预测模型：获取第一样本数据和第二样本数据，其中第一样本数据为与指定业务目标对应的目标业务场景不同的第一业务场景产生的样本数据，第二样本数据为与指定业务目标对应的目标业务场景产生的样本数据；根据第一样本数据和与第一业务场景对应的第一业务目标，对用于针对第一业务目标预测话术用语的业务目标值的第一业务目标预测模型进行训练；以及根据第二样本数据和指定业务目标，对训练后的第一业务目标预测模型进行微调，生成指定业务目标预测模型。

可选地，第二样本数据包括在目标业务场景内的与非智能机器人的目标用户相关的第二非智能样本数据和在目标业务场景内的与智能机器人的目标用户相关的第二智能样本数据，其中第二智能样本数据包括第二用户特征信息、第二业务数据和第二话术特征信息，并且根据第二样本数据和指定业务目标，对训练后的第一业务目标预测模型进行微调的操作，包括：根据第二非智能样本数据，对使用第一样本数据训练后的第一业务目标预测模型进行预训练；根据第二用户特征信息和第二业务数据，对使用第二非智能样本数据预训练后的第一业务目标预测模型进行微调；以及根据第二用户特征信息、第二话术特征信息和指定业务目标，对微调后的第一业务目标预测模型进行微调。

可选地，第二话术特征信息由多个话术节点所包含的话术用语对应的话术特征信息组成，并且存储器720还用于为处理器710提供处理以下处理步骤的指令：生成指定业务目标预测模型之后，分别利用多个话术节点所包含的话术用语对应的话术特征信息，对指定业务目标预测模型进行微调，生成与多个话术节点对应的多个指定业务目标预测模型。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于递归算法的审计知识推荐系统及方法与流程

话术预测的方法、装置以及存储介质与流程

相关文献

最热文献