对话术文本信息进行检测的方法、装置以及存储介质与流程

2021-10-23 01:42:00 来源：中国专利 TAG：人工智能检测方法装置文本对话

1.本技术涉及人工智能领域，特别是涉及一种对话术文本信息进行检测的方法、装置以及存储介质。

背景技术：

2.目前，基于ai技术的语音机器人的产品和服务方兴未艾。基于语音机器人外呼中心的技术，可以完成电销、售前、售后、回访、提醒、催收、调研、客户关怀等各种商业场景的与语音相关的任务。
3.语音机器人使用商根据其目标任务对语音机器人进行配置，通过配置固定的或半固定的话术来限定机器人说话的内容，这样使得任务目标明确，对使用商来说修改配置也非常方便。但是语音机器人使用商往往都是按照自己的商业任务或目的设置话术，不一定考虑到用户的心理感受和接受程度。因此对语音机器人的话术进行检测成为一种必要。
4.现有的对语音机器人的话术进行检测的方法是在机器人语音对话工作中进行检测的，这种方法无法预防话术风险，并且这种检测方法是对整个对话的整体的评估，只有打分来标定好坏，没有办法细节指出问题所在，对话术改进工作指导意义不大。
5.针对上述的现有技术中存在的对语音机器人的话术进行检测的方法是在机器人语音对话工作中进行检测的，这种方法无法预防话术风险，并且这种检测方法是对整个对话的整体的评估，没有办法细节指出问题所在，对话术改进工作指导意义不大的技术问题，目前尚未提出有效的解决方案。

技术实现要素：

6.本公开的实施例提供了一种对话术文本信息进行检测的方法、装置以及存储介质，以至少解决现有技术中存在的对语音机器人的话术进行检测的方法是在机器人语音对话工作中进行检测的，这种方法无法预防话术风险，并且这种检测方法是对整个对话的整体的评估，没有办法细节指出问题所在，对话术改进工作指导意义不大的技术问题。
7.根据本公开实施例的一个方面，提供了一种对话术文本信息进行检测的方法，包括：获取话术文本信息；利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题；以及在话术文本信息存在质量问题的情况下，输出与质量问题对应的告警信息。
8.根据本公开实施例的另一个方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时由处理器执行以上任意一项所述的方法。
9.根据本公开实施例的另一个方面，还提供了一种对话术文本信息进行检测的装置，包括：获取模块，用于获取话术文本信息；检测模块，用于利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题；以及输出模块，用于在话术文本信息存在质量问题的情况下，输出与质量问题对应的告警信息。
10.根据本公开实施例的另一个方面，还提供了一种对话术文本信息进行检测的装
置，包括：处理器；以及存储器，与处理器连接，用于为处理器提供处理以下处理步骤的指令：获取话术文本信息；利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题；以及在话术文本信息存在质量问题的情况下，输出与质量问题对应的告警信息。
11.在本公开实施例中，对语音机器人的话术文本信息进行检测是在话术文本信息上线之前进行，对话术文本信息存在的风险可以做到提前预防，以便对话术文本信息进行改进。并且本发明对话术文本信息进行检测是对话术文本信息中的各个细节进行检测，并在某个细节出现质量问题的情况下，输出与该细节的质量问题对应的告警信息。从而提醒和辅助机器人使用商完善或优化语音机器人配置，使之更好的完成目标任务。
12.进而解决了现有技术中存在的对语音机器人的话术进行检测的方法是在机器人语音对话工作中进行检测的，这种方法无法预防话术风险，并且这种检测方法是对整个对话的整体的评估，没有办法细节指出问题所在，对话术改进工作指导意义不大的技术问题。
附图说明
13.此处所说明的附图用来提供对本公开的进一步理解，构成本技术的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：
14.图1是用于实现根据本公开实施例1所述的方法的计算机终端的硬件结构框图；
15.图2是根据本公开实施例1的第一个方面所述的对话术文本信息进行检测的方法的流程示意图；
16.图3是根据本公开实施例1的第一个方面所述的对话术文本信息进行检测的方法的架构示意图；
17.图4是根据本公开实施例2所述的对话术文本信息进行检测的装置的示意图；以及
18.图5是根据本公开实施例3所述的对话术文本信息进行检测的装置的示意图。
具体实施方式
19.为了使本技术领域的人员更好地理解本公开的技术方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。
20.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
21.实施例1
22.根据本实施例，提供了一种对话术文本信息进行检测的的方法实施例，需要说明
的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。
23.本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现对话术文本信息进行检测的计算设备的硬件结构框图。如图1所示，计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外，还可以包括：显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为i/o接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算设备还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。
24.应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
25.存储器可用于存储应用软件的软件程序以及模块，如本公开实施例中的对话术文本信息进行检测的方法对应的程序指令/数据存储装置，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的对话术文本信息进行检测的方法。存储器可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
26.传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中，传输装置包括一个网络适配器(network interface controller，nic)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置可以为射频(radio frequency，rf)模块，其用于通过无线方式与互联网进行通讯。
27.显示器可以例如触摸屏式的液晶显示器(lcd)，该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
28.此处需要说明的是，在一些可选实施例中，上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是，图1仅为特定具体实例的一个实例，并且旨在示出可存在于上述计算设备中的部件的类型。
29.根据本实施例的第一个方面，提供了一种对话术文本信息进行检测的方法。图2示出了该方法的流程示意图，参考图2所示，该方法包括：
30.s202：获取话术文本信息；
31.s204：利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，
判断话术文本信息是否存在质量问题；以及
32.s206：在话术文本信息存在质量问题的情况下，输出与质量问题对应的告警信息。
33.具体地，参考图3所示，首先计算设备获取语音机器人的话术文本信息，其中该话术文本信息可以是售前、售后、回访、提醒、催收、调研、客户关怀等等与具体业务场景相关的话术文本信息。然后，计算设备利用至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题。其中计算设备对话术文本信息进行检测是在话术文本信息上线之前进行的。质量检测模型可以是对话术文本的发音时长进行检测的质量检测模型，也可以是对话术文本信息的意图是否明确进行检测的质量检测模型，也可以是对话术文本信息中是否包含一些违规词语进行检测的质量检测模型，也可以是对话术文本信息中其他的细节进行检测的质量检测模型。
34.进一步地，在话术文本信息存在质量问题的情况下，计算设备输出与质量问题对应的告警信息。例如，当计算设备检测到话术文本信息的时长超过预定的阈值，输出时长告警信息；当计算设备检测到话术文本信息的意图不够明确时，输出意图不明确告警信息；当计算设备检测到话术文本信息中含有让用户感到不适的违规词语，输出违规词语告警信息。从而通过对话术文本信息的各个细节进行检测，有利于后期对话术文本信息进行改进。
35.正如背景技术中所述的，现有的对语音机器人的话术进行检测的方法是在机器人语音对话工作中进行检测的，这种方法无法预防话术风险，并且这种检测方法是对整个对话的整体的评估，只有打分来标定好坏，没有办法细节指出问题所在，对话术改进工作指导意义不大。
36.为了解决该技术问题，本实施例对语音机器人的话术文本信息进行检测是在话术文本信息上线之前进行，对话术文本信息存在的风险可以做到提前预防，以便对话术文本信息进行改进。并且本实施例对话术文本信息进行检测是对话术文本信息中的各个细节进行检测，并在某个细节出现质量问题的情况下，输出与该细节的质量问题对应的告警信息。从而提醒和辅助机器人使用商完善或优化语音机器人配置，使之更好的完成目标任务。
37.进而解决了现有技术中存在的对语音机器人的话术进行检测的方法是在机器人语音对话工作中进行检测的，这种方法无法预防话术风险，并且这种检测方法是对整个对话的整体的评估，没有办法细节指出问题所在，对话术改进工作指导意义不大的技术问题。
38.可选地，利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题的操作，包括：将话术文本信息拆分成字词序列，并确定字词序列中的字词的字词发音时长；根据字词的字词发音时长，确定话术文本信息的总发音时长和/或话术文本信息中的句子的单句发音时长；以及根据所确定的总发音时长和/或单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题。
39.具体地，计算设备将话术文本信息拆分成字词序列，并确定字词序列中的字词的字词发音时长，并根据字词的字词发音时长，确定话术文本信息的总发音时长和/或话术文本信息中的句子的单句发音时长。
40.例如，在本实施例中，计算设备将话术文本信息text按标点划分为句子序列：text＝(c1,c2,c3,
…
)，对序列中每个句子cx，进行文本分词，表示为字词序列：cx＝(w1,w2,w3,
…
)。计算设备将每个句子cx的字词序列cx＝(w1,w2,w3,
…
)输入预先设置的文本语音对齐模型，确定每个字词wx的发音时长预估值，对每个字词wx的发音时长预估值进行求和，
得到每个句子cx的单句发音时长，再对每个句子cx的单句发音时长进行求和，得到话术文本信息text的总发音时长。其中，文本语音对齐模型可以预测话术文本信息中的每个字词的发音时长预估值，从而预估整个话术文本的总发音时长。
41.进一步地，计算设备根据所确定的总发音时长和/或单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题。例如，当总发音时长大于总发音阈值时长和/或单句发音时长大于单句发音阈值时长时，确定话术文本信息存在与发音时长相关的质量问题。
42.从而，通过对话术文本信息的时长是否存在质量问题进行检测，从话术文本信息的时长细节上对话术文本信息进行检测，以便对话术文本信息的时长进行改善，从而避免由于话术文本信息过于冗长，导致用户不耐烦，打断电话。
43.可选地，根据所确定的总发音时长和/或单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题的操作，包括：将话术文本信息的总发音时长与预先设置的第一时长告警阈值进行对比，和/或将话术文本信息中的句子单句发音时长与预先设置的第二时长告警阈值进行对比；以及在话术文本信息的总发音时长大于预先设置的第一时长告警阈值的情况下，和/或在话术文本信息中的句子的单句发音时长大于预先设置的第二时长告警阈值的情况下，确定话术文本信息是否存在与发音时长相关的质量问题。
44.具体地，计算设备将话术文本信息的总发音时长与预先设置的第一时长告警阈值进行对比，和/或将话术文本信息中的句子单句发音时长与预先设置的第二时长告警阈值进行对比；以及在话术文本信息的总发音时长大于预先设置的第一时长告警阈值的情况下，和/或在话术文本信息中的句子的单句发音时长大于预先设置的第二时长告警阈值的情况下，确定话术文本信息是否存在与发音时长相关的质量问题。
45.例如，话术文本信息的总发音时长为8分钟，预先设置的第一时长告警阈值为5分钟，计算设备将话术文本信息的总发音时长8分钟与预先设置的第一时长告警阈值5分钟进行比较，判定话术文本信息的总发音时长8分钟大于预先设置的第一时长告警阈值5分钟，确定话术文本信息存在与发音时长相关的质量问题。例如，话术文本信息中的句子的单句发音时长为50秒，预先设置的第二时长告警阈值为30秒，计算设备将话术文本信息中的句子的单句发音时长50秒与预先设置的第二时长告警阈值30秒进行比较，判定话术文本信息中的句子的单句发音时长50秒大于预先设置的第二时长告警阈值30秒，确定话术文本信息存在与发音时长相关的质量问题。
46.此外，不管是话术文本信息的总发音时长大于预先设置的第一时长告警阈值，还是话术文本信息中的句子的单句发音时长大于预先设置的第二时长告警阈值，又或者是话术文本信息的总发音时长大于预先设置的第一时长告警阈值并且话术文本信息中的句子的单句发音时长大于预先设置的第二时长告警阈值，计算设备都会判定话术文本信息存在与发音时长相关的质量问题。
47.从而，将对话术文本信息的总发音时长和预先设置的第一时长告警阈值进行对比，将话术文本信息中的句子的单句发音时长与预先设置的第二告警阈值进行对比，判定话术文本信息是否存在与发音时长相关的质量问题，可以对话术文本信息的时长进行防控，以便后期对话术文本信息的时长进行改善。
48.可选地，根据所确定的总发音时长和/或单句发音时长，确定话术文本信息是否存
在与发音时长相关的质量问题的操作，还包括：确定话术文本信息中的句子在话术文本信息中的位置信息；以及根据位置信息以及单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题。
49.具体地，计算设备确定话术文本信息中的句子在话术文本信息中的位置信息；以及根据位置信息以及单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题。
50.例如，计算设备将话术文本信息text按标点划分为句子序列：text＝(c1,c2,c3,
…
)，cx表示话术文本信息text中的句子，当x＝2，即c2表示在话术文本信息text中的第二个句子。计算设备根据c2表示在话术文本信息text中的第二个句子以及c2的发音时长为1分钟，通过概率模型确定话术文本信息中的句子被打断的概率。从而，当话术文本信息中的句子被打断的概率大于预设的概率阈值的情况下，输出与语音时长相关的质量问题的告警信息。
51.可选地，根据位置信息以及单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题的操作，包括：在话术文本信息中的句子被打断的概率大于预先设置的概率阈值的情况下，确定话术文本信息是否存在与发音时长相关的质量问题。
52.具体地，计算设备在话术文本信息中的句子被打断的概率大于预先设置的概率阈值的情况下，确定话术文本信息是否存在与发音时长相关的质量问题。例如，话术文本信息text中的某个句子cx被打断的概率为80％，预先设置的概率阈值为50％，话术文本信息中的句子cx被打断的概率大于预先设置的概率阈值，计算设备确定话术文本信息text存在与发音时长相关的质量问题。
53.从而，通过对话术文本信息中的句子被打断的概率进行检测，将话术文本信息被打断的概率控制在一定范围，以便为用户提供最佳的通话体验，不会因为烦躁打断电话，使得语音机器人更好的完成任务。
54.可选地，利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题的操作，还包括：确定与话术文本信息对应的话术特征向量；分别确定话术特征向量与预先设置的多个意图特征向量之间的距离值；根据话术特征向量与多个意图特征向量之间的距离值，确定话术文本信息是否存在与话术意图相关的质量问题。
55.具体地，计算设备首先确定与话术文本信息对应的话术特征向量。其中，例如但不限于，话术文本信息text的话术特征向量为(x1,x2,x3,
…
)。然后，计算设备分别确定话术文本信息text的话术特征向量为(x1,x2,x3,
…
)与预先设置的多个意图特征向量之间的距离值，例如，话术文本信息text的话术特征向量与意图特征向量text1的特征向量(例如，(y1,y2,y3,
…
))的距离值q1为：与意图特征向量text2的特征向量(例如，(z1,z2,z3,
…
))的距离值q2为：当然计算设备也可以确定话术文本信息text的特征向量与意图特征向量text3的距离值q3等，此处不再赘述。
56.进一步地，计算设备根据话术特征向量与多个意图特征向量之间的距离值，例如q1和q2，确定话术文本信息是否存在与话术意图相关的质量问题。从而，确定话术文本信息
的意图是否明确，能否被用户所理解，更好的帮助机器人使用商完成商业目的。
57.可选地，根据话术特征向量与多个意图特征向量之间的距离值，确定话术文本信息是否存在与话术意图相关的质量问题的操作，包括：确定与话术特征向量的距离值小于第一预定阈值的意图特征向量的数量；以及在确定意图特征向量的数量大于第二预定阈值情况下，确定话术文本信息存在与话术意图相关的质量问题。
58.具体地，计算设备确定与话术特征向量的距离值小于第一预定阈值(例如，q)的意图特征向量的数量(例如，m)。其中，当意图特征向量的数量与话术特征向量的距离值小于第一预定阈值(例如，q)，表示话术特征向量中包含意图特征向量中的意图。例如，当话术文本信息text的话术特征向量与意图特征向量text1的特征向量的距离值q1小于第一预定阈值(例如，q)，话术文本信息text的话术特征向量包含意图特征向量text1的意图，例如，意图特征向量text1的意图为“生日快乐”，那么话术特征向量中包含“生日快乐”的意图。意图特征向量的数量(例如，m)表示话术文本信息中包含了几种意图。
59.进一步地，计算设备在确定意图特征向量的数量(例如，m)大于第二预定阈值(例如，n)情况下，确定话术文本信息存在与话术意图相关的质量问题。参考上述所述，意图特征向量的数量(例如，m)表示表示话术文本信息中包含了几种意图，意图特征向量的数量(例如，m)大于第二预定阈值(例如，n)情况下，即话术文本信息表示的意图有多种，超过了第二预定阈值(例如，n)。这种情况说明话术文本信息中包含的意图数量已经超过了可以让用户理解的数量，话术文本信息的意图不够明确，从而确定话术文本信息存在与话术意图相关的质量问题。
60.当话术文本信息中包含意图数量大于预设值的情况时，话术文本信息所表达的含义不太清楚，容易让用户产生误解，甚至导致用户无法理解话术文本信息的含义。从而，通过对话术文本信息的意图进行检测，以便对话术文本信息的意图进行改善。
61.可选地，利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题的操作，还包括：检测话术文本信息中包含的违规字词；以及根据所检测的违规字词，确定话术文本信息是否存在与违规字词相关的质量问题。
62.具体地，计算设备利用预先设置的至少一种类型的质量检测模型，检测话术文本信息中包含的违规字词，并且根据所检测到的违规字词，确定话术文本信息是否存在与违规字词相关的质量问题。例如，话术文本信息中包含侮辱、恐吓、刺激、激怒、违规字、马上还款、计入征信等违规字词，计算设备根据这些违规字词，确定话术文本信息是否存在与违规字词相关的质量问题。从而，本实施例通过检测话术文本信息中是否包含违规字词，确定是否要对话术文本信息进行改进，以便使得语音机器人更好的完成任务。
63.可选地，检测话术文本信息中包含的违规字词的操作，包括：检测话术文本信息中是否包含第一违规字词列表中的违规字词，以及在话术文本信息中包含第一违规字列表中的违规字词的情况下，确定话术文本信息存在与违规字词相关的质量问题。
64.具体地，计算设备首先检测话术文本信息中是否包含第一违规字词列表中的违规字词，例如，第一违规字词列表中包含侮辱、恐吓、刺激、激怒、违法违规字词等。然后在话术文本信息中包含第一违规字词的情况下，计算设备确定话术文本信息存在与违规字词相关的质量问题。例如，话术文本信息为催收类的话术，“快还钱”，该话术文本信息中包含“快还
钱”，属于催收类的违规字词。因此，计算设备确定“快还钱”的话术文本信息存在与违规字词相关的质量问题。从而，本实施例通过将话术文本信息中违规词语进行检测，以便对违规词语进行处理，进而对话术文本信息进行改善。
65.可选地，检测话术文本信息中包含的违规字词的操作，还包括：检测话术文本信息中是否包含第二违规字词列表中的违规字词；在第二违规字词列表中的违规字词的权重大于预定的权重阈值的情况下，确定话术文本信息存在与违规字词相关的质量问题。
66.具体地，计算设备还可以检测话术文本信息中是否包含第二违规字词列表中的违规字词，并且在第二违规字词列表中的违规字词的权重大于预定的权重阈值的情况下，确定话术文本信息存在与违规字词相关的质量问题。其中，第二违规字词列表中根据具体业务而不同，且每个字词有不同的权重。比如账目催收机器人话术中的“马上还款”、“计入征信”、“追究违约责任”、“影响生活”等等，这些词语在正常话术中是可以使用的，但是因为在账目催收的情景下，会对接听的用户造成负面心理影响，所以不宜在同一通账目催收话术文本信息中集中、大量、重复、连续的使用。
67.例如，以催收话术文本信息为例，第二违规字词列表包含部分内容为：“还钱”的权重为0.2，“追究责任”的权重为0.15，“记录征信”的权重为0.1。例如，话术文本信息中的预定的权重阈值设定为0.5，则以下面两个话术文本信息为例：
[0068]“您若不及时还钱，该行为可能被记录征信。”的第二违规字词列表中的违规字词的权重为：0.2 0.1＝0.3<0.5，则判断“您若不及时还钱，该行为可能被记录征信。”话术文本信息不存在与违规字词相关的质量问题；“本次跟您通话就说三件事：还钱、还钱、还钱。”的第二违规字词列表中的违规字词的权重为：0.2 0.2 0.2＝0.6>0.5，则判断“本次跟您通话就说三件事：还钱、还钱、还钱。”话术文本信息存在与违规字词相关的质量问题。从而，控制在特定场景下的让用户有压力感的字词控制在一定权重内，使得用户有耐心听完话术文本信息。
[0069]
此外，参考图1所示，根据本实施例的第二个方面，提供了一种存储介质104。所述存储介质104包括存储的程序，其中，在所述程序运行时由处理器执行以上任意一项所述的方法。
[0070]
从而，本实施例中对语音机器人的话术文本信息进行检测是在话术文本信息上线之前进行，对话术文本信息存在的风险可以做到提前预防，以便对话术文本信息进行改进。并且本实施例对话术文本信息进行检测是对话术文本信息中的各个细节进行检测，并在某个细节出现质量问题的情况下，输出与该细节的质量问题对应的告警信息。从而提醒和辅助机器人使用商完善或优化语音机器人配置，使之更好的完成目标任务。
[0071]
进而解决了现有技术中存在的对语音机器人的话术进行检测的方法是在机器人语音对话工作中进行检测的，这种方法无法预防话术风险，并且这种检测方法是对整个对话的整体的评估，没有办法细节指出问题所在，对话术改进工作指导意义不大的技术问题。
[0072]
此外，本实施例中的质量检测模型都是为了对话术文本信息可能存在的问题提出告警和分析，从而提高语音机器人话术文本信息的合理性以及有效性。本实施例中的质量检测模型可以根据应用场景任意调整模块的工作顺序或优先级。本实施例中所涉及到的质量检测模型、阈值的训练方法、计算方法没有限定，都是可以替代的，可以优化的。本实施例中的文本特征向量的计算方法，也不一定必须是tf-idf，例如也可以用词嵌入计算，bert
等。
[0073]
需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。
[0074]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。
[0075]
实施例2
[0076]
图4示出了根据本实施例所述的对话术文本信息进行检测的装置400，该装置400与根据实施例1的第一个方面所述的方法相对应。参考图4所示，该装置400包括：获取模块410，用于获取话术文本信息；检测模块420，用于利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题；以及输出模块430，用于在话术文本信息存在质量问题的情况下，输出与质量问题对应的告警信息。
[0077]
可选地，检测模块420，包括：确定字词发音子模块，用于将话术文本信息拆分成字词序列，并确定字词序列中的字词的字词发音时长；确定发音时长子模块，用于根据字词的字词发音时长，确定话术文本信息的总发音时长和/或话术文本信息中的句子的单句发音时长；以及确定时长子模块，用于根据所确定的总发音时长和/或单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题。
[0078]
可选地，确定时长子模块，包括：对比单元，用于将话术文本信息的总发音时长与预先设置的第一时长告警阈值进行对比，和/或将话术文本信息中的句子单句发音时长与预先设置的第二时长告警阈值进行对比；以及第一确定时长单元，用于在话术文本信息的总发音时长大于预先设置的第一时长告警阈值的情况下，和/或在话术文本信息中的句子的单句发音时长大于预先设置的第二时长告警阈值的情况下，确定话术文本信息是否存在与发音时长相关的质量问题。
[0079]
可选地，确定时长子模块，还包括：确定位置信息单元，用于确定话术文本信息中的句子在话术文本信息中的位置信息；以及第二确定时长单元，用于根据位置信息以及单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题。
[0080]
可选地，第二确定时长单元，包括：确定子单元，用于在话术文本信息中的句子被打断的概率大于预先设置的概率阈值的情况下，确定话术文本信息是否存在与发音时长相关的质量问题。
[0081]
可选地，检测模块420，还包括：确定特征向量子模块，用于确定与话术文本信息对应的话术特征向量；确定距离值子模块，用于分别确定话术特征向量与预先设置的多个意图特征向量之间的距离值；以及确定意图子模块，用于根据话术特征向量与多个意图特征向量之间的距离值，确定话术文本信息是否存在与话术意图相关的质量问题。
[0082]
可选地，确定意图子模块，包括：确定数量单元，用于确定与话术特征向量的距离值小于第一预定阈值的意图特征向量的数量；以及确定意图单元，用于在确定意图特征向量的数量大于第二预定阈值情况下，确定话术文本信息存在与话术意图相关的质量问题。
[0083]
可选地，检测模块420，还包括：检测子模块，用于检测话术文本信息中包含的违规字词；以及确定违规字词子模块，用于根据所检测的违规字词，确定话术文本信息是否存在与违规字词相关的质量问题。
[0084]
可选地，检测子模块，包括：第一检测单元，用于检测话术文本信息中是否包含第一违规字词列表中的违规字词，以及第一确定违规字词单元，用于在话术文本信息中包含第一违规字词列表中的违规字词的情况下，确定话术文本信息存在与违规字词相关的质量问题。
[0085]
可选地，检测子模块，还包括：第二检测单元，用于检测话术文本信息中是否包含第二违规字词列表中的违规字词；第二确定违规字词单元，用于在第二违规字词列表中的违规字词的权重大于预定的权重阈值的情况下，确定话术文本信息存在与违规字词相关的质量问题。
[0086]
从而根据本实施例，通过对话术文本信息进行检测的装置400，对语音机器人的话术文本信息进行检测是在话术文本信息上线之前进行，对话术文本信息存在的风险可以做到提前预防，以便对话术文本信息进行改进。并且本实施例对话术文本信息进行检测是对话术文本信息中的各个细节进行检测，并在某个细节出现质量问题的情况下，输出与该细节的质量问题对应的告警信息。从而提醒和辅助机器人使用商完善或优化语音机器人配置，使之更好的完成目标任务。
[0087]
进而解决了现有技术中存在的对语音机器人的话术进行检测的方法是在机器人语音对话工作中进行检测的，这种方法无法预防话术风险，并且这种检测方法是对整个对话的整体的评估，没有办法细节指出问题所在，对话术改进工作指导意义不大的技术问题。
[0088]
实施例3
[0089]
图5示出了根据本实施例所述的对话术文本信息进行检测的装置500，该装置500与根据实施例1的第一个方面所述的方法相对应。参考图5所示，该装置500包括：处理器510；以及存储器520，与处理器510连接，用于为处理器510提供处理以下处理步骤的指令：获取话术文本信息；利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题；以及在话术文本信息存在质量问题的情况下，输出与质量问题对应的告警信息。
[0090]
可选地，利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题的操作，包括：将话术文本信息拆分成字词序列，并确定字词序列中的字词的字词发音时长；根据字词的字词发音时长，确定话术文本信息的总发音时长和/或话术文本信息中的句子的单句发音时长；以及根据所确定的总发音时长和/或单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题。
[0091]
可选地，根据所确定的总发音时长和/或单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题的操作，包括：将话术文本信息的总发音时长与预先设置的第一时长告警阈值进行对比，和/或将话术文本信息中的句子单句发音时长与预先设置的第二时长告警阈值进行对比；以及在话术文本信息的总发音时长大于预先设置的第一时长
告警阈值的情况下，和/或在话术文本信息中的句子的单句发音时长大于预先设置的第二时长告警阈值的情况下，确定话术文本信息是否存在与发音时长相关的质量问题。
[0092]
可选地，根据所确定的总发音时长和/或单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题的操作，还包括：确定话术文本信息中的句子在话术文本信息中的位置信息；以及根据位置信息以及单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题。
[0093]
可选地，根据位置信息以及单句发音时长，确定话术文本信息是否存在与发音时长相关的质量问题的操作，包括：在话术文本信息中的句子被打断的概率大于预先设置的概率阈值的情况下，确定话术文本信息是否存在与发音时长相关的质量问题。
[0094]
可选地，利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题的操作，还包括：确定与话术文本信息对应的话术特征向量；分别确定话术特征向量与预先设置的多个意图特征向量之间的距离值；以及根据话术特征向量与多个意图特征向量之间的距离值，确定话术文本信息是否存在与话术意图相关的质量问题。
[0095]
可选地，根据话术特征向量与多个意图特征向量之间的距离值，确定话术文本信息是否存在与话术意图相关的质量问题的操作，包括：确定与话术特征向量的距离值小于第一预定阈值的意图特征向量的数量；以及在确定意图特征向量的数量大于第二预定阈值情况下，确定话术文本信息存在与话术意图相关的质量问题。
[0096]
可选地，利用预先设置的至少一种类型的质量检测模型对话术文本信息进行检测，判断话术文本信息是否存在质量问题的操作，还包括：检测话术文本信息中包含的违规字词；以及根据所检测的违规字词，确定话术文本信息是否存在与违规字词相关的质量问题。
[0097]
可选地，检测话术文本信息中包含的违规字词的操作，包括：检测话术文本信息中是否包含第一违规字词列表中的违规字词，以及在话术文本信息中包含第一违规字词列表中的违规字词的情况下，确定话术文本信息存在与违规字词相关的质量问题。
[0098]
可选地，检测话术文本信息中包含的违规字词的操作，还包括：检测话术文本信息中是否包含第二违规字词列表中的违规字词；以及在第二违规字词列表中的违规字词的权重大于预定的权重阈值的情况下，确定话术文本信息存在与违规字词相关的质量问题。
[0099]
从而根据本实施例，通过对话术文本信息进行检测的装置500，对语音机器人的话术文本信息进行检测是在话术文本信息上线之前进行，对话术文本信息存在的风险可以做到提前预防，以便对话术文本信息进行改进。并且本实施例对话术文本信息进行检测是对话术文本信息中的各个细节进行检测，并在某个细节出现质量问题的情况下，输出与该细节的质量问题对应的告警信息。从而提醒和辅助机器人使用商完善或优化语音机器人配置，使之更好的完成目标任务。
[0100]
进而解决了现有技术中存在的对语音机器人的话术进行检测的方法是在机器人语音对话工作中进行检测的，这种方法无法预防话术风险，并且这种检测方法是对整个对话的整体的评估，没有办法细节指出问题所在，对话术改进工作指导意义不大的技术问题。
[0101]
上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。
[0102]
在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有
详述的部分，可以参见其他实施例的相关描述。
[0103]
在本技术所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。
[0104]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0105]
另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0106]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0107]
以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

对话术文本信息进行检测的方法、装置以及存储介质与流程

相关文献

最热文献