信息交互方法和装置与流程

2021-10-09 03:25:00 来源：中国专利 TAG：互联网交互装置实施计算机

1.本技术实施例涉及计算机技术领域，具体涉及互联网技术领域，尤其涉及信息交互方法和装置。

背景技术：

2.随着互联网技术的发展，语音处理技术得到了长足的发展。通过语音处理技术可以实现用户与终端设备的交互。
3.用户在发出语音时，可能会说一些无意义的词，比如“啊”等等。这些词无法表达明确的指示。如果对表达这些词的语音都进行处理，可能会实现一些无用的交互，还会增加设备对语音的错误判断。

技术实现要素：

4.本技术实施例提出了信息交互方法和装置。
5.第一方面，本技术实施例提供了一种信息交互方法，包括：响应于接收到用户语音，对用户语音进行语音识别，得到用户语音对应的文字；响应于确定拒识状态为开启状态，基于文字的文字长度，确定是否生成回复语句。
6.在一些实施例中，基于文字的文字长度，确定是否生成回复语句，包括：确定文字长度与预设文字长度的比较结果，基于比较结果，确定是否生成回复语句。
7.在一些实施例中，基于比较结果，确定是否生成回复语句，包括：若文字长度小于或等于预设文字长度，确定不生成回复语句；若文字长度大于预设文字长度，确定生成回复语句。
8.在一些实施例中，方法应用于终端设备，基于文字的文字长度，确定是否生成回复语句，包括：调用预设软件开发工具包，基于文字的文字长度，确定是否生成回复语句。
9.第二方面，本技术实施例提供了一种信息交互装置，接收单元，被配置成响应于接收到用户语音，对用户语音进行语音识别，得到用户语音对应的文字；确定单元，被配置成响应于确定拒识状态为开启状态，基于文字的文字长度，确定是否生成回复语句。
10.在一些实施例中，确定单元，进一步被配置成按照如下方式执行基于文字的文字长度，确定是否生成回复语句：确定文字长度与预设文字长度的比较结果，基于比较结果，确定是否生成回复语句。
11.在一些实施例中，确定单元，进一步被配置成按照如下方式执行基于比较结果，确定是否生成回复语句：若文字长度小于或等于预设文字长度，确定不生成回复语句；若文字长度大于预设文字长度，确定生成回复语句。
12.在一些实施例中，装置应用于终端设备，确定单元，进一步被配置成按照如下方式执行基于文字的文字长度，确定是否生成回复语句：调用预设软件开发工具包，基于文字的文字长度，确定是否生成回复语句。
13.第三方面，本技术实施例提供了一种电子设备，包括：一个或多个处理器；存储装
置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如第一方面中任一实施例的方法。
14.第四方面，本技术实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面中任一实施例的方法。
15.本技术实施例提供的信息交互方案，首先，响应于接收到用户语音，对用户语音进行语音识别，得到用户语音对应的文字。之后，响应于确定拒识状态为开启状态，基于文字的文字长度，确定是否生成回复语句。本技术实施例能够对用户说出的无效内容进行快速确定，从而可以有选择地对用户进行回复，以减少对用户的无效反馈，提高信息交互的智能程度。
附图说明
16.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本技术的其它特征、目的和优点将会变得更明显：
17.图1是本技术可以应用于其中的示例性系统架构图；
18.图2是根据本技术的信息交互方法的一个实施例的流程图；
19.图3是根据本技术的信息交互方法的一个应用场景的示意图；
20.图4是根据本技术的信息交互装置的实施例的结构示意图；
21.图5是适于用来实现本技术实施例的一个电子设备的计算机系统的结构示意图。
具体实施方式
22.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。
23.需要说明的是，在不冲突的情况下，本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
24.图1示出了可以应用本技术的信息交互方法或信息交互装置的实施例的示例性系统架构100。
25.如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。
26.用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如信息交互应用、视频类应用、直播应用、即时通信工具、邮箱客户端、社交平台软件等。
27.这里的终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。
28.服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103提供支持
的后台服务器。后台服务器可以对用户语音等数据进行分析等处理，并将处理结果(例如所确定的是否生成回复语句的结果)反馈给终端设备。
29.需要说明的是，本技术实施例所提供的信息交互方法可以由终端设备101、102、103或服务器105执行，相应地，信息交互装置可以设置于终端设备101、102、103或服务器105中。
30.应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。
31.继续参考图2，示出了根据本技术的信息交互方法的一个实施例的流程200。该信息交互方法，包括以下步骤：
32.步骤201，响应于接收到用户语音，对用户语音进行语音识别，得到用户语音对应的文字。
33.在本实施例中，用户可以与信息交互方法运行于其上的执行主体(例如图1所示的终端设备)进行交互，上述执行主体则可以通过安装的或者相连接的麦克风接收用户语音。并且，上述执行主体可以对用户语音进行语音识别，以将用户语音转换成文字。
34.步骤202，响应于确定拒识状态为开启状态，基于文字的文字长度，确定是否生成回复语句。
35.在本实施例中，上述执行主体若确定终端设备的拒识状态为开启状态，则可以确定上述文字的文字长度，并基于该文字长度来确定是否生成回复语句。文字长度可以指文字的字数。这里的回复语句可以是语音或者文字，指对用户语音做出回复以进行交互的语句。具体地，拒识状态为表征是否执行基于文字长度确定是否生成回复语句的流程。开启状态指示执行，相应地，关闭状态则指示不执行。在实践中，拒识状态可以通过上述执行主体所存储的拒识标识的值来表示。比如拒识标识的值可以是“0”和“1”，分别表示拒识状态为关闭状态和开启状态。
36.上述执行主体可以采用多种方式确定是否生成回复语句。举例来说，上述执行主体可以将文字长度与其他参数进行数学运算，比如其他参数可以包括与用户语音的时长。上述执行主体可以利用对文字长度和用户语音的时长分别设置的权重，对文字长度与用户语音的时长进行加权，如果得到的加权值大于预设数值，则确定生成回复语句。
37.在本实施例的一些可选的实现方式中，步骤202可以包括：
38.确定文字长度与预设文字长度的比较结果，基于比较结果，确定是否生成回复语句。
39.在这些实现方式中，上述执行主体可以将文字长度与预设文字长度相比较，并基于该比较结果确定是否生成回复语句。预设文字长度为预先设置的，是判断是否生成回复语句的文字长度的条件阈值。举例来说，比较结果为文字长度大于或等于预设文字长度，上述执行主体才能够生成回复语句。
40.这些实现方式可以利用预设文字长度进行比较，从而快速而较为准确地确定出是否生成回复语句。
41.在本实施例的一些可选的应用场景中，上述步骤基于比较结果，确定是否生成回复语句，可以包括：
42.若文字长度小于或等于预设文字长度，确定不生成回复语句；若文字长度大于预
设文字长度，确定生成回复语句。
43.在这些可选的应用场景中，上述执行主体可以利用文字长度与预设文字长度的关系，来确定是否生成回复语句。在这些应用场景中，预设文字长度所指示的生成回复语句的条件为文字长度大于该预设文字长度。举例来说，用户语音信息中包括的用户语音对应的文字是“我想”，文字长度为2，预设文字长度为2。那么，文字长度等于预设文字长度，上述执行主体可以确定生成回复语句。
44.这些应用场景可以在确定文字长度较小的情况下，不生成回复语句，以减少对用户的无效反馈。
45.在本实施例的一些可选的实现方式中，步骤202可以包括：
46.调用预设软件开发工具包，基于所述文字的文字长度，确定是否生成回复语句。
47.这些可选的实现方式可以调用预设的软件开发工具包(software development kit，sdk)确定出是否生成回复语句。这样，由软件开发工具包来执行确定过程，之后将确定结果传输至终端设备的业务层。这样，这些实现方式可以在终端设备实现高效而准确的确定是否生成回复语句的过程。
48.继续参见图3，图3是根据本实施例的信息交互方法的应用场景的一个示意图。在图3的应用场景中，执行主体301可以响应于接收到用户语音302，对用户语音进行语音识别，得到用户语音对应的文字“我想”。执行主体301响应于确定拒识状态为开启状态，基于文字的文字长度303，确定是否生成回复语句304。
49.本技术的上述实施例提供的方法能够对用户说出的无效内容进行快速确定，从而可以有选择地对用户进行回复，以减少对用户的无效反馈，提高信息交互的智能程度。并且，本实施例中的拒识状态为终端设备确定的，这样的确定方式更加灵活，甚至可以由用户来自行调节。此外，上述执行主体可以根据具体情况确定是否执行拒识策略。
50.进一步参考图4，作为对上述各图所示方法的实现，本技术提供了一种信息交互装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。
51.如图4所示，本实施例的信息交互装置400包括：接收单元401，响应于接收到用户语音，对用户语音进行语音识别，得到用户语音对应的文字；确定单元402，响应于确定拒识状态为开启状态，基于文字的文字长度，确定是否生成回复语句。
52.在一些实施例中，信息交互装置400的接收单元401可以通过安装的或者相连接的麦克风接收用户语音。并且，上述执行主体可以对用户语音进行语音识别，以将用户语音转换成文字。
53.在一些实施例中，确定单元402可以确定出上述文字的文字长度，并基于该文字长度来确定是否生成回复语句。这里的文字长度可以指文字的字数。这里的回复语句可以是语音或者文字，指对用户语音做出回复以进行交互的语句。
54.在本实施例的一些可选的实现方式中，确定单元，进一步被配置成按照如下方式执行基于文字的文字长度，确定是否生成回复语句：确定文字长度与预设文字长度的比较结果，基于比较结果，确定是否生成回复语句。
55.在本实施例的一些可选的实现方式中，确定单元，进一步被配置成按照如下方式执行基于比较结果，确定是否生成回复语句：若文字长度小于或等于预设文字长度，确定不
生成回复语句；若文字长度大于预设文字长度，确定生成回复语句。
56.在本实施例的一些可选的实现方式中，装置应用于终端设备，确定单元，进一步被配置成按照如下方式执行基于文字的文字长度，确定是否生成回复语句：调用预设软件开发工具包，基于文字的文字长度，确定是否生成回复语句。
57.如图5所示，电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501，其可以根据存储在只读存储器(rom)502中的程序或者从存储装置508加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理。在ram 503中，还存储有电子设备500操作所需的各种程序和数据。处理装置501、rom 502以及ram 503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
58.通常，以下装置可以连接至i/o接口505：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506；包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置507；包括例如磁带、硬盘等的存储装置508；以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置，也可以根据需要代表多个装置。
59.特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置509从网络上被下载和安装，或者从存储装置508被安装，或者从rom 502被安装。在该计算机程序被处理装置501执行时，执行本公开的实施例的方法中限定的上述功能。需要说明的是，本公开的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd
‑
rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、rf(射频)等等，或者上述的任意合适的组合。
60.附图中的流程图和框图，图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用
于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
61.描述于本技术实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括接收单元和确定单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，确定单元还可以被描述为“响应于确定拒识状态为开启状态，基于文字的文字长度，确定是否生成回复语句的单元”。
62.作为另一方面，本技术还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：响应于接收到用户语音，对用户语音进行语音识别，得到用户语音对应的文字；响应于确定拒识状态为开启状态，基于文字的文字长度，确定是否生成回复语句。
63.以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本技术中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

信息交互方法和装置与流程

相关文章

最热文献