一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

电子装置及其控制方法与流程

2021-06-11 21:44:00 来源:中国专利 TAG:话语 装置 执行 控制 方法
电子装置及其控制方法与流程

本公开涉及一种能够捕捉用户话语以根据所述话语的指令执行操作的电子装置及其控制方法,例如,涉及一种与执行用于处理用户话语的语音助手有关的电子装置及其控制方法。



背景技术:

为了根据特定的过程计算和处理预定信息,可以根据要处理什么信息或其目的是什么,将包括用于计算的诸如cpu、芯片组和存储器之类的电子组件的电子装置分成各种类型。例如,电子装置可以包括处理通用信息的诸如pc或服务器之类的信息处理装置、处理图像数据的图像处理装置、处理音频的音频装置、执行家务事的家用电器等。图像处理装置可以被实现为显示装置,其将经处理的图像数据作为图像显示在设置在其中的显示面板上。

电子装置可以接收用户输入,并且根据与所接收的用户输入相对应的命令指令执行预定操作。用户输入方法根据接口的类型变化。例如,电子装置可以根据用户操纵从按钮或遥控器接收控制信号,通过相机检测用户的手势,通过相机执行眼睛跟踪,或通过麦克风根据用户话语接收语音信号。例如,电子装置可以根据用户话语的语音识别处理的结果获得命令,并且执行由所获得的命令指示的操作。在电子装置可以使用的语音处理方法中,可以使用语音助手。语音助手被设置为将用户话语转换成文本,基于深度学习分析经转换的文本,并且根据经分析的内容执行操作。以这种方式,语音助手是基于人工智能的助理服务,其提供了对话语的更高级和经改进的解释和分析结果,超过了简单地识别用户话语以识别命令。

根据设计方法,电子装置可以包括多个语音助手,并且可以被配置为使用这些语音助手中的任意一个处理用户话语。例如,当通过麦克风输入用户话语时,电子装置检查用户话语是否包括触发词。触发词是用于识别语音助手的预定义的词,并且通常由用户指引,以在指令之前说出。当根据触发词识别出语音助手时,电子装置使所识别出的语音助手处理用户话语。

然而,由于另外说出触发词对用户而言不方便,因此可能存在用户没有说出触发词而仅说出指令的情况。根据设计方法,每个语音助手可以针对特定的指令进行优化,并且可能存在比由用户通过触发词指定的语音助手更适于处理所说出的对应指令的语音助手。考虑到这些问题,可能需要一种能够提供适于处理用户话语而无需来自用户的附加输入的语音助手的电子装置。



技术实现要素:

根据示例实施例的电子装置包括:包括接口电路的语音输入接口,被配置为接收话语;处理器,被配置为:获得通过所述语音输入接口接收的所述话语的关键词,基于关于多个语音助手和多个关键词之间的关联程度的预定义信息,从所述多个语音助手之中识别与所获得的关键词的关联程度大于阈值关联程度的语音助手,以及基于所识别的语音助手执行对用户话语的语音识别。

所述处理器可以识别所述预定义信息中定义的每个语音助手与所获得的关键词的关联程度,并且选择具有最高关联程度的所识别的语音助手。

基于所获得的关键词的数量是多个,所述处理器可以对所述语音助手中的每个语音助手与所获得的多个关键词的关联程度求和,并且比较所述多个语音助手的经求和的关联程度。

所述预定义信息可以基于电子装置的使用历史提供。

所述使用历史可以包括:通过对所述多个语音助手中的每个语音助手对所述话语的预定关键词的处理历史进行计数所获得的信息。

所述处理器可以调整所识别的语音助手与所获得的关键词的关联程度。

所述处理器可以识别对所执行的语音识别的结果的满意度,并且基于所识别的满意度,增大或减小所识别的语音助手与所获得的关键词的关联程度。

所述处理器可以基于识别出满意度相对高而向所述关联程度添加第一调整值,并且基于识别出满意度相对低而向所述关联程度添加小于所述第一调整值的第二调整值,以调整所述关联程度。

所述预定义信息可以包括基于多个其他话语获得的信息。

所述处理器可以基于识别出所述预定义信息的数据量不大于阈值来显示被配置为指引所识别的语音助手的ui,并且响应于通过所述ui选择了所识别的语音助手,对所述话语执行语音识别。

所述处理器可以基于识别出所述预定义信息的数据量不大于阈值来显示被配置为对通过所述多个语音助手中的每个语音助手的语音识别的结果进行指引的ui,并且在通过所述ui选择的任意一个语音助手上执行所述结果。

根据示例实施例的控制电子装置的方法,包括:接收话语;获得所接收的话语的关键词;基于关于多个语音助手和多个关键词之间的关联程度的预定义信息,从所述多个语音助手之中识别与所获得的关键词的关联程度大于阈值关联程度的语音助手;以及基于所识别的语音助手执行对所述话语的语音识别。

附图说明

从下面结合附图的详细描述中,本公开的某些实施例的以上和其他方面、特征和优点将更加清楚。

图1是示出根据各实施例的其中电子装置包括多个语音助手的示例环境的图;

图2是示出根据各实施例的电子装置的示例配置的框图;

图3是示出根据各实施例的控制电子装置的示例方法的流程图;

图4是根据各实施例的提供给电子装置参考的表的图;

图5是示出根据各实施例的参考图4的表识别语音助手的示例操作的流程图;

图6是示出根据各实施例的其中电子装置通过反映用户话语的处理结果来更新对图4的表进行更新的结果的示例的图;

图7是示出根据各实施例的其中电子装置获得初始表的示例的图;

图8是示出根据各实施例的其中电子装置显示识别结果的ui的示例的图;

图9是示出根据各实施例的电子装置响应于用户反应而调整表的分数的示例的图;

图10是示出根据各实施例的电子装置通过同义词管理来调整表的分数的示例的图;

图11是示出根据各实施例的控制电子装置的示例方法的流程图;

图12是示出根据各实施例的其中电子装置显示包括关于多个语音助手的处理适合性的信息在内的ui的示例的图;

图13是示出根据各实施例的电子装置通过相关词类别的管理来调整表的分数的示例的图。

具体实施方式

在下文中,将参照附图更详细地描述根据本公开的各示例实施例。除非另外规定,否则参照每个附图描述的实施例不是互斥的配置,并且多个实施例可以被选择性地组合和实现在一个装置中。多个实施例的组合可以被任意选择,并且由本公开的领域的技术人员在实现本公开的精神时应用。

如果在实施例中存在诸如第一组件、第二组件等的包括序数的术语,那么这些术语用于描述各种组件,并且所述术语用于区分一个组件与其他组件,并且所述组件不被这些术语限制。应用实施例中所使用的术语来描述实施例,并且所使用的术语不限制本公开的精神。

另外,在本公开中对表述多个组件中的“至少一个”进行描述的情况下,该表述不仅指多个组件的整体,而且还指多个组件中的除其余组件之外的每一个组件或其所有组合。

图1是示出根据各实施例的其中电子装置包括多个语音助手的示例环境的图。

如图1所示,根据本公开的实施例的电子装置100可以例如被实现为能够显示图像的显示装置。当电子装置100被实现为显示装置时,电子装置100可以包括例如但不限于电视、计算机、平板计算机、便携式媒体播放器、可穿戴设备、视频墙、电子相框等。然而,实际上,电子装置100可以被实现为各种类型的装置,例如但不限于显示装置、诸如机顶盒的没有显示器的图像处理装置、诸如冰箱或洗衣机的家用电器、诸如电脑机身的信息处理装置等。另外,电子装置100可以是在固定位置安装和使用的装置或用户在移动时可以携带和使用的移动设备。

电子装置100可以接收话语,例如,用户的语音。然后,用户说出预定指令,电子装置100根据话语获得语音信号。为了根据话语获得语音信号,电子装置100可以包括采集话语的麦克风,或者可以从具有麦克风的遥控器140或单独的外部设备接收语音信号。

电子装置100可以包括多个语音助手110、120和130。语音助手110、120和130可以例如包括应用服务,所述应用服务通过基于例如人工智能分析用户话语的内容和上下文来确定话语的意图,并且执行与该确定结果相对应的操作。例如,语音助手110、120和130可以通过对输入到电子装置100的用户话语的语音信号执行语音到文本(stt)处理而得到文本数据,通过基于深度学习或机器学习对得到的文本数据执行语义分析而确定文本数据的意义,并且提供适合所确定的意义的服务。

例如,语音助手110、120和130可以是其中大多数操作在电子装置100内部执行的设备级语音助手110,或者可以被包括在与电子装置100通信的服务器150和160上,或者可以是执行与外部设备有关的操作的语音助手120和130。

例如,在与服务器150和160结合操作的情况下,语音助手120和130可以如下操作。当用户话语输入到电子装置100时,语音助手120和130向服务器150和160发送用户话语的语音信号。服务器150和160对所接收的语音信号执行stt处理和语义分析,并且向语音助手120和130发送分析结果。语音助手120和130执行与分析结果相对应的操作。

当输入了用户话语时,电子装置100可以根据例如预置条件选择多个语音助手110、120和130中的任意一个。预置条件可以根据电子装置100的设计方法而不同,并且,例如,可以基于与用户话语一起输入的触发词对语音助手110、120和130进行选择。触发词可以包括例如用于识别每个语音助手110、120和130的预定义的词。电子装置100可以预先对语音信号执行stt处理,以便识别用户话语的语音信号中的触发词。

然而,根据实施例的电子装置100可以应对用户话语不包括触发词的情况,并且可以推荐更适于用户话语的语音助手110、120和130。针对这种操作,电子装置100可以响应于与触发词分开的预置条件而自动选择语音助手110、120和130,将在下面更详细地对此进行描述。

图2是示出根据各实施例的电子装置的示例配置的框图。

如图2所示,电子装置210可以包括通信接口(例如,包括通信电路)211、信号输入/输出接口(例如,包括输入/输出电路)212、显示器213、用户输入接口(例如,包括接口电路)214、存储器215、麦克风216和处理器(例如,包括处理电路)217。

在下文中,将描述电子装置210的配置。虽然本实施例描述其中电子装置210是电视的示例,但是电子装置210可以被实现为各种类型的装置,因此本实施例不限制电子装置210的配置。在其中电子装置210不能被实现为显示装置的示例中,电子装置210可以不包括用于显示图像的组件,例如,显示器213。例如,当电子装置210被实现为机顶盒时,电子装置210可以通过信号输入/输出接口212向外部电视输出图像信号。

通信接口211可以包括各种通信电路,其中包括例如双向通信电路,其包括与各种类型的有线和无线通信协议相对应的诸如通信模块和通信芯片之类的组件中的至少一项。例如,通信接口211可以包括:根据wi-fi系统与ap执行无线通信的无线通信模块、诸如蓝牙的执行一对一直接无线通信的无线通信模块、用于ir通信的ir模块、以有线方式连接到路由器或网关的lan卡等。通信接口211可以与网络上的诸如服务器220和移动设备240之类的外部设备通信。通信接口211可以与同电子装置210的主体分离的遥控器230通信,以接收从遥控器230发送的信号。

信号输入/输出接口212可以包括各种输入/输出电路,并且可以例如以1∶1或1∶n(n是自然数)的方式与外部设备(例如,机顶盒或光学媒体播放器)有线连接,以从外部设备接收数据或向外部设备输出数据。信号输入/输出接口212包括根据预定传输标准的连接器、端口等,例如,hdmi端口、显示端口(displayport)、dvi端口、雷电(thunderbolt)和usb端口。

显示器213可以包括可在屏幕上显示图像的显示面板。显示面板被设置为例如但不限于诸如液晶类型的光接收结构或诸如oled类型的自发光结构。根据显示面板的结构,显示器213还可以包括附加组件。例如,如果显示面板是液晶类型,则显示器213包括液晶显示面板、提供光的背光单元和驱动液晶显示面板的液晶的面板驱动基板。

用户输入接口214可以包括各种接口电路,并且可以包括各种类型的与输入接口有关的电路,所述电路被设置用于由用户操纵以执行用户输入。用户输入接口214可以根据电子装置210的类型以各种形式配置,并且用户输入接口214包括例如电子装置210的机械或电子按钮单元、触摸板、传感器、相机、安装在显示器213上的触摸屏等。

存储器215存储数字化数据。存储器215可以包括:非易失性存储器,无论存储器是否被供电,所述非易失性存储器都可以保存数据;以及易失性存储器,其可以与处理器217处理的数据一起加载,并且在存储器不被供电时不可以保存数据。存储器可以包括闪存、硬盘驱动器(hdd)、固态驱动器(ssd)、只读存储器(rom)等,并且存储器包括缓冲器、随机存取存储器(ram)等。根据本实施例的存储器215可以存储用于执行用于处理语音信号的多个语音助手中的每个语音助手的多个应用。存储在存储器215中的应用由处理器217驱动,以执行语音助手。

麦克风216或语音输入接口从外部环境采集包括用户话语的声音。麦克风216向处理器217发送所采集的声音的语音信号。

处理器217可以包括各种处理电路,其中包括例如被实现为例如但不限于安装在印刷电路板上的cpu、芯片组、缓冲器、电路等的一个或多个硬件处理器,并且根据设计方法,处理器217可以被实现为片上系统(soc)。当电子装置210被实现为显示装置时,处理器270可以包括与各种处理相对应的各种模块,例如解复用器、解码器、定标器、音频数字信号处理器(dsp)和放大器。这些模块中的一些或全部可以被实现为soc。例如,与图像处理有关的模块,例如解复用器、解码器和定标器,可以被实现为图像处理soc,并且音频dsp可以被实现为与该soc分离的芯片组。

当通过预定路径接收到用户话语的语音信号时,根据本实施例的处理器217可以执行根据预置方法所选择的语音助手,以处理语音信号。当多个语音助手正在后台操作时,处理器可以根据预置方法选择任意一个语音助手,并且使所选择的语音助手处理对应的语音信号。将在下面更详细地描述由处理器217选择语音助手的示例方法。

电子装置210可以以各种方式获得用户话语的语音。

例如,电子装置210可以包括采集声音的麦克风216。通过麦克风216所采集的用户话语的语音信号被转换成数字信号并被发送到处理器217。

当遥控器230包括麦克风236时,电子装置210可以通过通信接口211发送从遥控器230通过麦克风236所采集的用户话语的语音信号。遥控器230可以将通过麦克风236所采集的用户话语的语音信号转换成数字信号,并且根据通信接口211可以接收的协议,通过遥控通信接口231向通信接口211发送数字信号。

在诸如移动设备240的通用设备的情况下,移动设备240可以通过安装和执行被设置用于控制电子装置210的应用而与遥控器230类似地操作。移动设备240可以在正执行应用的同时将通过麦克风246所采集的用户话语的语音信号转换成数字信号,并且通过移动通信接口241向通信接口211发送数字信号。

在下文中,将更详细地描述根据本公开的实施例的处理器217选择多个语音助手中的任意一个并且使所选择的语音助手处理用户话语的方法。

图3是示出根据各实施例的控制电子装置的示例方法的流程图。

如图3所示,以下操作可以例如由电子装置的处理器执行。另外,电子装置可以包括多个语音助手。

在操作310中,电子装置接收用户话语。

在操作320中,电子装置获得所接收的用户话语的文本。

在操作330中,电子装置从所获得的文本获得文本的一个或多个关键词。

在操作340中,电子装置获得关于多个语音助手和多个关键词之间的关联程度的预定义信息。该信息可以包括例如表,在该表中针对每个语音助手记录了对多个关键词中的每个关键词的分数。

在操作350中,电子装置基于所获得的信息,从多个语音助手之中识别与关键词具有高关联程度(例如,关联程度大于阈值)的语音助手。作为识别方法的示例,电子装置可以从该表中选择对用户话语的文本中所包括的关键词具有最高分数的语音助手。

在操作360中,电子装置基于所识别的语音助手,对用户话语执行语音识别。

因此,即使用户不说出触发词或不通过单独的ui指定特定的语音助手,电子装置也可以自动识别适于处理用户话语的语音助手。电子装置可以通过选择适当的语音助手处理用户话语,来向用户提供定制服务,而不管用户指定语音助手来处理用户话语。

电子装置的处理器可以如上所述地获得用户话语的关键词;基于关于多个语音助手和多个关键词之间的关联程度的预定义信息,识别与所获得的关键词具有高关联程度的语音助手;并且基于所识别的语音助手,使用例如但不限于机器学习、神经网络、深度学习算法(例如,基于规则的算法和人工智能算法)等中的至少一种,执行针对用于对用户话语执行语音识别的操作的数据分析、处理和结果信息生成的至少一部分。

例如,电子装置的处理器可以一起执行学习单元和识别单元的功能。学习单元可以执行生成经训练的神经网络的功能,并且识别单元可以执行使用经训练的神经网络识别(或推理、预测、估计和确定)数据的功能。学习单元可以生成或更新神经网络。学习单元可以获得学习数据以生成神经网络。例如,学习单元可以从电子装置的存储器或从外部获得学习数据。学习数据可以是为学习神经网络所使用的数据,并且可以使用执行上述操作的数据作为学习数据对神经网络进行训练。

在使用学习数据学习神经网络之前,学习单元可以对所获得的学习数据执行预处理操作,或者从多个学习数据中选择要被用于学习的数据。例如,学习单元可以处理或过滤预定格式的学习数据,或者通过添加/去除噪声以适于学习的形式处理数据。学习单元可以生成被配置为使用经预处理的学习数据执行上述操作的神经网络。

经训练的神经网络可以包括多个神经网络(或层)。多个神经网络的节点可以具有权重,并且多个神经网络可以彼此连接,以使一个神经网络的输出值被用作其他神经网络的输入值。神经网络的示例可以包括例如但不限于以下模型:诸如卷积神经网络(cnn)、深度神经网络(dnn)、递归神经网络(rnn)、受限玻尔兹曼机(rbm)、深度信念网络(dbn)、双向递归深度神经网络(brdnn)、深度q网络等。

为了执行上述操作,识别单元可以获得目标数据。目标数据可以从电子装置的存储器或外部获得。目标数据可以包括要由神经网络识别的数据。在将目标数据应用到经训练的神经网络之前,识别单元可以对所获得的目标数据执行预处理操作,或者从多个目标数据之中选择要被用于识别的数据。例如,识别单元可以处理或过滤预定格式的目标数据,或者通过添加/去除噪声以适于识别的形式处理数据。识别单元可以通过将经预处理的目标数据应用到神经网络,获得从神经网络输出的输出值。识别单元可以获得概率值或可靠性值以及输出值。

在下文中,将更详细地描述关于多个语音助手和多个关键词之间的关联程度的预定义信息的示例。

图4是示出根据各实施例的提供给电子装置参考的示例表的图。

如图4所示,电子装置可以获得指示多个语音助手和多个关键词之间的关联程度的表400。可以根据各种方法选择包括在表400中的各关键词。例如,在采集被用户频繁使用的词之后,可以根据使用的频率从所述词中选择预定等级或更高等级的词。如果通过服务器选择词,则服务器可以从多个客户端获得指令的使用历史,并且从所获得的各个使用历史中选择频繁使用的词。备选地,可以基于从词的属性中排除助词、副词和代词之外的名词来选择词。

表400可以包括例如为设置在电子装置中的多个语音助手中的每个语音助手针对多个预定义词中的每个词记录的分数。该表400中示出的项只是用于方便和简化描述的示例,并且对应的项不限制关于多个语音助手和多个关键词之间的关联程度的信息的形式、方法和内容。

例如,可以考虑以下情况:存在“今天”、“天气”、“推荐”和“广播”的词,并且在电子装置中设置诸如第一助手和第二助手之类的两个语音助手。考虑到这种情况,表400包括第一助手对每个词的分数和第二助手对每个词的分数。对于该表400中的词“今天”,第一助手表示分数10,而第二助手表示分数20。

表400的分数可以根据各种方法计算(确定)。例如,可以通过反映电子装置的使用历史来准备该分数。例如,使用历史可以与在用户说出特定的词时由特定的语音助手处理的次数的历史计数相对应。分数可以被设置为与处理词的累积次数相等的数值,或者可以被设置为通过将处理词的累积数乘以预置权重所获得的值。例如,如果第一助手对词“今天”进行处理的累积次数是10次,则在表400中第一助手对“今天”的分数可以被计算为10。如果在相同条件下预定义的权重是3,则在表400中第一助手对“今天”的分数可以被计算为30。

例如,表400中所记录的分数可以指示特定的语音助手对特定的词进行处理的次数。当基于ai设计语音助手时,学习历史越多,语音处理结果可以越准确地适合用户的意图,因此期望的是,具有高分数的语音助手将更准确地处理对应的词。基于这种观点,针对预定词具有高分数的语音助手被考虑为更适于处理该词。

电子装置可以在开始时生成表400,根据使用历史更新和使用在制造阶段默认设置的表400,或者根据使用历史更新和使用从服务器提供的表400。在任何情况下,电子装置可以通过根据使用历史更新表400的各个分数来实现针对用户优化的表400。

在下文中,将更详细地描述由电子装置使用表400识别更适于用户话语的语音助手的方法。

图5是示出根据各实施例的电子装置参考图4的表识别语音助手的示例操作的流程图。

如图5所示,以下操作可以例如由电子装置的处理器执行。此外,电子装置可以包括多个语音助手,并且可以获得如图4所示的表400(参见图4)。

在操作510中,电子装置从用户话语的文本识别一个或多个词。例如,考虑用户说出“今天天气如何”的情况。电子装置从用户话语的文本识别一个或多个词。用于识别词的各种标准都是可能的,作为示例,电子装置从文本中所包括的词中识别在表400(参见图4)中预定义的词。在该示例的情况下,电子装置可以识别两个词:“今天”和“天气”。

在操作520中,电子装置获得定义了多个语音助手对多个词的分数的表。在该实施例中,参考上面在图4中示出的表。

在操作530中,电子装置从表中识别所识别的一个或多个词的分数。对于所识别的词“今天”和“天气”中的每一个,电子装置检查第一助手的分数和第二助手的分数。第一助手对词“今天”的分数是10,而第二助手的分数是20。第一助手对词“天气”的分数是30,而第二助手的分数是10。

在操作540中,电子装置将多个语音助手中的每个语音助手对所识别的词的分数之和相互进行比较。例如,第一助手的分数之和是10 30=40,并且第二助手的分数之和是20 10=30,因此第一助手的分数之和大于第二助手的分数之和。

在操作550中,电子装置识别具有最大和的语音助手。当用户话语是“今天天气如何”时,第一助手的分数之和最大。

在操作560中,电子装置通过所识别的语音助手处理用户话语。例如,当识别出第一助手时,电子装置使第一助手执行对用户话语的语音识别。如果需要,第一助手可以向服务器发送用户话语的语音信号以执行语音识别。

在操作570中,电子装置根据对语音助手的识别,调整表中对应的语音助手对所识别的词的分数。例如,电子装置可以通过反映当前执行的操作的历史来更新表。

在以上示例实施例中,已经描述了以下示例,在该示例中,电子装置从表中识别语音助手对从用户话语识别的每个词的分数,以每个语音助手为单位对所识别的分数进行求和并将分数之和进行比较,并且最终选择具有最大和的语音助手。然而,由电子装置基于分数选择语音助手中的任意一个语音助手的方法不仅仅限于比较多个分数之和,而是可以应用各种变型方法。

例如,在示例实施例中,每个分数仅简单求和,而在多个所识别的词之间没有权重差异。然而,根据设计方法,通过在所识别的词之间产生权重上的差异对被认为更重要的词另外添加权重的方法是可行的。

例如,假设已经从用户话语中识别出了词“今天”和“天气”,并且预先设置了将针对词“今天”的分数乘以1.2的值并且将针对词“天气”的分数乘以1.0的值。这对应于以下示例:与词“天气”相比,通过更高的重要性来反映词“今天”。在图4的表作为示例的情况下,第一助手的结果值是10*1.2 30*1.0=42,第二助手的结果值是20*1.2 10*1.0=34。通过以这种方式比较多个语音助手的结果值,可以选择具有最大结果值的语音助手。

上述示例实施例中的操作570是通过在表中反映当前执行的操作的结果来更新表的情况。在下文中,将更详细地描述这样的操作的示例。

图6是示出根据各实施例的其中电子装置通过反映用户话语的处理结果来更新对图4的表进行更新的结果的示例的图。

如图6所示,当电子装置识别出适于用户话语的语音助手时,表500可以通过反映所识别的结果而进行更新。例如,考虑以下情况:用户话语是“今天天气如何”,从中识别的词是“今天”和“天气”,并且从多个语音助手中最终选择了第一助手。

电子装置在表500中检查最终选择的语音助手对从用户话语识别的词的分数。由于所识别的词是“今天”和“天气”,并且所选择的语音助手是第一助手,因此电子装置可以在表500中检查出针对“今天”的分数是10且针对“天气”的分数是30。

电子装置将与预置值相对应的分数仅添加到第一助手对所识别的词“今天”和“天气”的分数。在这种情况下,第一助手对“今天”的分数从10增加到11,并且第一助手对“天气”的分数从30增加到31。本实施例已经描述了分数的增加值是1,但是增加值的具体值不受限制。对于分数的增加值,根据设计方法,对应于不同的条件可以应用不同的值。另外,调整分数值的方法可以不仅仅限于增加,而是根据条件,减去分数的方法是可行的。将在之后描述分数的设计方法的示例。

在下文中,将更详细地描述电子装置获得初始表的方法的实施例。

图7是示出根据各实施例的其中电子装置获得初始表的示例配置的框图。

如图7所示,电子装置710连接到网络以与服务器720实现通信。服务器720与多个客户端730通信。电子装置710也可以是多个客户端730中的一个,但是仅为了相互识别而指定了不同的术语。

在如上述示例实施例中所述地构造表711时,电子装置710可以通过从开始累积使用历史来生成表711。然而,在这种情况下,需要时间来累积使用历史,直到确保特定的数据量以便保证表711的可靠性为止。

作为另一方法,在电子装置710的制造阶段中,可以将具有初始值的表711存储在电子装置710的存储器中,并且可以将电子装置710发布为产品。

作为另一方法,电子装置710可以从服务器720接收表721,并且可以通过附加地将使用历史反映到所接收的表721的初始值且更新表721来构造表711。服务器720可以仅单向地向电子装置710提供所存储的表721。服务器720可以从电子装置710接收与表711的更新有关的反馈信息,并且更新之前所存储的表721。

服务器720可以从多个客户端730采集关于由每个客户端730存储的表731的信息,其中多个客户端730以与电子装置710相同的方式可通信地连接。每个客户端730可以单独存储表731,并且基于其自身的使用历史来更新各自拥有的表731。更新每个表731的方法与上面的实施例中描述的方法相同或类似。

每个客户端730可以周期性地或响应于来自服务器720的请求向服务器720提供表731的当前信息。表731的当前信息可以包括例如但不限于:预先定义的词、多个语音助手的识别名称、语音助手对每个词的分数等。

服务器720可以基于从每个客户端730获得的关于表731的信息创建新的表721或更新表721。各种设计方法可以应用于生成或更新表721的方法。例如,服务器720可以根据从每个客户端730采集的信息获得相同的语音助手对特定词的分数,并且得到通过将所获得的分数之和除以客户端730的数值而获得的值,作为该语音助手对相应词的分数。这种方法仅是示例,并且获得表721的值的方法不限于此。

响应于来自电子装置710的请求或响应于检测到电子装置710连接到服务器720,服务器720可以将如上面所述地构造的表721提供给电子装置710。服务器720可以从电子装置710获得表711的更新信息,并且以与上面描述的客户端730的情况相同的方式来反映表721的所获得的更新信息。

当电子装置基于表识别语音助手时,表中的数据量需要大于预定阈值,以确保识别结果的可靠性。如果表中的数据量小于阈值,则电子装置可以将识别结果显示为ui。在下文中,将更详细地描述显示ui的实施例。

图8是示出根据各实施例的其中电子装置显示识别结果的ui的示例的图。

如图8所示,电子装置800可以识别适于所接收的用户话语的语音助手,并且显示指示识别结果的ui810。ui810可以至少包括指示所识别的语音助手是什么的信息,并且还可以包括所接收的用户话语的文本。例如,如果接收到“今天天气如何”的用户话语,并且针对所接收的用户话语从多个语音助手中选择了第一助手,则电子装置800显示通知选择结果的ui810。

ui810可以根据是否对电子装置800进行了设置来显示而不管情况如何,或者可以被选择性地显示。例如,当基于之前存储的表识别适于用户话语的语音助手时,电子装置800识别表中的数据量是否大于阈值。当表中的数据量大于阈值时,使用该表的识别结果具有足够的可靠性。另一方面,当表中的数据量不大于阈值时,例如,可能表示使用该表的识别结果的可靠性不高。

因此,当表中的数据量大于阈值时,电子装置800不显示ui810,并且使所识别的语音助手处理用户话语。另一方面,当表中的数据量不大于阈值时,电子装置800显示ui810,以使用户选择识别结果是否是肯定性的。为此,ui810可以指引识别结果,并且提供选项以使用户选择识别结果是肯定性的(即,用户是否可以接受识别结果)还是否定性的(即,用户可能不接受识别结果,以及用户是否想要通过语音助手进行处理)。

当在ui810中选择对识别结果的肯定性选项时,电子装置800使如在上面描述的实施例中识别的语音助手处理用户话语,以更新表的分数。另一方面,当在ui810中选择对识别结果的否定性选项时,电子装置800可以前进到用于识别其他语音助手的新过程,或者可以提供被设置为指定用户想要的语音助手的单独的ui。

电子装置可以通过各种方法获得用户对语音助手的识别结果的反应(即,对识别结果的肯定性的反应或否定性的反应,或者用户对识别结果的满意度是高还是低)。例如,电子装置可以基于通过如本实施例中的ui810提供的选择选项,识别用户对识别结果是肯定性的(即,用户的满意度是否为高)还是否定性的(即,用户的满意度是否为低)。

电子装置可以识别:由针对用户的第一话语识别的语音助手在第一时间点处提供第一话语的处理结果,并且在从第一时间点起的预置时间内的第二时间点处接收与第一话语相同内容的第二话语。例如,这可以表示用户不满意在第一时间点处提供的第一话语的处理结果。因此,在如上面所述的识别的情况下,电子装置可以识别出用户对在第一时间点处提供的第一话语的处理结果做出否定性的反应。

另一方面,在电子装置在第一时间点处提供第一话语的处理结果之后,在从第一时间点起的预置时间内可能没有接收到与第一话语相同内容的第二话语。在这种情况下,电子装置可以识别出用户对在第一时间点处提供的第一话语的处理结果做出肯定性的反应。

在电子装置在第一时间点处提供第一话语的处理结果之后,如果在从第一时间点起的预置时间内输入了诸如取消或停止之类的指令,则电子装置可以识别出用户对在第一时间点处提供的第一话语的处理结果做出否定性的反应。

以这种方式识别的用户的反应可以通过在更新表的分数时使分数的权重不同的方式而反映在表中。在下文中,将更详细地描述其中电子装置响应于用户动作而调整表的分数的示例实施例。

图9是示出根据各实施例的电子装置响应于用户反应而调整表的分数的示例的图。

如图9所示,当输入了用户话语时,电子装置从用户话语识别预定义的词,通过参考表910识别每个语音助手对相应词的分数,并且根据识别结果选择语音助手以处理用户话语,且根据选择结果调整表910的分数。这个过程如上面的实施例中所述。例如,考虑以下情况:针对“今天天气如何”的用户话语识别出两个词“今天”和“天气”,并且因此,基于表910从多个语音助手中选择第一助手。

电子装置识别用户对通过第一助手对“今天天气如何”的用户话语的处理结果的反应。电子装置可以根据如上面所述的各种方法识别用户反应是肯定性的还是否定性的。

如果识别出对通过第一助手对用户话语的处理结果的用户反应是肯定性的,则电子装置向表910中第一助手对从用户话语识别的词的分数添加预置的第一权重,以更新表920。例如,假设表910中第一助手对“今天”的分数是100且对“天气”的分数是300。如果当用户反应是肯定性时的第一权重值是 5,则经更新的表920中第一助手对“今天”的分数是105并且对“天气”的分数是305。

另一方面,如果识别出对通过第一助手对用户话语的处理结果的用户反应是否定性的,则电子装置可以向表910的对应分数添加小于第一权重的第二权重,以更新表930。例如,当第二权重是 1时,经更新的表930中第一助手对“今天”的分数是101并且对“天气”的分数是301。

备选地,如果识别出对通过第一助手对用户话语的处理结果的用户反应是否定性的,则电子装置可以向表910的对应分数添加具有负值的第三权重,以更新表940。例如,当第三权重是-3时,经更新的表940中第一助手对“今天”的分数是97并且对“天气”的分数是297。

如上所述,根据对用户话语的处理结果的用户反应,不同地应用对于表910的分数的权重,因此可以在表910中更准确地反映用户的品味和偏好。

另一方面,在示例实施例中,可以响应于对处理结果的用户反应不同地应用对于分数的权重,但是不会仅响应于用户反应而不同地提供对于分数的权重。例如,电子装置可以识别发声的用户,并且可以根据所识别的用户不同地应用分数的权重。存在识别用户的若干种可行的方法。电子装置可以基于当前登录的账户识别用户,或者可以通过分析用户话语的语音信号的波形来识别与分析结果相对应的简档(profile)的用户。

作为向分数不同地分配权重的方法之一,电子装置可以管理同义词。在下文中,将更详细地描述其中电子装置通过同义词管理调整分数的实施例。

图10是示出根据各实施例的电子装置通过同义词管理来调整表的分数的示例的图。

例如,如图10所示,考虑以下情况:针对“今天天气如何”的用户话语识别出两个词“今天”和“天气”,并且因此,基于表1010的分数从多个语音助手中选择第一助手。例如,如果对所识别的词的分数的第一权重被设置为 3,则电子装置将表1010中第一助手对“今天”的分数100调整到103,并且将第一助手对“天气”的分数300调整到303。

电子装置可以识别在表1010中提供的词之中是否存在所识别的词的同义词。例如,假设在表1010中的预定义的词之中,存在与“天气”同义的“气候”。

电子装置可以被设置为对于所识别的词的同义词分配比对所识别的词的分数的第一权重小的第二权重。例如,如果第二权重被设置为小于 3的 1,则电子装置将表1010中第一助手对“气候”的分数60调整到61。

以这种方式,在经更新的表1020中,在对所识别的词的分数中反映第一权重,并且在对所识别的词的同义词的分数中反映小于第一权重的第二权重。

另一方面,如果识别出表中的数据量小于阈值或使用历史足够小而不足以创建表,则电子装置可以通过ui向用户提供关于多个语音助手的处理结果的信息。

图11是示出根据各实施例的控制电子装置的示例方法的流程图。

如图11所示,以下操作可以由电子装置的处理器执行。电子装置可以包括用于各自处理用户话语的多个语音助手。

在操作1110中,电子装置接收用户话语。

在操作1120中,电子装置获得用于识别语音助手的信息。该信息可以是关于多个语音助手和多个关键词之间的关联程度的预定义的信息,并且可以表示上述实施例中的表。备选地,该信息可以是用于创建表的累积使用历史。

在操作1130中,电子装置识别所获得的信息的量是否小于阈值。

如果识别出所获得的信息的量小于阈值(操作1130中的“是”),则在操作1140中,电子装置使多个语音助手中的每个语音助手处理用户话语。

当从多个语音助手中的每个语音助手输出处理结果时,在操作1150中,电子装置显示用于指引多个语音助手中的每个语音助手的处理结果的ui。

在操作1160中,电子装置执行通过ui所选择的处理结果,并且通过将处理结果反映在以上信息上来更新处理结果。

另一方面,如果识别出所获得的信息的量不小于阈值(操作1130中的“否”),则在操作1170中,电子装置基于所获得的信息选择多个语音助手中的任意一个。

在操作1180中,电子装置通过所选择的语音助手处理用户话语。

因此,电子装置可以响应于用于识别语音助手的信息的量而执行选择性的操作。

在上述示例实施例中,描述了如下示例:电子装置使基于表的分数选择的最佳语音助手提供对用户话语的处理结果。作为单独的示例,也可以将电子装置配置为向用户提供多个语音助手的等级列表并且使用户选择语音助手。

图12是示出根据各实施例的其中电子装置显示包括关于多个语音助手的处理适合性的信息在内的ui的示例的图。

如图12所示,电子装置1200可以显示包括指示多个语音助手中的每个语音助手对所接收的用户话语的处理适合性的信息在内的ui1210。

当输入了用户话语时,电子装置1200从用户话语中识别预定义的词,通过参考表计算每个语音助手对相应词的分数之和,根据计算结果选择具有最高分数之和的语音助手以处理用户话语,并且根据选择结果调整表的分数。这个过程如上面的实施例中所述。

在以上过程中,当通过参考表计算多个语音助手中的每个语音助手对相应词的分数之和时,根据设计方法,电子装置1200可以显示ui1210而无需立即选择语音助手。该ui1210将多个语音助手中的每个语音助手对用户话语的分数之和显示为排序。用户可以通过ui1210比较设置在电子装置1200中的多个语音助手对用户话语的适合程度,并且可以选择这些语音助手中的任意一个语音助手。

电子装置1200接收“今天天气如何”的用户话语,并且当识别出两个词“今天”和“天气”时,基于表计算多个语音助手中的每个语音助手对这两个词的分数之和。该计算方法如上述实施例中所述。

电子装置1200可以在ui1210上一起显示与多个语音助手和每个语音助手的分数之和有关的项。在这种情况下,在ui1210中,可以按照分数之和增大的顺序来布置和显示多个语音助手的项。根据附图的示例,由于第二助手的分数之和最大,是700,因此第二助手在ui1210中被显示在最高位置处。

ui1210可以通过电子装置1200的设置来显示,或者可以在识别出表的可靠性不高时选择性地显示。

在参照图10的以上实施例中,作为向分数不同地分配权重的方法之一,已经描述了电子装置管理同义词的情况。然而,可以不限于仅将为识别所准备的预定义的词的同义词与对应的词相关,而是可以根据各种标准来管理与对应的词有关的词类别。

图13是示出根据各实施例的电子装置通过相关词类别的管理来调整表的分数的示例的图。

例如,如图13所示,考虑以下情况:针对“今天天气如何”的用户话语识别出两个词“今天”和“天气”,并且因此,基于表1310的分数从多个语音助手中选择第一助手。例如,如果对所识别的词的分数的第一权重被设置为 3,则电子装置将表1310中第一助手对“今天”的分数100调整到103,并且将第一助手对“天气”的分数300调整到303。

电子装置识别在表1310中提供的词之中是否存在被指定为与所识别的词有关系的词类别。这种词类别是预定义的词的组,可以与参考词(即,要识别的预定义的词)同义(参考与图10有关的实施例),或者可以是即使意义不同也被视为相关的词,或者可以包括与sns中的当前趋势具有各种相关性的搜索词等。即,与参考词有关的类别的词可以通过各种方法和标准来选择,并且例如可以使用ai模型来指定与参考词有关的词的类别。

例如,假设在表1310中的预定义的词之中,存在作为与“天气”有关的词的“区域”。

电子装置可以被设置为对于与所识别的词有关的类别的词分配比对所识别的词的分数的第一权重小的第二权重。例如,如果第二权重被设置为小于 3的 1,则电子装置将表1310中第一助手对“区域”的分数65调整到66。

以这种方式,在经更新的表1320中,在对所识别的词的分数中反映第一权重,并且在对与所识别的词有关的其他词的分数中反映小于第一权重的第二权重。

电子装置可以存储与和参考词同义或相关的词类别有关的预定义的db或列表,并且可以从所存储的db或列表中识别与所识别的参考词有关的其他词。由于通过服务器向电子装置提供这样的db,因此电子装置可以使用周期性地更新词的db。当服务器向若干个电子装置提供经更新的db时,服务器可以基于从每个电子装置采集的db使用历史来更新db。

如在以上实施例中所述的装置的操作可以由安装在装置中的人工智能执行。人工智能可以应用于使用机器学习算法的各种系统。人工智能系统可以包括实现与人类水平相对应或与人类水平相当的智能的计算机系统,并且可以包括如下系统:其中,机器、装置或系统自主地执行学习和确定,并且识别率和确定精度基于使用经验的累积而提高。人工智能技术可以包括使用算法对输入数据的特征进行分类/学习的机器学习技术、使用机器学习算法模拟人脑的识别、确定等功能的元素技术等。

元素技术的示例可以包括例如但不限于以下至少一项:用于识别人类语言/字符的语言理解技术、用于如同人类视觉一样地识别对象的视觉理解技术、用于通过确定信息逻辑地推理和预测信息的推理/预测技术、用于利用知识数据处理人类经验信息的知识表示技术、或用于控制车辆的自动驾驶和机器人的移动的运动控制技术。

例如,语言理解可以指识别和应用/处理人类语言/字符的技术,并且包括自然语言处理、机器翻译、对话系统、问答、语音识别/合成等。

例如,推理/预测可以指判定和逻辑地预测信息的技术,并且包括基于知识/概率的推断、优化预测、基于偏好的计划、推荐等。

例如,知识表示可以指将人类经验信息自动处理为知识数据的技术,并且包括知识建立(数据生成/分类)、知识管理(数据利用)等。

根据本公开的实施例的方法可以被实现为可通过各种计算机装置执行的程序命令的形式并可以被记录在计算机可读记录介质中。计算机可读记录介质可以单独包括程序命令、数据文件、数据结构等或包括其组合。例如,计算机可读记录介质可以被存储在非易失性存储器(例如,usb存储器设备)、存储器(例如,随机存取存储器(ram))、只读存储器(rom)、闪存、存储器芯片或集成电路或由机器(例如,计算机)以光或磁方式可读的存储介质(例如,致密盘(cd)、数字万用盘(dvd)、磁盘、磁带等)中,而与数据是否可擦除或可重写无关。可以被包括在移动终端中的存储器是适于存储包括实现本公开的实施例且由机器可读的指令在内的一个或多个程序的存储介质的示例。记录在该存储介质中的程序指令可以针对本公开专门设计和构造,或者可以是计算机软件领域中的技术人员已知和可用的。计算机程序指令也可以通过计算机程序产品实现。

尽管已经参照各示例实施例示出和描述了本公开,但是应理解,各实施例旨在是说明性的而非限制。本领域普通技术人员还应当理解,在不脱离包括随附权利要求及其等同项的本公开的真实精神和全部范围的情况下,可以进行形式和细节上的各种变化。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜