语音处理方法和系统、及语音交互设备和方法与流程

2021-09-17 21:09:00 来源：中国专利 TAG：方法交互语音语言设备

技术特征：
1.一种语音处理方法，包括：接收来自用户的语音数据；确定所述用户的用户身份；以及基于所述用户身份，生成所述语音数据的处理结果。2.如权利要求1所述的方法，其中，确定所述用户的用户身份包括如下至少一项：识别所述用户的生物信息并基于所述生物信息确定所述用户身份；识别所述用户的账户信息并基于所述账户信息确定所述用户身份。3.如权利要求2所述的方法，其中，识别所述用户的生物信息并基于所述生物信息确定所述用户身份包括：对所述语音数据进行声纹识别，并根据识别出的声纹确定所述用户身份；对所述用户的指纹进行识别，并根据识别出的指纹确定所述用户身份；对所述用户进行图像识别，并根据识别出的图像特征确定所述用户身份。4.如权利要求2所述的方法，还包括：采集多个用户各自的生物信息并生成身份信息库，并且识别所述用户的生物信息并基于所述生物信息确定所述用户身份包括：将获取的所述用户的生物信息与所述身份信息库内存储的生物信息相比较；以及根据比较结果，确定所述用户身份。5.如权利要求1所述的方法，其中，基于所述用户身份，生成所述语音数据的处理结果包括：基于所述用户身份，获取所述用户的画像信息和历史信息；以及基于所述画像信息和历史信息，生成所述语音数据的处理结果。6.如权利要求5所述的方法，其中，生成所述语音数据的处理结果还包括：获取所述语音数据的场景和/或上下文信息；基于所述场景和/或上下文信息，生成所述语音数据的处理结果。7.如权利要求6所述的方法，其中，生成所述语音数据的处理结果还包括：基于所述场景和/或上下文信息，从所述画像信息和历史信息中筛选所需的用户信息；以及基于筛选出的用户信息，生成所述语音数据的处理结果。8.如权利要求5所述的方法，其中，所述画像信息和历史信息包括如下至少一项：所述用户使用当前语音交互设备时获取的画像信息和历史信息；以及所述用户使用关联账户和/或设备时获取的画像信息和历史信息。9.如权利要求8所述的方法，还包括：基于所述用户针对如下至少一项的操作，创建和/或更新所述画像信息和历史信息：所述当前语音交互设备；其他关联账户；以及其他关联设备。10.如权利要求1所述的方法，其中，基于所述用户身份，生成所述语音数据的处理结果包括：基于所述用户身份，确定所述语音数据的领域意图；以及
基于所述领域意图，生成所述语音数据的处理结果。11.如权利要求1所述的方法，其中，基于所述用户身份，生成所述语音数据的处理结果包括：基于所述用户身份，确定所述语音数据本身的领域意图之外的附加领域意图；以及基于所述附加领域意图，生成所述语音数据的附加处理结果。12.如权利要求1所述的方法，还包括：向所述用户提供基于所述语音数据的处理结果的服务。13.如权利要求12所述的方法，其中，所述服务包括多个服务，每个服务涉及对应的关联操作，所述多个关联操作包括如下至少一项：相继执行的同类操作；以及同时执行的异类操作。14.如权利要求13所述的方法，其中，所述关联操作包括如下至少一项：声音播放；视觉呈现；以及其他设备控制。15.如权利要求14所述的方法，其中，所述声音播放包括语音反馈，所述语音反馈的形式基于所述用户身份确定。16.如权利要求12所述的方法，其中，向所述用户提供基于所述语音数据的处理结果的服务包括：向所述用户提供对应于相同或不同服务的信息流。17.一种语音处理系统，包括语音交互设备和服务器，所述语音交互设备用于：接收来自用户的语音数据；确定所述用户的用户身份；向所述服务器上传所述语音数据和所述用户身份，以及所述服务器用于：基于所述用户身份，生成所述语音数据的处理结果。18.如权利要求17所述的系统，其中，所述语音交互设备用于：对所述语音数据进行声纹识别，并根据识别出的声纹确定所述用户身份。19.如权利要求18所述的系统，其中，所述语音交互设备用于：从生物识别组件或设备获取确定的用户身份。20.如权利要求19所述的系统，其中，所述生物识别组件或设备包括如下至少一项：指纹识别组件或设备；以及人脸识别组件或设备。21.如权利要求17所述的系统，其中，所述语音交互设备用于：采集多个用户各自的身份信息，所述身份信息用于确定用户身份；以及在本地或服务器上生成包括所述身份信息的身份信息库。22.如权利要求21所述的系统，其中，所述语音交互设备用于：获取所述用户的身份信息；
将获取的所述用户的生物信息与所述身份信息库内存储的身份信息相比较；以及根据比较结果，确定所述用户身份。23.如权利要求17所述的系统，其中，所述服务器用于：基于所述用户身份，查询所述用户的画像信息和历史信息；以及基于所述画像信息和历史信息，生成所述语音数据的处理结果。24.如权利要求23所述的系统，其中，所述服务器用于：获取所述语音数据的场景和/或上下文信息；基于所述场景和/或上下文信息，从所述画像信息和历史信息中筛选所需的用户信息；以及基于筛选出的用户信息，生成所述语音数据的处理结果。25.如权利要求17所述的系统，其中，所述服务器用于：基于所述用户身份，确定所述语音数据的领域意图，和/或所述语音数据本身的领域意图之外的附加领域意图；以及基于所述领域意图，和/或所述附加领域意图，生成所述语音数据的处理结果。26.如权利要求17所述的系统，其中，所述服务器用于：返回基于所述语音数据的处理结果的服务信息。27.如权利要求26所述的系统，其中，所述语音交互设备用于：获取所述服务器返回的服务信息；基于所述服务信息，执行对应的关联操作，所述关联操作包括如下至少一项：声音播放；视觉呈现；以及其他设备控制。28.如权利要求27所述的系统，其中，所述语音交互设备是智能音箱，所述其他设备是与所述智能音箱联网的物联网设备。29.一种语音交互设备，包括：语音数据接收装置，用于接收用户的语音数据；用户身份确定装置，用于确定所述用户的用户身份；联网装置，用于将获取到的语音数据和所述用户身份上传至服务器，并获取所述服务器基于用户身份生成并下发的所述语音数据的处理结果；交互装置，用于基于下发的所述处理结果进行交互。30.如权利要求29所述的设备，其中，所述语音数据接收装置包括：麦克风装置，用于采集用户的语音数据。31.如权利要求29所述的设备，还包括：短距离通信装置，用于如下的至少一项：获取其他语音采集设备采集到的语音数据；以及获取其他设备采集到的用于确定用户身份的身份数据或是判定的用户身份本身。32.如权利要求31所述的设备，其中，所述交互装置包括如下至少一项：扬声器装置，用于向用户播报所述处理结果；显示屏装置，用于向用户显示所述处理结果，和/或
所述短距离通信装置，用于将获取的所述处理结果发送至其他设备。33.如权利要求32所述的设备，其中，所述语音数据的处理结果包括多个操作，并且所述多个操作涉及所述交互装置的连续操作或是至少两个不同交互装置的同时操作。34.如权利要求29所述的设备，包括：场景信息获取装置，用于获取场景信息，并且所述联网装置用于将获取到的所述场景信息上传服务器，并获取所述服务器基于所述场景信息筛选出的用户身份信息生成的所述处理结果。35.如权利要求29所述的设备，其中，所述语音交互设备用于：采集多个用户各自的身份信息，所述身份信息用于确定用户身份；以及在本地或服务器上生成包括所述身份信息的信息库。36.一种语音交互方法，包括：接收用户的语音数据；确定所述用户的用户身份；将获取到的语音数据和所述用户身份上传至服务器；获取所述服务器基于用户身份生成并下发的所述语音数据的处理结果；以及基于下发的所述处理结果进行操作。37.如权利要求36所述的方法，其中，确定所述用户的用户身份包括如下至少一项：基于所述语音数据中提取的声纹信息，确定所述用户的用户身份；以及获取其他设备采集到所述用户身份或是用于确定所述用户身份的身份信息。38.如权利要求36所述的方法，其中，基于下发的所述处理结果进行操作包括如下至少一项：向用户播报所述处理结果；向用户显示所述处理结果；以及将获取的所述处理结果发送至其他设备。39.如权利要求38所述的方法，还包括：采集多个用户各自的身份信息，所述身份信息用于确定用户身份；以及在本地或服务器上生成包括所述身份信息的身份信息库。40.一种语音处理方法，包括：接收来自用户的语音数据；采集所述用户的图像数据；基于所述语音数据和/或所述图像数据确定所述用户的用户身份；以及基于所述用户身份，生成所述语音数据的处理结果。41.一种车载语音处理系统，包括：麦克风，用于接收用户的语音数据；处理器，用于基于所述语音数据确定所述用户的用户身份；以及交互装置，用于根据基于所述用户身份生成的语音处理结果进行交互。42.如权利要求41所述的系统，其中，所述麦克风包括布置在车辆不同位置上的多组麦克风，并且所述处理器根据所述多组模块获取的语音数据确定所述用户的用户身份，和/或
所述系统还包括图像采集装置，并且所述处理器还根据图像采集数据采集到的图像信息确定所述用户的用户身份。43.一种语音处理系统，包括：多个语音交互设备，用于接收来自用户的语音设备，其中，所述多个语音交互设备中的一个语音交互设备被唤醒与用户进行交互，并且所述交互包括：接收来自用户的语音数据；基于所述语音数据确定所述用户的用户身份，并且基于被唤醒的所述语音交互设备的位置确定当前交互场景；以及基于所述用户身份和所述当前交互场景，生成所述语音数据的处理结果。44.一种计算设备，包括：处理器；以及存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求36-39中任一项所述的方法。45.一种非暂时性机器可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求36-39中任一项所述的方法。

技术总结
提出了一种语音处理方法和系统、及语音交互设备和方法，其中该语音处理方法包括：接收来自用户的语音数据；确定所述用户的用户身份；以及基于所述用户身份，生成所述语音数据的处理结果。本发明能够依据用户身份提供个性化语音交互服务，能够根据不同用户的不同喜好，推荐出非精确意图场景下不同的信息服务流组合。组合。组合。

技术研发人员：张平袁怀宾
受保护的技术使用者：阿里巴巴集团控股有限公司
技术研发日：2020.03.16
技术公布日：2021/9/16

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种语音信号未知情绪状态识别方法与流程

语音处理方法和系统、及语音交互设备和方法与流程

相关文章

最热文献