一种基于智能耳机的交互方法与流程

2022-07-31 08:32:50 来源：中国专利 TAG：

技术特征：
1.一种基于智能耳机的交互方法，其特征在于：所述方法包括以下步骤：步骤1)、用户使用唤醒词句或者某种无线装置激活智能耳机，主要通过自然的语言去激活智能耳机；所述的唤醒词句包括非通用的唤醒词句和通用的唤醒词句；所述自然的语言是指用户在有听众的情况下通过非通用的唤醒词句来激活智能耳机，避免用户在有听众情况下使用通用唤醒词而形成尴尬；步骤2)、智能耳机被激活后，识别唤醒词句，推测用户意图，并通过用户说的词句查询并返回相关信息；步骤2.1)、当智能耳机被激活后，通过智能耳机的语音激活和识别模块识别这些唤醒词句，并且记录唤醒方式，即通过语音激活还是通过某种无线设备激活，同时智能耳机的声音控制和播放模块将反馈声音或者反馈语音播放给用户，提示用户智能耳机已经收到用户的唤醒词句并等待用户输入词句；步骤2.2)、用户说出含有关键词的词句；步骤2.3)、语音激活和识别模块识别用户的词句，并提取用户所说的词句中的关键词；步骤2.4)、智能耳机的用户意图推测和信息库服务交互模块根据步骤2.3)获得的关键词查找相关的信息库内容，包括已有的信息库或者用户自建的信息库,同时播放反馈声音或反馈语音；如果能够查询到，则返回查询到的内容和激活的信息库；如果没有查到，则反馈用户未查询到该信息的反馈；智能耳机的用户意图推测和信息库服务交互模块会根据用户的关键词来激活并查询相关的信息库，并返回查询内容和被激活的信息库的名称；步骤2.5)、该步骤和步骤2.4)同时进行，智能耳机的用户意图推测和信息库服务交互模块根据用户的唤醒智能耳机的方式和唤醒词句，来推测用户的意图；步骤3)、智能耳机的声音控制和播放模块根据不同的用户意图和被激活的信息库确定信息播放方式和速度。2.如权利要求1所述的一种基于智能耳机的交互方法，其特征在于：所述非通用的唤醒词句包括以下五类：第1类：用户用第一人称说的需要思考或者回忆的词句；第2类：用户用第一人称说的自己可能知道的词句；第3类：用户询问他人的词句；第4类：用户用第一人称说自己将要开始说话或者想告诉他人的词句；第5类：用户自定义唤醒词句。3.如权利要求2所述的一种基于智能耳机的交互方法，其特征在于：所述步骤2.5)中还包括以下步骤：所述用户的意图包括以下两种：意图1：如果用户说出非通用唤醒词句或者按动某种无线装置，则推测用户的意图是要提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌；用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块；意图2：如果用户说出的是通用的唤醒词句，则推测用户的意图是用户自己查询信息给自己听；用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块。4.如权利要求3所述的一种基于智能耳机的交互方法，其特征在于：所述步骤3)中还包括以下步骤：根据步骤2.5)的结果，如果是意图1：用户是要说或者唱给听众，则进入步骤3.1)；如果是意图2，则进入步骤3.4)；
步骤3.1)、通过步骤2.4)用户的关键词来判断被激活的信息库是歌曲库还是非歌曲库；如果是非歌曲库被激活，进入步骤3.2)；如果是歌曲库被激活，则进入步骤3.3)；步骤3.2)如果是非歌曲库激活，则根据步骤2.4)返回的查询到的内容，智能耳机的声音控制和播放模块将按照以下步骤进行处理：第1步，根据文本中标点符号作为切分小句的标记，将段落和句子切分成多个小句；第2步，检查每个小句的长度，如果某一个小句的长度超过单个小句最长字数限制参数x，那么就分析该句子的语法结构并自动将该小句切分成多个小句子，并保证切分后的小句子满足以下要求：1)主谓宾尽量完整；2)代词、名词、动词、形容词、副词、词组不被切开；3)总字数小于最长字数限制参数x；第3步，播放每小句话后有意停顿n秒，其中n＝该句话的字数
×
c；其中参数c为单个小句播放后有意停顿的时间参数，单位是字/秒，用户第一次使用智能耳机的时候，该参数c有一个缺省值，用户也可以通过自然的语言或者智能耳机的用户自定义和输入模块修改该参数的值。步骤3.3)、如果是歌曲库被激活，通过步骤2.4)获得的用户词句的和歌曲库中查询的结果，分为两种情况：情况1：如果能够查询到该歌曲的音频，则播放音频；情况2：如果只能查询到该歌曲的歌词：情况2a)若智能耳机的语音激活和识别模块可以准确识别用户当前的歌唱进度，则声音控制和播放模块将提前m秒向用户播放该首歌的下一句歌词，m为播放歌词的提前时间，单位是秒，智能耳机出厂时有缺省值，用户可以通过智能耳机的用户自定义和输入模块进行调整；情况2b)若智能耳机无法识别用户的歌唱进度或者识别错误较高，则根据该歌曲的歌词播放表含每句歌词的播放时间来播放歌词；步骤3.4)：如果用户的唤醒词句是本智能耳机的名称，即通用的唤醒词，则推测用户的意图是用户自己查询信息给自己听；智能耳机将用正常速度播放这些声音：如果是非歌曲库被激活，单个小句播放后有意停顿的时间参数c为0；如果是播放歌曲库中的歌词，则m＝0。5.如权利要求4所述的一种基于智能耳机的交互方法，其特征在于：所述交互方法还包括以下步骤：步骤4)、用户通过关键词对智能耳机的播放进行控制:用户可以通过以下的比较自然的语音交互方式来控制智能耳机的播放；情况1：如果对用户对智能耳机播放的内容不满意，想更换内容或者进入下一个信息或者下一首歌曲：步骤4.1.1)：用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线装置，重新激活智能耳机；步骤4.1.2)：用户嘴巴说含有需要信息库的关键词,或者说出换一个的意思的同义词；步骤4.1.3)：语音激活和识别模块获得这些词句的关键词后，智能耳机将重复上面的步骤2)和步骤3)；情况2：如果对用户觉得智能耳机播放的各句子之间停顿时间过短，即智能耳机的播放速度过快：步骤4.2.1)：用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线装置，重新激活智能耳机；；
步骤4.2.2)：用户可以用嘴巴说自己讲太快了的词句以及同义词句；步骤4.2.3)：语音激活和识别模块识别词句中包含“太快”或者其同义词的关键词，通过意图推测和信息库服务交互模块识别用户的当前意图，进而通过声音控制和播放模块延长句子之间的停顿时间，即增大单个小句播放后有意停顿的时间参数c的值；同时，智能耳机将播放相关的反馈给用户；情况3：如果对用户觉得智能耳机播放的各句子之间停顿时间过长，即播放速度太慢了：步骤4.3.1)：用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线装置，重新激活智能耳机；步骤4.3.2)：用户可以用嘴巴说自己讲太慢了的词句以及同义词句；步骤4.3.3)：语音激活和识别模块识别词句中包含“太慢”或者其同义词的关键词，通过意图推测和信息库服务交互模块识别用户的当前意图，进而通过声音控制和播放模块减少句子之间的停顿时间，即减小单个小句播放后有意停顿的时间参数c的值；同时，智能耳机将播放相关的反馈给用户；情况4：如果用户想暂停智能耳机的播放：步骤4.4.1)：条件1)智能耳机的意图推测和信息库服务交互模块提取当前用户的意图是要提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌；同时满足条件2)语音激活和识别模块在d秒时间范围内，未获取到用户的任何的声音，包括唤醒词句、唱歌的歌声或者其它词句；其中d是智能耳机无信号进行暂停的时间阈限参数，在智能耳机出厂时有一缺省值，用户也可以通过自然的语言或者智能耳机的用户自定义和输入模块修改该参数的值；当同时满足条件1)和条件2)时，意图推测和信息库服务交互模块判断用户的意图是暂停耳机的播放，将该意图发送给声音控制和播放模块；步骤4.4.2)：声音控制和播放模块收到暂停耳机播放的意图，暂停播放声音；同时，播放暂停反馈给用户并提示用户智能耳机的激活方法。6.如权利要求2至5中任意一项所述的一种基于智能耳机的交互方法，其特征在于：所述非通用唤醒词句的第一类可采用以下词句：“我想想”、“让我想想”、“我想一想”、“让我想一想”、“让我想一下”、“让我思考一下”、“让我考虑一下”、“让我回忆一下”、“让我回想一下”或者以上词句的同义词句；非通用唤醒词句的第二类可采用以下词句：“我可能知道”、“我有可能知道”、“这个我可能知道”、“那个我可能知道”或者以上词句的同义词句；非通用唤醒词句的第三类可采用以下词句：“你/您知道”、“我想问你/您”、“我想知道”、“我想问下”、“请问”、“请教你/您”、“你/您是否知道”或者以上词句的同义词句；非通用唤醒词句的第四类可采用以下词句：“现在我讲下”、“我来开始报告”、“我来吧”、“我来说一下”、“我来说吧”、“我现在开始”、“我想说下”、“我要讲下”、“我想汇报一下”、“我想告诉大家”、“我想向你们说下”、“我想告诉你”、“我想告诉你们”、“我想给大家汇报一下”、“我要给大家讲一下”或者以上词句的同义词句；非通用唤醒词句的第五类是用户自定义的非通用的唤醒词句。7.如权利要求4或5所述的一种基于智能耳机的交互方法，其特征在于：所述的用户自定义和输入模块包括如下功能：
1)显示信息库的列表和激活每个信息库的方法，并允许用户修改或增减激活信息库的方法，也允许用户修改或增减已有信息库及其内容；2)显示并允许用户修改或增减智能耳机的所有唤醒词句，也允许用户修改智能耳机的反馈声音；3)显示智能耳机的各参数及其出厂缺省值，并且允许用户自定义或者调整这些参数，包括单个小句最长字数限制参数x、单个小句播放后有意停顿的时间参数c、播放歌词的提前时间参数m和耳机无信号进行暂停的时间阈限参数d；4)允许用户输入和修改需要播放的信息，即自建信息库，并让用户指定激活每个自建信息库对应的一个或者多个激活关键词句；该模块具体可以是智能耳机连接的终端的软件、网页或者语音交互方式来实现。8.如权利要求1至5中任意一项所述的一种基于智能耳机的交互方法，其特征在于：所述信息库是指各种文字或音频含歌曲的信息库，可以是已有建立好的信息库，也可以是用户自己建立的信息库；信息库分为两大类，含有歌曲信息的歌曲库，不含有歌曲信息的非歌曲库；非歌曲库具体可以包括但不限于：笑话、故事、诗歌、谜语、脑筋急转弯、情话、美食和烹饪、百科知识、安全和紧急情况处理、问题解决、各种专业知识和词典、人生经验、名言和佳句、对话技巧和建议、旅游信息、健康和疾病诊治、美容瘦身、影视、萌宠、明星、娱乐、体育、科技、家居家装、星座、艺术、历史、地理、军事、新闻以及用户自建的信息。

技术总结
一种基于智能耳机的交互方法，所述方法包括以下步骤：步骤1)、用户使用唤醒词句或者某种无线装置激活智能耳机，主要通过自然的语言去激活智能耳机；所述的唤醒词句包括非通用的唤醒词句和通用的唤醒词句；步骤2)、智能耳机被激活后，识别唤醒词句，推测用户意图，并通过用户说的词句查询并返回相关信息；步骤3)、智能耳机的声音控制和播放模块根据不同的用户意图确定信息播放方式和速度。本发明提供了一种基于智能耳机的交互方法，使用非通用的唤醒词句或者某种无线装置，减少用户在有听众情景下的尴尬，形成自然的语言流，针对不同的用户意图改变智能耳机的播放方式和速度。意图改变智能耳机的播放方式和速度。意图改变智能耳机的播放方式和速度。

技术研发人员：丹尼尔
受保护的技术使用者：心行者科技（杭州）有限责任公司
技术研发日：2022.04.26
技术公布日：2022/7/29

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于智能耳机的交互方法与流程

相关文献

最热文献