一种基于智能耳机的交互方法与流程

2022-07-31 08:32:50 来源：中国专利 TAG：

1.本发明涉及智能耳机交互技术领域，尤其是涉及一种基于智能耳机的交互方法。

背景技术：

2.智能耳机，主要是指1)蓝牙耳机包括小型话筒和小型扬声器以及与蓝牙耳机连接的终端系统(如智能手机)，或者2)微型智能手机包括小型话筒和小型扬声器以及手机的所有其它组件全部制作成耳机的形状，放置在用户的外耳道中，来实现和用户进行声音交互。
3.当前的智能耳机技术以及市场上的主要产品，主要局限是：
4.1)激活智能耳机的方法：这里的激活是指智能耳机开机以后它在等待用户的某一种声音或者信号来启动接收用户的语音输入。当前的智能耳机技术以及市场上的主要产品的激活方法是：1a)用户需要通过操作手机或者操作智能耳机上面的按钮来激活智能耳机，或者1b) 使用通用的唤醒词(如“小度小度”)来激活智能手机。
5.对于1a，用户需要用手进行操作，增加了用户的不便。
6.对于1b，随着大公司的手机和语音交互智能助手的普及(如苹果手机的siri,小米手机的小爱同学，小度在家的小度小度等)，通用的唤醒词经常会被用户附近的其他听众所熟知(比如“小爱同学”，“小度小度”)，用户用嘴巴说出相关的通用的唤醒词的时候，在有听众情况下，会体验到一定程度的尴尬并且无法掩饰自己在使用智能助手而获得相关的信息。但是在很多实际情景下，用户是需要在听众不知道自己正在使用智能助手进行相关信息的查询，包括用户给听众讲故事、说笑话、背诵诗歌、唱歌等具体场景。
7.2)播放方式和速度方面：当前的智能耳机只是播放用户想要听的内容(如查询内容)，不管用户的当前场景，智能耳机播放的速度都是一样的。这种设计在一部分重要的应用场景下会出现问题：当用户在查询信息只给自己听的时候智能耳机播放信息的速度可以是正常的，但是如果用户是需要把听到的信息(如笑话和故事等)要实时说给听众的时候，那么用户所需要的智能耳机播放的句子之间要有一定的停顿，用户才能够有时间把所听到的信息复述给听众。现有的智能耳机的交互方式没有考虑到这一点。
8.3)播放内容方面：当前的智能耳机的播放内容一般是基于已有的信息，用户无法自定义或预先上传相关的信息并听取自己上传的内容。

技术实现要素：

9.为了克服现有智能耳机交互方法存在的缺陷，本发明提供了一种基于智能耳机的交互方法，使用非通用的唤醒词句或者某种无线装置，减少用户在有听众情景下的尴尬，形成自然的语言流，针对不同的用户意图改变智能耳机的播放方式和速度。
10.本发明所采用的技术方案是：
11.一种基于智能耳机的交互方法，所述方法包括以下步骤：
12.步骤1)、用户使用唤醒词句或者某种无线装置激活智能耳机，主要通过自然的语言去激活智能耳机；所述的唤醒词句包括非通用的唤醒词句和通用的唤醒词句；所述自然
的语言是指用户在有听众的情况下通过非通用的唤醒词句来激活智能耳机，避免用户在有听众情况下使用通用唤醒词而形成尴尬；
13.步骤2)、智能耳机被激活后，识别唤醒词句，推测用户意图，并通过用户说的词句查询并返回相关信息；
14.步骤2.1)、当智能耳机被激活后，通过智能耳机的语音激活和识别模块识别这些唤醒词句，并且记录唤醒方式，即通过语音激活还是通过某种无线设备激活，同时智能耳机的声音控制和播放模块将反馈声音或者反馈语音播放给用户，提示用户智能耳机已经收到用户的唤醒词句并等待用户输入词句；比如“我在，请说需要播放什么”。
15.步骤2.2)、用户说出含有关键词的词句，比如“李白的诗句”；；
16.步骤2.3)、语音激活和识别模块识别用户的词句，并提取用户所说的词句中的关键词；
17.步骤2.4)、智能耳机的用户意图推测和信息库服务交互模块根据步骤2.3)获得的关键词查找相关的信息库内容，包括已有的信息库或者用户自建的信息库,同时播放反馈声音或反馈语音，比如“正在查询”。如果能够查询到，则返回查询到的内容和激活的信息库；如果没有查到，则反馈用户未查询到该信息；智能耳机的用户意图推测和信息库服务交互模块会根据用户的关键词来激活并查询相关的信息库，比如关键词是“笑话”则激活笑话库，并返回查询内容和被激活的信息库的名称；如果关键词含有歌曲的相关的信息，比如歌曲的名称、某个歌星的名字、或者歌曲的一句歌词，则激活含有歌曲的信息库，并返回查询内容和被激活的信息库的名称；所述信息库，是指各种文字或者音频含歌曲的信息库，可以是已有建立好的信息库，也可以是用户自己建立的信息库；信息库分为两大类，含有歌曲信息如歌词或歌曲等的音频的称为歌曲库，不含有歌曲信息的称为非歌曲库；非歌曲库具体可以包括但不限于：笑话、故事、诗歌、谜语、脑筋急转弯、情话、美食和烹饪、百科知识、安全和紧急情况处理、问题解决、各种专业知识和词典、人生经验、名言和佳句、对话技巧和建议、旅游信息、健康和疾病诊治、美容瘦身、影视、萌宠、明星、娱乐、体育、科技、家居家装、星座、艺术、历史、地理、军事、新闻等以及用户自建的信息。
18.步骤2.5)、该步骤和步骤2.4)同时进行，智能耳机的用户意图推测和信息库服务交互模块根据用户的唤醒智能耳机的方式(通过语音激活还是通过某种无线设备)和唤醒词句(非通用的还是通用的唤醒词句)，来推测用户的意图：
19.意图1：如果用户说出五类非通用唤醒词句中的一类非通用唤醒词句或者按动某种无线装置，则推测用户的意图是要提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌；用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块；
20.意图2：如果用户说出的是通用的唤醒词句，如该智能耳机的名称，则推测用户的意图是用户自己查询信息给自己听；用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块；
21.步骤3)、智能耳机的声音控制和播放模块根据不同的用户意图和被激活的信息库确定信息播放方式和速度；根据步骤2.5)的结果，如果是意图1：用户是要说或者唱给听众，则进入步骤3.1)；如果是意图2，则进入步骤3.4)；
22.步骤3.1)、通过步骤2.4)用户的关键词来判断被激活的信息库是歌曲库还是非歌
曲库；如果是非歌曲库被激活，进入步骤3.2)；如果是歌曲库被激活，则进入步骤3.3)；
23.步骤3.2)如果是非歌曲库激活，则根据步骤2.4)返回的查询到的内容，智能耳机的声音控制和播放模块将按照以下步骤进行处理：
24.第1步，根据文本中标点符号作为切分小句的标记，将段落和句子切分成多个小句；
25.第2步，检查每个小句的长度，如果某一个小句的长度超过单个小句最长字数限制参数x，那么就分析该句子的语法结构并自动将该小句切分成多个小句子，并保证切分后的小句子满足以下要求：1)主谓宾尽量完整；2)代词、名词、动词、形容词、副词、词组(如成语)等不被切开；3)总字数小于最长字数限制参数x；
26.第3步，播放每小句话后有意停顿n秒，其中n＝该句话的字数
×
c；其中参数c为单个小句播放后有意停顿的时间参数(单位是字/秒)，用户第一次使用智能耳机的时候，该参数c有一个缺省值，比如c＝0.4字/秒，用户也可以通过自然的语言(见步骤4)) 或者智能耳机的用户自定义和输入模块修改该参数的值。
27.步骤3.3)、如果是歌曲库被激活，通过步骤2.4)获得的用户词句的和歌曲库中查询的结果，分为两种情况：
28.情况1：如果能够查询到该歌曲的音频，则播放音频；
29.情况2：如果只能查询到该歌曲的歌词：情况2a)若智能耳机的语音激活和识别模块可以准确识别用户当前的歌唱进度，则声音控制和播放模块将提前m秒向用户播放该首歌的下一句歌词。m为播放歌词的提前时间，单位是秒，智能耳机出厂时有缺省值(比如1秒)，用户可以通过智能耳机的用户自定义和输入模块进行调整；情况2b)若智能耳机无法识别用户的歌唱进度或者识别错误较高，则根据该歌曲的歌词播放表含每句歌词的播放时间来播放歌词。
30.步骤3.4)：如果用户的唤醒词句是本智能耳机的名称，即通用的唤醒词，则推测用户的意图是用户自己查询信息给自己听；智能耳机将用正常速度播放这些声音：如果是非歌曲库被激活，单个小句播放后有意停顿的时间参数c为0；如果是播放歌曲库中的歌词，则m＝0。
31.进一步，所述交互方法还包括以下步骤：步骤4)、用户通过关键词对智能耳机的播放进行控制:
32.用户可以通过以下的比较自然的语音交互方式来控制智能耳机的播放，特别是在有听众的情况下，避免尴尬的发生。
33.情况1：如果对用户对智能耳机播放的内容不满意，想更换内容或者进入下一个信息或者下一首歌曲：
34.步骤4.1.1)：用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线装置，重新激活智能耳机。
35.步骤4.1.2)：用户嘴巴说含有需要信息库的关键词(比如故事、笑话)。或者说出换一个的意思的同义词(如再，下一个、换一个等)，比如“我再给你说一个故事”。
36.步骤4.1.3)：语音激活和识别模块获得这些词句的关键词后，智能耳机将重复上面的步骤2)和步骤3)。
37.情况2：如果对用户觉得智能耳机播放的各句子之间停顿时间过短，即智能耳机的
播放速度过快。
38.步骤4.2.1)：用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线装置，重新激活智能耳机。
39.步骤4.2.2)：用户可以用嘴巴说自己讲太快了的词句以及同义词句，比如“我可能讲得太快了”。
40.步骤4.2.3)：语音激活和识别模块识别词句中包含“太快”或者其同义词的关键词，通过意图推测和信息库服务交互模块识别用户的当前意图，进而通过声音控制和播放模块延长句子之间的停顿时间，即增大单个小句播放后有意停顿的时间参数c的值。同时，智能耳机将播放相关的反馈给用户，比如“收到，我将放慢播放速度”。
41.情况3：如果对用户觉得智能耳机播放的各句子之间停顿时间过长，即播放速度太慢了：
42.步骤4.3.1)：用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线装置，重新激活智能耳机。
43.步骤4.3.2)：用户可以用嘴巴说自己讲太慢了的词句以及同义词句，比如“我可能讲得太慢了”。
44.步骤4.3.3)：语音激活和识别模块识别词句中包含“太慢”或者其同义词关键词，通过意图推测和信息库服务交互模块识别用户的当前意图，进而通过声音控制和播放模块减少句子之间的停顿时间，即减小单个小句播放后有意停顿的时间参数c的值。同时，智能耳机将播放相关的反馈给用户，比如“收到，我将加快播放速度”。
45.情况4：如果用户想暂停智能耳机的播放：
46.步骤4.4.1)：条件1)智能耳机的意图推测和信息库服务交互模块提取当前用户的意图是要提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌；同时满足条件2)语音激活和识别模块在d 秒时间范围内，未获取到用户的任何的声音，包括唤醒词句、唱歌的歌声或者其它词句。其中d是智能耳机无信号进行暂停的时间阈限参数，在智能耳机出厂时有一缺省值(如10秒)，用户也可以通过自然的语言或者智能耳机的用户自定义和输入模块修改该参数的值。当同时满足条件1)和条件2)时，意图推测和信息库服务交互模块判断用户的意图是暂停耳机的播放，将该意图发送给声音控制和播放模块。
47.步骤4.4.2)：声音控制和播放模块收到暂停耳机播放的意图，暂停播放声音；同时，播放暂停反馈给用户并提示用户智能耳机的激活方法，比如“现在我休眠了，您可以说，让我想一想等唤醒词，重新激活我”。
48.用户也可以通过某种无线装置的多个按钮来实现以上换内容、快放、慢放、和暂停等功能。常规的关键词另外，当用户的意图是播放内容给自己听，即当步骤3.4)运行以后，用户也可以用常规的关键词句，比如暂停、关闭、停止播放等来控制智能耳机的播放。
49.再进一步，所述非通用的唤醒词句包括以下五类：
50.第1类：用户用第一人称说的需要思考或者回忆的词句；
51.第2类：用户用第一人称说的自己可能知道的词句；
52.第3类：用户询问他人的词句；
53.第4类：用户用第一人称说自己将要开始说话或者想告诉他人的词句；
54.第5类：用户自定义唤醒词句；
55.通用的唤醒词句一般是该智能耳机的名称。
56.更进一步，所述非通用唤醒词句的第一类可采用以下词句：“我想想”、“让我想想”、“我想一想”、“让我想一想”、“让我想一下”、“让我思考一下”、“让我考虑一下”、“让我回忆一下”、“让我回想一下”或者以上词句的同义词句；
57.非通用唤醒词句的第二类可采用以下词句：“我可能知道”、“我有可能知道”、“这个我可能知道”、“那个我可能知道”或者以上词句的同义词句；
58.非通用唤醒词句的第三类可采用以下词句：“你/您知道”、“我想问你/您”、“我想知道”、“我想问下”、“请问”、“请教你 /您”、“你/您是否知道”或者以上词句的同义词句；
59.非通用唤醒词句的第四类可采用以下词句：“现在我讲下”、“我来开始报告”、“我来吧”、“我来说一下”、“我来说吧”、“我现在开始”、“我想说下”、“我要讲下”、“我想汇报一下”、“我想告诉大家”、“我想向你们说下”、“我想告诉你”、“我想告诉你们”、“我想给大家汇报一下”、“我要给大家讲一下”或者以上词句的同义词句。
60.非通用唤醒词句的第五类是用户自定义的非通用的唤醒词句。
61.所述的用户自定义和输入模块包括如下功能：
62.1)显示信息库的列表和激活每个信息库的方法，并允许用户修改或增减激活信息库的方法，也允许用户修改或增减已有信息库及其内容；所述显示即包括通过视觉方式呈现相关信息，也包括通过语音等方式告知用户。
63.2)显示并允许用户修改或增减智能耳机的所有唤醒词句，也允许用户修改智能耳机的反馈声音；
64.3)显示智能耳机的各参数及其出厂缺省值，并且允许用户自定义或者调整这些参数，包括单个小句最长字数限制参数x、单个小句播放后有意停顿的时间参数c、播放歌词的提前时间参数m和耳机无信号进行暂停的时间阈限参数d；
65.4)允许用户输入和修改需要播放的信息，即自建信息库，并让用户指定激活每个自建信息库对应的一个或者多个激活关键词句；
66.该模块具体可以是智能耳机连接的终端的软件或者网页。
67.本发明的有益效果主要表现在：用户可以使用非通用的唤醒词或者其它无线设备激活智能耳机，避免用户在有听众在场情况下使用通用唤醒词唤醒智能助手而形成的尴尬；本发明将形成用户和智能耳机之间的比较自然的语言流，并且能够根据用户的意图调整智能耳机播放声音的播放方式和速度，有效配合用户在有听众情况下给听众讲文字内容或者唱歌。
附图说明
68.图1是本发明的交互方法流程图。
具体实施方式
69.下面结合附图对本发明作进一步描述。
70.参照图1，一种智能耳机的主要功能模块包括语音激活和识别模块、用户意图推测和信息库服务交互模块和声音控制和播放模块。可选的模块是用户自定义和输入模块和某种无线装置。
71.语音激活和识别模块，用于接受用户的唤醒词句并识别用户的语音，语音转成文本信息，该模块包括麦克风以及相关的语音唤醒和识别组件以及它们之间的有线或者无线连接。
72.用户意图推测和信息库服务交互模块，用于将根据用户的唤醒词句和后面的词句推测用户的意图，并且将识别后的信息发送到相关的信息库，进行查询，并将返回查询信息发送到声音控制和播放模块。这些信息库可以存在智能耳机本地的存储器或者是云服务器上。用户也可以自建信息库，如果是文字形式的，则归入非歌曲库；如果是歌曲形式的，则归入歌曲库。
73.声音控制和播放模块，用于播放并控制声音给用户听，包括声音控制组件和微型扬声器，以及它们之间的有线或者无线连接；声音控制组件可以是播放程序或者软件的一部分。
74.用户自定义和输入模块，该模块的功能如下：1)显示信息库的列表和激活每个信息库的方法(比如诗歌库的激活的方法是某个作者名字、某句诗词、某种类型的诗歌等)，并允许用户修改或增减激活信息库的方法，也允许用户修改或增减已有信息库及其内容。所述显示即包括通过视觉方式呈现相关信息，也包括通过语音等方式告知用户。2) 显示并允许用户修改或增减智能耳机的所有唤醒词句，也允许用户修改智能耳机的反馈声音。3)显示智能耳机的各参数及其出厂缺省值，并且允许用户自定义或者调整这些参数，包括单个小句最长字数限制参数x(单位：字)、单个小句播放后有意停顿的时间参数c(单位：字 /秒)、播放歌词的提前时间参数m(单位：秒)、和耳机无信号进行暂停的时间阈限参数d(单位：秒)；4)允许用户输入和修改需要播放的信息，即自建信息库，并让用户指定激活每个自建信息库对应的一个或者多个激活关键词句，比如“我今天的报告”。该模块具体可以是智能耳机连接的终端的软件或者网页等，比如手机上的的app或者网页或者微信小程序、电脑软件或者网页等。
75.还包括激活智能耳机的某种无线装置：任何可以和智能耳机或是智能耳机终端进行无线通讯并且激活智能耳机的装置，可以是一个独立于蓝牙耳机的无线装置，如遥控器等。
76.实现这些功能模块的有很多种硬件方案，具体硬件如处理器、存储器、电池、和按钮等未列出。
77.与现有智能耳机是一样的，以上模块有多种实现的方式：比如方式1：语音激活和识别模块中的麦克风和声音控制和播放模块中的微型扬声器可以做成一个蓝牙耳机放入用户的外耳道中，通过蓝牙等无线通讯方式和包含了其它模块和组件的终端(比如智能手机)连接。终端中的模块包括：语音激活和识别模块中的语音唤醒和识别组件、用户意图推测和信息库服务交互模块、声音控制和播放模块中的包括声音控制组件，以及可选的用户自定义和输入模块，该模块可通过app、网页、小程序或者无需视觉显示的语音交互等方式实现。另外，语音激活和识别模块中的语音唤醒组件可以植入蓝牙耳机，也可以植入终端(如智能手机)中。
78.又比如方式2：语音激活和识别模块、用户意图推测和信息库服务交互模块、和声音控制和播放模块全部集中在一个整体的硬件里面制作成耳机形状放入用户的外耳道中。可选的用户自定义和输入模块可以通过app、网页、微信小程序或者或者无需视觉显示的语
音交互等方式来实现，并通过蓝牙等无线方式连接该整体硬件。
79.一种基于智能耳机的交互方法，所述方法包括以下步骤：
80.步骤1)、用户使用唤醒词句或者某种无线装置激活智能耳机，主要通过的自然的语言去激活智能耳机；所述自然的语言是指用户在有听众的情况下通过非通用的唤醒词句来激活智能耳机，避免用户在有听众情况下使用通用唤醒词而形成尴尬；
81.步骤2)、智能耳机被激活后，识别唤醒词句，推测用户意图，并通过用户说的词句查询并返回相关信息。
82.步骤2.1)、当智能耳机被激活后，通过智能耳机的语音激活和识别模块识别这些唤醒词句，并且记录唤醒方式即通过语音激活还是通过某种无线设备激活，同时智能耳机的声音控制和播放模块将反馈声音或者反馈语音播放给用户，提示用户智能耳机已经收到用户的唤醒词句并等待用户输入词句；比如“我在，请说需要播放什么”。
83.步骤2.2)、用户说出含有关键词的词句，比如“李白的诗句”。
84.步骤2.3)、语音激活和识别模块识别用户的词句，并提取用户所说的词句中的关键词；
85.步骤2.4)、智能耳机的用户意图推测和信息库服务交互模块根据步骤2.3)获得的关键词查找相关的信息库内容，包括已有的信息库或者用户自建的信息库,同时播放反馈声音或反馈语音，比如“正在查询”。如果能够查询到，则返回查询到的内容和激活的信息库；如果没有查到，则反馈用户未查询到该信息。智能耳机的用户意图推测和信息库服务交互模块会根据用户的关键词来判断激活的信息库，比如关键词是“笑话”，则激活笑话库，并返回查询内容和被激活的信息库的名称。如果关键词含有歌曲的相关的信息，比如歌曲的名称、某个歌星的名字、或者歌曲的一句歌词，则激活歌曲库，并返回查询内容和被激活的信息库的名称。所述信息库，是指各种文字或者音频含歌曲的信息库，可以是已有建立好的信息库，也可以是用户自己建立的信息库；信息库分为两大类，含有歌曲信息如歌词或歌曲等的音频的称为歌曲库，不含有歌曲信息的称为非歌曲库；非歌曲库具体可以包括但不限于：笑话、故事、诗歌、谜语、脑筋急转弯、情话、美食和烹饪、百科知识、安全和紧急情况处理、问题解决、各种专业知识和词典、人生经验、名言和佳句、对话技巧和建议、旅游信息、健康和疾病诊治、美容瘦身、影视、萌宠、明星、娱乐、体育、科技、家居家装、星座、艺术、历史、地理、军事、新闻等以及用户自建的信息；
86.步骤2.5)、该步骤和步骤2.4)同时进行，智能耳机的用户意图推测和信息库服务交互模块根据用户的唤醒智能耳机的方式(通过语音激活还是通过某种无线设备)和唤醒词句(非通用的还是通用的唤醒词句)，来推测用户的意图：
87.意图1：如果用户说出5类非通用唤醒词句中的一类非通用唤醒词句或者按动某种无线装置，则推测用户的意图是要提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌。用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块。
88.意图2：如果用户说出的是通用的唤醒词句，如该智能耳机的名称，则推测用户的意图是用户自己查询信息给自己听。用户意图推测和信息库服务交互模块将把该意图发送给声音控制和播放模块。
89.步骤3)、智能耳机的声音控制和播放模块根据不同的用户意图和被激活的信息库
确定信息播放方式和速度。根据步骤2.5)的结果，如果是意图1：用户是要说或者唱给听众，则进入步骤3.1)；如果是意图2，则进入步骤3.4)。
90.步骤3.1)、通过步骤2.4)用户的关键词来判断被激活的信息库是歌曲库还是非歌曲库；如果是非歌曲库被激活，进入步骤3.2)；如果是歌曲库被激活，则进入步骤3.3)。
91.步骤3.2)如果是非歌曲库激活，则根据步骤2.4)返回的查询到的内容，智能耳机的声音控制和播放模块将按照以下步骤进行处理：
92.第1步，根据文本中标点符号作为切分小句的标记，将段落和句子切分成多个小句；
93.第2步，检查每个小句的长度，如果某一个小句的长度超过单个小句最长字数限制参数x，那么就分析该句子的语法结构并自动将该小句切分成多个小句子，并保证切分后的小句子满足以下要求：1)主谓宾尽量完整；2)代词、名词、动词、形容词、副词、词组(如成语)等不被切开；3)总字数小于最长字数限制参数x；
94.第3步，播放每小句话后有意停顿n秒，其中n＝该句话的字数
×
c；其中参数c为单个小句播放后有意停顿的时间参数(单位是字/秒)，用户第一次使用智能耳机的时候，该参数c有一个缺省值，比如c＝0.4字/秒，用户也可以通过自然的语言(见步骤4)) 或者智能耳机的用户自定义和输入模块修改该参数的值；
95.步骤3.3)、如果是歌曲库被激活，通过步骤2.4)获得的用户词句的和歌曲库中查询的结果，分问2种情况：
96.情况1：如果能够查询到该歌曲的音频，则播放音频；
97.情况2：如果只能查询到该歌曲的歌词：情况2a)若智能耳机的语音激活和识别模块可以准确识别用户当前的歌唱进度，则声音控制和播放模块将提前m秒向用户播放该首歌的下一句歌词。m为播放歌词的提前时间，单位是秒，智能耳机出厂时有缺省值(比如1秒)，用户可以通过智能耳机的用户自定义和输入模块进行调整；情况2b)若智能耳机无法识别用户的歌唱进度或者识别错误较高，则根据该歌曲的歌词播放表含每句歌词的播放时间来播放歌词。
98.步骤3.4)：如果用户的唤醒词句是本智能耳机的名称，即通用的唤醒词，则推测用户的意图是用户自己查询信息给自己听；智能耳机将用正常速度播放这些声音：如果是非歌曲库被激活，单个小句播放后有意停顿的时间参数c为0；如果是播放歌曲库中的歌词，则m＝0。
99.进一步，所述交互方法还包括以下步骤：，步骤4)、用户通过关键词对智能耳机的播放进行控制:
100.用户可以通过以下的比较自然的语音交互方式来控制智能耳机的播放，特别是在有听众的情况下，避免尴尬的发生。
101.情况1：如果对用户对智能耳机播放的内容不满意，想更换内容或者进入下一个信息或者下一首歌曲：
102.步骤4.1.1)：用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线装置，重新激活智能耳机。
103.步骤4.1.2)：用户嘴巴说含有需要信息库的关键词(比如故事、笑话)。或者用户说出换一个的意思的同义词(如再，下一个、换一个等)，比如“我再给你说一个故事”。
104.步骤4.1.3)：语音激活和识别模块获得这些词句的关键词后，智能耳机将重复上面的步骤2)和步骤3)。
105.情况2：如果对用户觉得智能耳机播放的各句子之间停顿时间过短，即智能耳机的播放速度过快：
106.步骤4.2.1)：用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线装置，重新激活智能耳机。
107.步骤4.2.2)：用户可以用嘴巴说自己讲太快了的词句以及同义词句，比如“我可能讲得太快了”。
108.步骤4.2.3)：语音激活和识别模块识别词句中包含“太快”或者其同义词的关键词，通过意图推测和信息库服务交互模块识别用户的当前意图，进而通过声音控制和播放模块延长句子之间的停顿时间，即增大单个小句播放后有意停顿的时间参数c的值。同时，智能耳机将播放相关的反馈给用户，比如“收到，我将放慢播放速度”。
109.情况3：如果对用户觉得智能耳机播放的各句子之间停顿时间过长，即播放速度太慢了：
110.步骤4.3.1)：用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线装置，重新激活智能耳机。
111.步骤4.3.2)：用户可以用嘴巴说自己讲太慢了的词句以及同义词句，比如“我可能讲得太慢了”。
112.步骤4.3.3)：语音激活和识别模块识别词句中包含“太慢”或者其同义词的关键词，通过意图推测和信息库服务交互模块识别用户的当前意图，进而通过声音控制和播放模块减少句子之间的停顿时间，即减小单个小句播放后有意停顿的时间参数c的值。同时，智能耳机将播放相关的反馈给用户，比如“收到，我将加快播放速度”。
113.情况4：如果用户想暂停智能耳机的播放：
114.步骤4.4.1)：条件1)智能耳机的意图推测和信息库服务交互模块提取当前用户的意图是要提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌；同时满足条件2)语音激活和识别模块在d 秒时间范围内，未获取到用户的任何的声音，包括唤醒词句、唱歌的歌声或者其它词句。其中d是智能耳机无信号进行暂停的时间阈限参数，在智能耳机出厂时有一缺省值(如10秒)，用户也可以通过自然的语言或者智能耳机的用户自定义和输入模块修改该参数的值。当同时满足条件1)和条件2)时，意图推测和信息库服务交互模块判断用户的意图是暂停耳机的播放，将该意图发送给声音控制和播放模块。
115.步骤4.4.2)：声音控制和播放模块收到暂停耳机播放的意图，暂停播放声音；同时，播放暂停反馈给用户并提示用户智能耳机的激活方法，比如“现在我休眠了，您可以说，让我想一想等唤醒词，重新激活我”。
116.用户也可以通过某种无线装置的多个按钮来实现以上换内容、快放、慢放、和暂停等功能。另外，当用户的意图是播放内容给自己听，即当步骤3.4)运行以后，用户也可以用常规的关键词句，比如暂停、关闭、停止播放等来控制智能耳机的播放。
117.再进一步，所述步骤1)的唤醒词包括非通用的唤醒词句和通用的唤醒词句，所述非通用的唤醒词句包括以下五类：
118.第1类：用户用第一人称说的需要思考或者回忆的词句；
119.第2类：用户用第一人称说的自己可能知道的词句；
120.第3类：用户询问他人的词句；
121.第4类：用户用第一人称说自己将要开始说话或者想告诉他人的词句；
122.第5类：用户自定义唤醒词句；
123.通用的唤醒词句一般是该智能耳机的名称。
124.所述非通用唤醒词句的第一类可采用以下词句：“我想想”、“让我想想”、“我想一想”、“让我想一想”、“让我想一下”、“让我思考一下”、“让我考虑一下”、“让我回忆一下”、“让我回想一下”或者以上词句的同义词句。
125.非通用唤醒词句的第二类可采用以下词句：“我可能知道”、“我有可能知道”、“这个我可能知道”、“那个我可能知道”或者以上词句的同义词句；
126.非通用唤醒词句的第三类可采用以下词句：“你/您知道”、“我想问你/您”、“我想知道”、“我想问下”、“请问”、“请教你 /您”、“你/您是否知道”或者以上词句的同义词句；
127.非通用唤醒词句的第四类可采用以下词句：“现在我讲下”、“我来开始报告”、“我来吧”、“我来说一下”、“我来说吧”、“我现在开始”、“我想说下”、“我要讲下”、“我想汇报一下”、“我想告诉大家”、“我想向你们说下”、“我想告诉你”、“我想告诉你们”、“我想给大家汇报一下”、“我要给大家讲一下”或者以上词句的同义词句。
128.非通用唤醒词句的第五类是用户自定义的非通用的唤醒词句。
129.用户使用非通用的唤醒词句激活并和智能耳机交互的自然语言流举例如下：
130.例子1)用户查询已有信息库内容并讲给听众听：
131.1.用户对听众说：“让我想一下”；
132.2.用户听到智能耳机说：“我在，请说需要播放什么”；
133.3.用户对听众说：“给你说个好听的故事吧”；
134.4.用户听到智能耳机说：“正在查询
……
，故事发生在遥远的中东地区”，耳机停顿n秒，其中n＝该句话的字数
×
c，“故事的主人公是费托嗄”；
135.5.用户对听众说：“故事发生在遥远的中东地区
”……
136.如果用户觉得播放速度太慢，用户对听众说：“不好意思，可能我讲的太慢了”，则智能耳机减小句子间停顿时间进行播放，同时用户听到智能耳机说：“我会加快播放速度”。
137.如果满足条件1)当前用户的意图是要提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌；同时满足条件2)语音激活和识别模块在d秒时间范围内，未获取到用户的任何的声音，包括唤醒词句、唱歌的歌声或者其它词句，则智能耳机暂停播放声音，同时用户听到智能耳机说：“现在我休眠了，您可以说，让我想一想等唤醒词，重新激活我”。
138.例子2)用户建立并把自建信息库内容讲给听众听：
139.第一步：用户在给听众讲之前，先通过智能耳机的用户自定义和输入模块，把需要播放的信息以及其激活关键词比如“今天的报告内容”，输入智能耳机的用户意图推测和信息库服务交互模块。
140.第二步：用户按以下步骤和智能耳机进行交互并讲给听众：
141.1.用户对听众说：“我想汇报一下”；
142.2.用户听到智能耳机发出叮咚声；
143.3.用户对听众说：“今天的报告内容”；
144.4.用户听到智能耳机发生叮咚声，并开始播放“在这明媚的春天里”，耳机停顿n秒，其中n＝该句话的字数
×
c，“我们欢聚在一起庆祝我公司第100万个产品销售成功，”耳机停顿n秒，其中n＝该句话的字数
×
c，
……
145.5.用户对听众说：“在这明媚的春天里
”……
。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于智能耳机的交互方法与流程

相关文献

最热文献