口令信息匹配方法、计算机设备和计算机可读存储介质与流程

2021-10-24 11:22:00 来源：中国专利 TAG：计算机自然语言口令匹配可读

1.本技术涉及自然语言处理技术领域，尤其涉及一种口令信息匹配方法、计算机设备和计算机可读存储介质。

背景技术：

2.随着智能手机的普及，移动互联网时代的到来，商家通常会在手机应用程序中加入互动活动，通过互动活动吸引用户使用手机应用程序，以提高手机应用程序的用户量、获取受众用户的用户画像等，从而提升手机应用程序的市场占有率等。
3.相关技术中，商家在公布互动活动的玩法后，用户可利用手机应用程序的客户端接入手机应用程序的服务端，通过移动互联网络向手机应用程序的服务端输入语音信息，手机应用程序的服务端通过识别用户输入的语音信息，并将该语音信息与手机应用程序的服务端预设的口令信息进行匹配，若用户输入的语音信息与服务端预设的口令信息匹配成功，则结合系统设置的游戏规则和用户画像筛选策略，自动或手动、按排名或随机向该用户派发奖品。
4.然而，相关技术中，受各地的方言口音的影响，致使同一个字在不同地区的发音略有不同，普通话发音不标准的情况普遍存在。一些用户在向手机应用程序的服务端输入语音信息时，由于普通话发音不标准，使输入的语音信息无法被服务端正确识别，进而使该语音信息无法与预设的口令信息成功匹配，容易引起用户消极情绪，导致用户流失。

技术实现要素：

5.本技术实施例提供一种口令信息匹配方法。该口令信息匹配方法能够避免用户由于普通话发音不标准导致的语音信息无法与预设的口令信息成功匹配的情形，减少用户因此产生的消极情绪，避免用户流失。
6.本技术实施例提供的口令信息匹配方法，包括：获取口令信息的口令拼音文本集合；获取用户输入的语音信息的待识别拼音文本集合；获取所述口令信息与所述语音信息之间的信息长度比值；将所述口令拼音文本集合与所述待识别拼音文本集合取并集，并去除所述并集中重复的拼音字母，得到拼音对比集合；统计所述拼音对比集合中各拼音字母分别在所述口令拼音文本集合中重复次数，得到第一词频向量；统计所述拼音对比集合中各拼音字母分别在所述待识别拼音文本集合中重复次数，得到第二词频向量；计算所述第一词频向量与所述第二词频向量之间的夹角余弦值；将所述余弦值与信息长度比值相乘，得到待识别拼音文本相似度值；将所述文本相似度值与参考相似度值进行对比；
若所述待识别拼音文本相似度值大于所述参考相似度值，则判定所述语音信息与所述口令信息匹配成功；若所述待识别拼音文本相似度值小于述参考相似度值，则判定所述语音信息与所述口令信息匹配失败。
7.在一种可能的实施方式中，本技术实施例提供的口令信息匹配方法，所述获取口令信息的口令拼音文本集合包括：获取口令信息，将所述口令信息转换为口令拼音文本集合。
8.在一种可能的实施方式中，本技术实施例提供的口令信息匹配方法，所述获取用户输入的语音信息的待识别拼音文本集合包括：接收用户输入的语音信息，并将所述语音信息转换为待识别文本；将所述待识别文本转换为待识别拼音文本集合。
9.在一种可能的实施方式中，本技术实施例提供的口令信息匹配方法，所述获取口令信息与语音信息之间的信息长度比值包括：计算所述口令信息文本的字数，所述口令信息文本的字数为第一值；计算所述待识别文本的字数，所述待识别文本的字数为第二值；判断所述第一值与所述第二值的大小；若所述第一值大于所述第二值，则所述信息长度比值等于第一值除以第二值；若所述第一值小于所述第二值，则所述信息长度比值等于第二值除以第一值。
10.在一种可能的实施方式中，本技术实施例提供的口令信息匹配方法，所述参考相似度值大于等于0.9。
11.本技术实施例提供的口令信息匹配方法，通过计算待识别拼音文本相似度值，并利用待识别拼音文本相似度值与参考相似度的比较，来判定语音信息是否与口令信息匹配，能够避免用户由于普通话发音不标准导致的语音信息无法与预设的口令信息成功匹配的情形，减少用户因此产生的消极情绪，避免用户流失。
12.本技术实施例还提供一种计算机设备，至少包括存储器和处理器；所述存储器存储计算机执行指令；所述处理器执行所述存储器存储的计算机执行指令，使得所述计算机设备执行上述的口令信息匹配方法。
13.本技术实施例提供的计算机设备的有益效果与上述口令信息匹配方法的有益效果相同，在此不再赘述。
14.本技术实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机执行指令，当所述计算机执行指令被处理器执行时，实现上述的口令信息匹配方法。
15.本技术实施例提供的计算机可读存储介质的有益效果与上述口令信息匹配方法的有益效果相同，在此不再赘述。
附图说明
16.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申
请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
17.图1为本技术实施例提供的口令信息匹配方法的流程示意图；图2为本技术实施例提供的口令信息匹配方法中获取用户输入的语音信息的待识别拼音文本集合的流程示意图；图3为本技术实施例提供的口令信息匹配方法中获取口令信息与语音信息之间的信息长度比值的流程示意图。
具体实施方式
18.相关技术中，手机应用程序的服务端通常基于标准汉语普通话的发音对用户输入的语音信息进行识别，并将该语音信息与口令信息进行匹配。对于有方言口音的用户而言，由于普通话发音不标准，例如前后鼻音不分、拼音n的发音与拼音l的发音、拼音h的发音与拼音f的发音不分、平卷舌不分等，使输入的语音信息即使在语义层面与口令信息对应，也无法与预设的口令信息成功匹配，进而引起这些用户消极情绪，导致用户流失。
19.有鉴于此，本技术实施例提供一种口令信息匹配方法、计算机设备和计算机可读存储介质。通过计算待识别拼音文本相似度值，并利用待识别拼音文本相似度值与参考相似度的比较，来判定语音信息是否与口令信息匹配，能够避免用户由于普通话发音不标准导致的语音信息无法与预设的口令信息成功匹配的情形，减少用户因此产生的消极情绪，避免用户流失。
20.下面将结合附图对本技术实施例的实施方式进行详细描述。
21.实施例一图1为本技术实施例提供的口令信息匹配方法的流程示意图；图2为本技术实施例提供的口令信息匹配方法中获取用户输入的语音信息的待识别拼音文本集合的流程示意图；图3为本技术实施例提供的口令信息匹配方法中获取口令信息与语音信息之间的信息长度比值的流程示意图。
22.参见图1所示，本技术实施例提供一种口令信息匹配方法，该口令信息匹配方法包括：s1：获取口令信息的口令拼音文本集合。
23.其中，口令信息包括手机应用程序中互动活动的口令信息，口令拼音文本集合为口令信息所对应发音的拼音文本的集合。
24.获取口令信息的口令拼音文本集合的步骤，可以包括：s11：获取口令信息，将口令信转换为口令拼音文本集合。
25.其中，口令信息为口令文本，口令拼音文本集合为口令文本中各文字对应的拼音字母的集合，口令拼音文本集合由手机应用程序的服务端的计算机设备对口令文本转换得到。
26.s2：获取用户输入的语音信息的待识别拼音文本集合。
27.其中，用户输入的语音信息为用户通过电话麦克风或者手机麦克风等向手机应用程序的服务端输入的自然语言，待识别拼音文本集合为语音信息所对应发音的拼音文本的集合。
28.参见图2所示，获取用户输入的语音信息的待识别拼音文本集合的步骤，可以包括：s21：接收用户输入的语音信息，并将语音信息转换为待识别文本。
29.具体的，待识别文本为用户输入的语音信息所对应的文字，手机应用程序的服务端通过移动互联网接收用户输入的语音信息，并通过手机应用程序的服务端的计算机设备将该语音信息转换为待识别文本。
30.s22：将待识别文本转换为待识别拼音文本集合。
31.其中，待识别拼音文本集合为待识别文本中各文字对应的拼音字母的集合。待识别拼音文本集合由手机应用程序的服务端的计算机设备对待识别文本转换得到。
32.s3：获取口令信息与语音信息之间的信息长度比值。
33.其中，信息长度比值用于表征口令信息、语音信息两者之间的信息长度比值，即口令信息中包含的汉字数量与语音信息中包含的汉字数量之比。
34.参见图3所示，获取口令信息与语音信息之间的信息长度比值的步骤，可以包括：s31：计算口令信息文本的字数，口令信息文本的字数为第一值。
35.其中，第一值的数值大小代表口令信息的长度。
36.s32：计算待识别文本的字数，待识别文本的字数为第二值。
37.其中，第二值的数值大小代表口令信息的长度。
38.s33：判断第一值与第二值的大小。
39.选取第一值、第二值中数值较小的值除以第一值、第二值中数值较大的值，即：s34a：若第一值大于第二值，则信息长度比值等于第一值除以第二值。
40.s34b：若第一值小于第二值，则信息长度比值等于第二值除以第一值。
41.s4：将口令拼音文本集合与待识别拼音文本集合取并集，并去除并集中重复的拼音字母，得到拼音对比集合。
42.具体的，拼音对比集合口令拼音文本集合和待识别拼音文本集合中出现过的拼音字母的种类的集合。
43.s5：统计拼音对比集合中各拼音字母分别在口令拼音文本集合中重复次数，得到第一词频向量。
44.具体的，第一词频向量为拼音对比集合中各拼音字母分别在口令拼音文本集合中重复的次数。
45.s6：统计拼音对比集合中各拼音字母分别在待识别拼音文本集合中重复次数，得到第二词频向量。
46.具体的，第二词频向量为拼音对比集合中各拼音字母分别在待识别拼音文本集合中重复的次数。
47.s7：计算第一词频向量与第二词频向量之间的夹角余弦值。
48.即利用第一词频向量与第二词频向量的夹角余弦值来评估他们的相似度。
49.其中，夹角余弦值的计算公式为：
式中，为第一词频向量，，为拼音对比集合中第i个拼音字母在口令拼音文本集合重复的次数，1。
50.为第一词频向量，，为拼音对比集合中第个拼音字母在口令拼音文本集合重复的次数，1。
51.为第一词频向量与第一词频向量之间的夹角。
52.为第一词频向量与第一词频向量之间的夹角余弦值。
53.s8：将余弦值与信息长度比值相乘，得到待识别拼音文本相似度值。
54.即利用信息长度比值优化口令信息与语音信息长度不一致的情形。
55.s9：将文本相似度值与参考相似度值进行对比。
56.参考相似度值为语音信息与口令信息是否匹配的判定依据，只有待识别拼音文本相似度值大于参考相似度值，语音信息与口令信息才判定匹配成功，否则匹配失败。
57.s10a：若待识别拼音文本相似度值大于参考相似度值，则判定语音信息与口令信息匹配成功。
58.s10b：若待识别拼音文本相似度值小于述参考相似度值，则判定语音信息与口令信息匹配失败。
59.其中，参考相似度值大于等于0.9，当参考相似度值小于0.9时，容易将与口令信息无关的语音信息判定为与口令信息匹配成功，从而造成匹配错误。
60.本技术实施例提供的口令信息匹配方法，通过计算待识别拼音文本相似度值，并利用待识别拼音文本相似度值与参考相似度的比较，来判定语音信息是否与口令信息匹配，能够避免用户由于普通话发音不标准导致的语音信息无法与预设的口令信息成功匹配的情形，减少用户因此产生的消极情绪，避免用户流失。
61.以下以本技术实施例提供的口令信息匹配方法的其中一个应用场景进行举例说明：在一次商家策划的互动活动中，商家公布通过手机应用程序的客户端向手机应用程序的服务端输入正确的口令信息，即有机会得到商家发放的奖品或积分。
62.鉴于湖南方言中，拼音h的发音与拼音f的发音大多不分，故在此应用场景中，将口令信息设定为“浒男双陵”，将某位用户输入的语音信息设定为“福男双林”，将参考相似度值s0设为0.9。
63.通过步骤s1和步骤s2，可得：“浒男双陵”的口令拼音文本集合a={h,u,n,a,n,s,h,u,a,n,g,l,i,n,g}；“福男双林”的待识别拼音文本集合b={f,u,n,a,n,s,h,u,a,n,g,l,i,n}。
64.通过步骤s3，可得信息长度比值r=4/4=1（即“浒男双陵”的字数比上“福男双林”的字数）。
65.通过步骤s4，可得拼音对比集合c={h,u,n,a,s,g,l,i,f}。
66.通过步骤s5和步骤s6，可得：第一词频向量=[2,2,4,2,1,2,1,1,0]；第二词频向量=[1,2,4,2,1,1,1,1,1]。
[0067]
通过步骤s7，得到第一词频向量与第二词频向量之间的夹角余弦值t=0.9567。
[0068]
通过步骤s8，得到待识别拼音文本相似度值s1=t
×
r=0.9567。
[0069]
通过步骤s9和步骤s10a，可得s1＞s0，判定语音信息“福男双林”与口令信息“浒男双陵”匹配成功。
[0070]
因此，该位用户有机会得到商家发放的奖品或积分。
[0071]
实施例二本技术实施例提供一种计算机设备，包括存储器和处理器。存储器存储计算机执行指令，处理器执行存储器存储的计算机执行指令，使得计算机设备执行实施例一中的口令信息匹配方法。
[0072]
其中，处理器可以是中央处理单元(central processing unit，cpu)，还可以是其他通用处理器、数字信号处理器 (digital signal processor，dsp)、专用集成电路 (application specific integrated circuit，asic)、现成可编程门阵列 (field
‑
programmable gate array，fpga) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0073]
存储器可包括计算机可读存储介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)，存储器是计算机可读存储介质的示例。
[0074]
本技术实施例二中的其余技术特征与实施例一相同，并能取得相应的技术效果，在此不再一一赘述。
[0075]
实施例三本技术实施例提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机执行指令，当计算机执行指令被处理器执行时，实现实施例一中的口令信息匹配方法。
[0076]
计算机可读存储介质包括永久性和非永久性、可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储，信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存 (pram)、静态随机存取存储器 (sram)、动态随机存取存储器 (dram)、其他类型的随机存取存储器 (ram)、只读存储器 (rom)、电可擦除可编程只读存储器 (eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器 (cd
‑
rom)、数字多功能光盘 (dvd) 或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。根据本文中的界定，计算机可读存储介质不包括暂存电脑可读媒体 (transitory media)，如调制的数据信号和载波。
[0077]
本技术实施例三中的其余技术特征与实施例一相同，并能取得相应的技术效果，在此不再一一赘述。
[0078]
最后应说明的是：以上各实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述各实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种计算机用硬盘安装装置的制作方法

口令信息匹配方法、计算机设备和计算机可读存储介质与流程

相关文献

最热文献