一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种信息的推送方法、装置、设备及介质与流程

2022-03-26 16:00:40 来源:中国专利 TAG:


1.本公开涉及人工智能技术领域,尤其涉及深度学习技术领域,具体涉及一种信息的推送方法、装置、设备及介质。


背景技术:

2.在即时的沟通会话中,通常会出现用户所不了解的名词,这些名词通常分布广泛,其主要包含百科类、办公场景下的缩写类、指代类、企业产品和项目类以及企业文化类等。对于命中词条的消息,因为不同用户的知识背景不同,如何判断出用户是否有了解、使用该词条的意图,可以快速地破除用户之间的沟通壁垒,提高用户之间的沟通效率。
3.相关技术中,缺乏适用于即时通讯场景的有效意图识别方法,导致聊天用户之间的沟通效率较低。


技术实现要素:

4.本公开提供了一种信息的推送方法、装置、设备及介质。
5.根据本公开的一方面,提供了一种信息的推送方法,所述方法包括:
6.对输入的第一即时信息进行实体识别,获取目标实体;
7.获取与所述目标实体对应的目标意图信息;
8.响应于确定所述第一即时信息与所述目标意图信息相匹配,获取与所述目标意图信息匹配的信息;
9.向目标终端推送所述信息。
10.根据本公开的另一方面,提供了一种信息的推送装置,所述装置包括:
11.实体获取模块,用于对输入的第一即时信息进行实体识别,获取目标实体;
12.意图获取模块,用于获取与所述目标实体对应的目标意图信息;
13.信息获取模块,用于响应于确定所述第一即时信息与所述目标意图信息相匹配,获取与所述目标意图信息匹配的信息;
14.信息推送模块,用于向目标终端推送所述信息。
15.根据本公开的另一方面,提供了一种电子设备,包括:
16.至少一个处理器;以及
17.与所述至少一个处理器通信连接的存储器;其中,
18.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开中任一实施例所述的方法。
19.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开中任一实施例所述的方法。
20.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开中任一实施例所述的方法。
21.本公开实施例的技术方案可以有效、准确的识别出输入即时信息中的意图,进而
可以准确推送与该意图匹配的信息,提高了信息推送的效率和准确度。
22.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
23.图1是根据本公开实施例的一种信息的推送方法的示意图;
24.图2是根据本公开实施例的又一种信息的推送方法的示意图;
25.图3a是根据本公开实施例的又一种信息的推送方法的示意图;
26.图3b是根据本公开实施例的一种意图识别模型的训练方法的示意图;
27.图3c是根据本公开实施例的一种ernie模型的结构示意图;
28.图4是根据本公开实施例的一种信息的推送装置的结构示意图;
29.图5是根据本公开实施例的信息的推送方法的电子设备的框图。
具体实施方式
30.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
31.图1是根据本公开实施例的一种信息的推送方法的流程示意图,本实施例适用于在即时通讯场景中对即时信息进行意图识别,并根据意图识别结果将匹配的信息推送给终端的情形,该方法可以通过信息的推送装置来执行,该装置可以通过软件和/或硬件的方式实现,并一般可以集成在具有数据处理功能的终端或者服务器中。具体的,参考图1,该方法具体包括如下步骤:
32.步骤110、对输入的第一即时信息进行实体识别,获取目标实体。
33.在本实施例中,即时通讯(instantmessaging,im)场景可以为通过网络进行实时通信的场景,允许两人或多人通过即时传递文字消息、文件、语音与视频进行交流。在即时通讯场景中,可以在对应的聊天应用程序中分别获取各聊天用户输入的聊天信息(也即第一即时信息)。
34.本实施例中的第一即时信息需要在用户的授权下获取,且上述第一即时信息并不是针对某一特定用户获取的信息,也并不能反映出某一特定用户的个人信息。也即,上述第一即时信息的获取仅作为后续意图识别和信息推送的依据,并不作为其他用途。
35.需要强调的是,本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
36.在此步骤中,获取到第一即时信息后,可选的,可以通过预设的实体识别方式,获取该第一即时信息中包括的目标实体。
37.可选的,可以在第一即时信息中筛除预设的通用聊天词汇,保留得到第一即时信息中聊天用户可能有使用或者了解意图的信息,并将此信息作为目标实体。
38.在一个具体的实施例中,通用聊天词汇可以为即时通讯场景中经常出现的词汇,例如“好的”、“明白”,以及“谢谢”等。可选的,可以根据通用聊天词汇,在第一即时信息中将
与通用聊天词汇一致或者相近的词语进行删除,得到目标实体。假设获取的第一即时信息为“请问有人了解ctr是什么吗”、则可以将“ctr”作为待意图识别的目标实体。
39.或者,可以预先建立一个实体库,通过将第一即时信息中包括的各个分词与实体库进行匹配,可以识别得到第一即时信息中包括的目标实体。
40.相应的,在本实施例中,在获取各聊天用户输入的第一即时信息之前,可以预先建立实体库,实体库用于存储多个专业实体,涉及百科类、办公场景下的缩写类、指代类、企业产品或者项目类、企业文化类等。
41.步骤120、获取与目标实体对应的目标意图信息。
42.在此步骤中,可以预先建立实体与意图信息之间的对应关系,进而在获取第一即时信息中的目标实体之后,可以直接确定出匹配的目标意图信息。
43.其中,目标意图信息是指对目标实体的实际需求,例如,如果目标实体为某一个专有词汇,则该目标意图信息可以为对该专有词汇的释义获取需求,或者,如果目标实体为某一个聊天用户的一个同事,则该目标意图信息可以为对该同事的联系方式获取需求,也即找人需求。
44.可选的,实体和意图信息之间可能具有一一对应关系,也可能具有以对多的对应关系,这里并不进行限制。例如,如果实体为一个具体的人名,则匹配的意图信息可能是对该人名的释义需求,也可能是对该人名的联系方式获取需求。
45.步骤130、响应于确定第一即时信息与目标意图信息相匹配,获取与目标意图信息匹配的信息。
46.在本实施例的一个可选的实施方式中,得到目标意图信息后,可以检测第一即时信息中是否包括表现明显意图的动作词汇,例如,针对用户的释义需求,如果在第一即时信息中包括有“了解”、“知道”等与该释义需求关联的词汇,则可以确定第一即时信息与目标意图信息相匹配;又例如,针对用户的找人需求,如果在第一即时信息中包括有“联系”或者“查找”等与该释义需求关联的词汇,则可以确定第一即时信息与目标意图信息相匹配。
47.在本实施例的另一个可选的实施方式中,可以将第一即时信息与匹配的目标意图信息共同输入至预先训练的意图识别模型中,获取该第一即时信息是否与该目标意图信息相匹配的识别结果。
48.其中,第一即时信息与该目标意图信息相匹配,具体是指该第一即时信息命中了该目标意图信息的意图。
49.可选的,获取到的与目标意图信息匹配的信息可以为知识词条,相应的,获取与目标意图信息匹配的信息的方式,可以为在确定第一即时信息与目标意图相匹配后,在预设的知识图谱中获取与目标意图信息匹配的知识词条。
50.可以理解的是,不同的意图信息可以关联不同类型的知识,获取不同类型的知识词条。如前所述,如果目标意图信息为释义需求,则可以查询百科图谱,获取匹配的释义百科词条;如果目标意图信息为找人需求,则可以查询联系人图谱,获取匹配的联系方式词条;如果目标意图信息为应用程序的打开需求,则可以查询小程序图谱,获取匹配的小程序词条等。
51.在一个具体的实施例中,假设目标实体为“ctr”,目标意图信息为“对ctr的释义需求”,则与该目标意图信息匹配的信息可以为:ctr(click-through-rate,点击率),用于表
示用户点击并进入网站的次数占总次数(网站所有搜索出来的次数)的比例。
52.步骤140、向目标终端推送信息。
53.在本实施例中,目标终端可以是输入第一即时信息的聊天用户所使用的终端或者随身设备(例如,手环或者手表等),也可以是即时通讯场景中(一对一聊天场景或者群聊场景等)的全部聊天用户所使用的终端或者随身设备等,本实施例对此并不进行限制。
54.在此步骤中,在将信息推送给目标终端时,可选的,可以直接在聊天应用程序中,向目标终端弹出信息;或者可以生成与信息匹配的浏览浮层,向目标终端弹出浏览浮层。
55.本公开实施例的技术方案,通过对输入的第一即时信息进行意图识别,获取目标实体,获取与目标实体对应的目标意图信息,响应于确定第一即时信息与目标意图信息相匹配,获取与目标意图信息匹配的信息,向目标终端推送信息的技术手段,可以有效、准确的识别出输入即时信息中的意图,进而可以准确推送与该意图匹配的信息,提高了信息推送的效率和准确度。
56.图2是根据本公开实施例的又一种信息的推送方法的流程示意图,本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施方式结合。具体的,参考图2,该方法具体包括如下步骤:
57.步骤210、对输入的第一即时信息进行实体识别,获取目标实体。
58.步骤220、根据实体与实体类型之间的映射关系,确定目标实体对应的目标实体类型。
59.在本实施例中,实体库中包括了多个实体,以及与各实体对应的实体类型,如果实体库中包括与目标实体一致或者重叠的实体,则可以根据预先存储的各实体与实体类型之间的映射关系,确定与该实体对应的实体类型,并将实体类型作为目标实体对应的目标实体类型。
60.在一个具体的实施例中,假设实体库中存储了以下实体:“刘xx”和“周报”,其中“刘xx”对应的实体类型为“人员”,“周报”对应的实体类型为“app”。如果第一即时信息为“记得写周报”,使用实体库进行识别后得到的目标实体可以为“周报”,因为与实体“周报”对应的实体类型为“app”,所以第一实时信息“记得写周报”对应的目标实体类型也为“app”。
61.步骤230、根据目标实体和目标实体类型,确定目标意图信息,其中,目标实体类型用于描述目标意图信息的意图。
62.在本实施例中,可选的,可以将目标实体与目标实体类型进行组合,得到目标意图信息。
63.在一个具体的实施例中,假设目标意图信息为“周报,app”,其中,上述目标意图信息用于表示打开“周报”这一应用程序的意图;
64.在另一个具体的实施例中,假设目标意图信息为“刘xx,人员”,其中,上述目标意图信息用于表示获取“刘xx”的人员联系方式的意图等。
65.这样设置的好处在于,通过将目标实体以及目标实体类型组合,得到目标意图信息,可以准确地确定目标意图信息对应的意图,以提高信息推送结果的准确性。
66.步骤240、响应于确定第一即时信息与目标意图信息相匹配,获取与目标意图信息匹配的信息。
67.在本实施例中,确定第一即时信息与目标意图信息相匹配,可以包括:将目标意图信息与第一即时信息共同输入至预先训练的意图识别模型中;根据意图识别模型的输出结果,确定第一即时信息是否与目标意图信息相匹配。
68.其中,所述意图识别模型可以由多个训练样本对神经网络模型训练得到,将目标意图信息与第一即时信息输入至意图识别模型后,意图识别模型可以计算第一即时信息与目标意图信息之间的语义关联度。如果语义关联度较高,则可以确定第一即时信息与目标意图信息相匹配,也即第一即时信息命中目标意图信息的意图,在这种情况下,意图识别模型输出的结果可以为匹配标签;反之,如果语义关联度较低,则可以确定第一即时信息与目标意图信息不匹配,也即第一即时信息没有命中目标意图信息的意图,在这种情况下,意图识别模型输出的结果可以为非匹配标签。
69.在一个具体的实施例中,假设目标意图信息为“周报,app”,第一即时信息为“记得写周报”,由于第一即时信息中包含打开周报应用程序并写周报的意图,将上述目标意图信息与第一即时信息共同输入至意图识别模型后,意图识别模型输出的结果可以为1(也即匹配标签)。
70.在另一个具体的实施例中,假设目标意图信息为“周报,app”,第一即时信息为“周报上标注的问题,请及时跟进”,由于第一即时信息仅是提及了周报,并不包含打开周报应用程序的意图,将上述目标意图信息与第一即时信息共同输入至意图识别模型后,意图识别模型输出的结果可以为0(也即非匹配标签)。
71.这样设置的好处在于,通过意图识别模型可以快速确定第一即时信息与目标意图信息是否相匹配,由此可以提高信息的推送效率。
72.在本实施例中,意图识别模型使用预先获取的训练样本集对知识增强的语义表示ernie模型进行精调后得到。其中,每个训练样本中包括:意图信息、输入信息以及输入信息是否与所述意图信息相匹配的标注结果。
73.在本实施例中,训练样本集中可以包括多个训练样本,每个训练样本中可以包括预先收集的各聊天用户输入的即时信息(也即输入信息)、根据所述输入信息确定的意图信息,以及输入信息是否与意图信息相匹配的标注结果。其中,可以采用与步骤210-230相同的方式,根据输入信息确定对应的意图信息。
74.在一个具体的实施例中,假设某一训练样本中的输入信息为“这个问题找刘xx吧,他对细节更清楚”,对应的意图信息为“刘xx,人员”,由于输入信息中包含关于找“刘xx”人员信息的意图,则与上述输入信息以及意图信息对应的标注结果可以设置为1。
75.假设另一训练样本中的输入信息为“刘xx已上线,我也准备上线”,对应的意图文本为“刘xx,人员”,由于输入信息中不包含关于找“刘xx”人员信息的意图,则与上述输入信息以及意图信息对应的标注结果可以设置为0。
76.在本实施例中,可以使用上述训练样本集对预设的预训练模型进行训练,并根据训练结果对预训练模型的模型参数进行调整,得到意图识别模型。其中,预训练模型可以为ernie模型。这样设置的好处在于,由于ernie模型具备较强的语义建模能力,通过使用与即时通讯场景匹配的训练样本集,对ernie模型进行训练,可以使意图识别模型在即时通讯场景中,准确地识别聊天用户对不同类型信息的意图,进而提高不同聊天用户之间的沟通效率。
77.步骤250、向目标终端推送信息。
78.本公开实施例的技术方案,通过从输入的第一即时信息中获取目标实体,根据实体与实体类型之间的映射关系,确定目标实体对应的目标实体类型,根据目标实体和目标实体类型确定目标意图信息,响应于确定第一即时信息与目标意图信息相匹配,获取与目标意图信息匹配的信息,并目标终端推送信息的术手段,可以有效、准确的识别出输入即时信息中的意图,进而可以准确推送与该意图匹配的信息,提高了信息推送的效率和准确度。
79.图3a是根据本公开实施例的又一种信息的推送方法的流程示意图,本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施方式结合。具体的,参考图3a,该方法具体包括如下步骤:
80.步骤310、对输入的第二即时信息进行以下至少一项处理,得到所述第一即时信息:删除无效的即时信息,删除即时信息中的内容无关字符。
81.在本实施例中,可以在即时通讯场景对应的应用程序中获取全部聊天用户输入的全部信息(也即第二即时信息)。
82.由于第二即时信息中一般会包含与聊天用户意图识别无关的信息,为了提升意图识别模型的在线预测性能,需要在第二即时信息中删除一些无效的即时信息,以及即时信息中与意图识别无关的字符(例如通用聊天词汇以及标点符号等),并将剩余的信息作为第一即时信息。
83.可选的,假设即时通讯场景为企业通讯场景,则无效的即时信息可以为与工作业务无关的信息,例如娱乐活动分享的链接等;假设通讯场景为购物通讯场景,则无效的即时信息可以为与购物无关的信息,例如投票链接等。
84.这样设置的好处在于,通过在全部即时信息中去除无效的即时信息以及字符,可以减少意图识别模型的工作量,提高意图识别模型的工作效率。
85.在本实施例的一个实施方式中,所述无效的即时信息包括:目标语言字符的占比小于或等于预设门限值的即时信息。
86.在一个具体的实施例中,聊天用户在使用应用程序进行通讯时,对于即时信息中的大篇幅数据或者代码形式的信息,通常不需要进行意图识别。在这种情况下,可以统计即时信息中中文字符与全部字符的占比,判断占比是否小于或等于预设门限值,若是,则可以将该即时信息作为无效的即时信息。
87.这样设置的好处在于,可以在即时通讯场景中,有效去除与聊天用户意图无关的信息,由此提高意图识别模型的在线预测性能,提高即时通讯场景下用户之间的沟通效率。
88.在本实施例中,所述删除即时信息中的内容无关字符,包括以下至少一项:按照预设的正则匹配规则,删除即时信息中包括的统一资源定位(uniform resource locator,url)符、存储路径以及存储目录中的至少一项;在检测到所述即时信息中包括机器名时,将所述机器名使用预设的截短字符串替代。
89.在本实施例中,可选的,可以利用预设的正则表达式与即时信息中的url字符、存储路径以及存储目录进行匹配,并将匹配到的内容进行删除。此外,还可以使用预设的机器名与即时信息中的词语进行比较,如果即时信息中包括与预设机器名一样的词语,则将该词语用预设的截短字符串替代。
90.这样设置的好处在于,可以减少即时信息的长度,节省意图识别模型对内容无关
字符的处理时间,提高意图识别模型的工作效率。
91.步骤320、对输入的第一即时信息进行实体识别,获取目标实体。
92.步骤330、根据实体与实体类型之间的映射关系,确定所述目标实体对应的目标实体类型。
93.步骤340、根据所述目标实体和所述目标实体类型,确定所述目标意图信息,其中,所述目标实体类型用于描述所述目标意图信息的意图。
94.步骤350、将目标意图信息与第一即时信息共同输入至预先训练的意图识别模型中,根据意图识别模型的输出结果,确定第一即时信息与目标意图信息相匹配时,获取与所述目标意图信息匹配的信息。
95.步骤360、向目标终端推送所述信息。
96.本公开实施例的技术方案,通过对第二即时信息中无效的即时信息,以及即时信息中的内容无关字符进行删除,从输入的第一即时信息中获取目标实体,根据实体与实体类型之间的映射关系,确定目标实体对应的目标实体类型,根据目标实体和目标实体类型,确定目标意图信息,将目标意图信息与第一即时信息共同输入至预先训练的意图识别模型中,根据意图识别模型的输出结果,确定第一即时信息与目标意图信息相匹配时,获取与目标意图信息匹配的信息,并向目标终端推送信息的技术手段,可以有效、准确的识别出输入即时信息中的意图,进而可以准确推送与该意图匹配的信息,提高了信息推送的效率和准确度。
97.在上述实施例的基础上,对于涉及敏感信息的通讯场景(例如企业通讯场景),相关技术中通常只能获取有限的输入信息,由于训练样本数量较少,容易导致意图识别模型学习不充分。为了解决上述问题,本实施例提供了一种意图识别模型的训练方法,可以参考图3b,所述训练方法包括:
98.步骤301、采用数据增强算法,对第一数据规模的标准样本集进行样本扩充,形成第二数据规模的所述训练样本集。
99.在本实施例中,可选的,可以采用与步骤310相同的方式获取聊天用户的输入信息,然后采用与步骤320-340相同的方式确定输入信息对应的意图信息,然后将输入信息、意图信息以及输入信息是否与意图信息相匹配的标注结果作为一个标准样本,通过对多个输入信息进行处理得到标准样本集。
100.在此步骤中,可选的,可以对每个标准样本中的输入信息进行微调(例如替换或删除随机字符),得到多个新的样本,将多个新的样本添加至标准样本集中,得到了所述训练样本集。
101.这样设置的好处在于,可以扩大训练样本集的规模,避免训练样本数量有限,导致意图识别模型学习不充分的问题,由此可以提高意图识别模型的训练效果,保证输出结果的准确性。
102.在本实施例的一个实施方式中,采用数据增强算法,对标准样本集进行样本扩充,包括下述至少一项:对标准样本中的字符进行随机遮掩处理,形成新的样本;从标准样本中随机去除至少一个字符,形成新的样本;对标准样本中的至少一个分词进行词向量近义词替换,形成新的样本;以及将包含遮掩标识的标准样本输入至所述ernie模型中,获取所述ernie模型对所述遮掩标识的预测字符后,使用所述预测字符替换标准样本中的遮掩标识,
形成新的样本。
103.在一个具体的实施例中,可以在标准样本中随机选取字符,然后对该字符进行删除,或者使用预设掩码对该字符进行替换,得到新的样本。
104.在另一个具体的实施例中,还可以利用预设的分词技术对标准样本进行切分,得到标准样本对应的至少一个原始分词,然后计算原始分词的词向量,并根据词向量在预设的分词库中获取与原始分词距离最近的目标分词(也即与原始分词对应的近义词),最后使用目标分词对原始分词进行替换,得到新的样本。其中,分词库中预先存储了多个分词,以及各分词分别对应的词向量。
105.在另一个具体的实施例中,由于ernie模型具备较强的语义建模能力,将包含遮掩标识的标准样本输入至ernie模型后,ernie模型会根据标准样本的语义对遮掩标识进行预测,得到遮掩标识对应的预测字符。可选的,可以使用预测字符对标准样本中的遮掩标识进行替换,得到新的样本。
106.需要说明的是,上述各对标准样本集进行数据增强,是指针对标准样本中的输入信息进行转换后,结合与原来输入信息的意图信息以及标注结果,共同生成新的样本。
107.这样设置的好处在于,通过使用上述至少一项方式对标准样本进行处理,可以保证在不影响标准样本语义的情况下,对标准样本集进行扩充,通过使用大规模的训练样本集对ernie模型进行训练,可以提高意图识别模型的训练效果,保证输出结果的准确性。
108.步骤302、通过所述ernie模型对当前输入的目标训练样本进行特征编码,得到与所述目标训练样本对应的目标样本特征集。
109.在本实施例中,可以将训练样本集中的目标训练样本,输入至ernie模型中。其中,ernie模型包括:编码模块以及分类模块,所述分类模块中包括:全连接层以及逻辑回归层。
110.在此步骤中,可选的,可以通过编码模块最后一层(也即末位特征提取层),对当前输入的目标训练样本进行特征编码,得到目标训练样本对应的目标样本特征集,所述目标样本特征集中包括了多个目标样本特征。
111.在一个具体的实施例中,图3c为一种ernie模型的结构示意图,如图3c所示,目标训练样本可以包括目标意图信息(包括字段tok1、tok2
……
tokn)、目标输入信息(包括字段sok1、sok2
……
sokn)以及目标输入信息是否与目标意图信息相匹配的标注结果。将目标训练样本输入ernie模型中后,ernie模型中的编码模块会计算目标训练样本中目标意图信息和目标输入信息分别对应的特征。以图3c为例,目标意图信息对应的特征包括t_1、t_2
……
t_n,目标输入信息对应的特征包括s_1、s_2
……
s_n。其中,目标意图信息和目标输入信息中每个字段对应一个特征。
112.在此步骤中,可选的,可以将目标意图信息和目标输入信息分别对应的特征,共同作为与目标训练样本对应的目标样本特征。
113.在本实施例的一个实施方式中,通过ernie模型对当前输入的目标训练样本进行特征编码,得到与所述目标训练样本对应的目标样本特征集,包括:通过ernie模型对目标训练样本中的目标输入信息进行特征编码,得到与所述目标训练样本对应的目标样本特征集。
114.在一个具体的实施例中,以图3c为例,在特征计算完成之后,编码模块的末位特征提取层会获取目标输入信息对应的特征(也即s_1、s_2
……
s_n)作为目标训练样本对应的
目标样本特征。
115.在本实施例中,由于意图信息的内容通常都是固定的,其特征相对单一,在对ernie模型的训练过程中,真正对输出结果准确率有硬影响的是输入信息的特征。因此,为了提高ernie模型的训练效率,可以去掉意图信息的特征,仅获取输入信息的特征作为样本特征。这样设置的好处在于,可以减少ernie模型的计算量,提高ernie模型的训练效率。
116.在一个具体的实施例中,可以对意图信息扩展到固定长度(比如16位),以便于ernie模型对输入信息的特征进行提取。
117.步骤303、通过所述ernie模型,针对所述目标样本特征集中包括的各目标样本特征进行两次随机遗漏处理,得到第一特征集以及第二特征集。
118.在本实施例中,可以将各目标样本特征输入至ernie模型中的分类模块,分类模块中的全连接层可以对各目标样本特征进行第一次随机遗漏处理(dropout),即对全部目标样本特征中的一部分特征进行忽略(使一部分特征的特征值为0),将剩余的另一部分特征作为第一特征集。
119.然后将各目标样本特征再次输入至ernie模型中的分类模块,分类模块中的全连接层可以对各目标样本特征进行第二次随机遗漏处理(dropout),即对全部目标样本特征中的一部分特征进行忽略,将剩余的另一部分特征作为第二特征集。
120.步骤304、通过所述ernie模型,采用预设的分类算法对所述第一特征集以及第二特征集进行处理,得到第一分布函数和第二分布函数。
121.在此步骤中,可以将第一特征集输入至逻辑回归层,通过逻辑回归层采用预设的分类算法,对第一特征集对应的分布函数进行计算,得到第一分布函数。
122.然后将第二特征集再次输入至逻辑回归层,通过逻辑回归层采用预设的分类算法,对第二特征集对应的分布函数进行计算,得到第二分布函数。
123.步骤305、通过所述ernie模型,根据所述第一分布函数和所述第二分布函数,计算与所述目标训练样本对应的相对熵。
124.在此步骤中,可选的,可以计算第一分布函数和第二分布函数之间的距离,将距离作为目标训练样本对应的相对熵。
125.步骤306、根据所述相对熵,对模型参数进行调整。
126.在本实施例中,如果相对熵的值较大,则可以认为ernie模型的训练结果较差,并对ernie模型的参数进行调整,以减小相对熵的值。
127.这样设置的好处在于,通过对目标样本特征进行随机遗漏处理,可以减小特征之间的相互作用,降低模型训练结果对一些局部特征的依赖性,由此可以提高意图识别模型的泛化能力;其次,通过将目标样本特征连续两次输入至分类模块中,并根据目标训练样本对应的相对熵对ernie模型进行参数调整,可以提高意图识别模型的训练效果,保证意图识别模型的输出结果的准确性。
128.本公开实施例还提供了一种信息的推送装置,用于执行上述的信息的推送方法。
129.图4为本公开实施例提供的一种信息的推送装置400的结构图,该装置包括:实体获取模块410、意图获取模块420、信息获取模块430和信息推送模块440。
130.其中,实体获取模块410,用于对输入的第一即时信息进行实体识别,获取目标实体;
131.意图获取模块420,用于获取与所述目标实体对应的目标意图信息;
132.信息获取模块430,用于响应于确定所述第一即时信息与所述目标意图信息相匹配,获取与所述目标意图信息匹配的信息;
133.信息推送模块440,用于向目标终端推送所述信息。
134.本公开实施例的技术方案,通过对输入的第一即时信息进行实体识别,获取目标实体,获取与目标实体对应的目标意图信息,响应于确定第一即时信息与目标意图信息相匹配,获取与目标意图信息匹配的信息,向目标终端推送信息的技术手段,可以有效、准确的识别出输入即时信息中的意图,进而可以准确推送与该意图匹配的信息,提高了信息推送的效率和准确度。
135.在上述各实施例的基础上,所述意图获取模块420包括:
136.实体类型确定单元,用于根据实体与实体类型之间的映射关系,确定所述目标实体对应的目标实体类型;
137.意图信息确定单元,用于根据所述目标实体和所述目标实体类型,确定所述目标意图信息,其中,所述目标实体类型用于描述所述目标意图信息的意图。
138.所述信息获取模块430包括:
139.信息输入单元,用于将所述目标意图信息与所述第一即时信息共同输入至预先训练的意图识别模型中;
140.匹配结果确定单元,用于根据意图识别模型的输出结果,确定所述第一即时信息是否与所述目标意图信息相匹配;
141.其中,所述意图识别模型使用预先获取的训练样本集对知识增强的语义表示ernie模型进行精调后得到;
142.每个所述训练样本中包括:意图信息、输入信息以及所述输入信息是否与所述意图信息相匹配的标注结果。
143.所述装置还包括:训练样本集获取单元,用于采用数据增强算法,对第一数据规模的标准样本集进行样本扩充,形成第二数据规模的所述训练样本集;
144.所述训练样本集获取单元包括:
145.遮掩处理子单元,用于对标准样本中的字符进行随机遮掩处理,形成新的样本;字符去除子单元,用于从标准样本中随机去除至少一个字符,形成新的样本;分词替换子单元,用于对标准样本中的至少一个分词进行词向量近义词替换,形成新的样本;标准样本输入子单元,用于将包含遮掩标识的标准样本输入至所述ernie模型中,获取所述ernie模型对所述遮掩标识的预测字符后,使用所述预测字符替换标准样本中的遮掩标识,形成新的样本。
146.所述信息输入单元包括:
147.特征编码子单元,用于通过所述ernie模型对当前输入的目标训练样本进行特征编码,得到与所述目标训练样本对应的目标样本特征集;遗漏处理子单元,用于通过所述ernie模型,针对所述目标样本特征集中包括的各目标样本特征进行两次随机遗漏处理,得到第一特征集以及第二特征集;分布函数确定子单元,用于通过所述ernie模型,采用预设的分类算法对所述第一特征集以及第二特征集进行处理,得到第一分布函数和第二分布函数;相对熵计算子单元,用于通过所述ernie模型,根据所述第一分布函数和所述第二分布
函数,计算与所述目标训练样本对应的相对熵;模型参数调整子单元,用于根据所述相对熵,对模型参数进行调整;
148.所述特征编码子单元包括:
149.输入信息编码子单元,用于通过所述ernie模型对所述目标训练样本中的目标输入信息进行特征编码,得到与所述目标训练样本对应的目标样本特征集。
150.所述信息的推送装置还包括:信息处理模块,用于对输入的第二即时信息进行以下至少一项处理,得到所述第一即时信息:删除无效的即时信息;删除即时信息中的内容无关字符;
151.所述无效的即时信息包括:目标语言字符的占比小于或等于预设门限值的即时信息。
152.所述信息处理模块包括:信息删除子单元,用于按照预设的正则匹配规则,删除即时信息中包括的统一资源定位符、存储路径以及存储目录中的至少一项;字符串替代子单元,用于在检测到所述即时信息中包括机器名时,将所述机器名使用预设的截短字符串替代。
153.本公开实施例所提供的信息的推送装置可执行本公开任意实施例所提供的信息的推送方法,具备执行方法相应的功能模块和有益效果。
154.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
155.图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
156.如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(rom)502中的计算机程序或者从存储单元505加载到随机访问存储器(ram)503中的计算机程序,来执行各种适当的动作和处理。在ram 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、rom 502以及ram 503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
157.设备500中的多个部件连接至i/o接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元505,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
158.计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算ai芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如信息的推送方法。例如,在一些实施例中,信息的推送方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元505。在一些实施例中,计算机程序的
部分或者全部可以经由rom 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到ram 503并由计算单元501执行时,可以执行上文描述的信息的推送方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行信息的推送方法。
159.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、ai芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
160.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
161.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
162.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
163.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
164.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通
过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
165.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开提供的技术方案所期望的结果,本文在此不进行限制。
166.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献