一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

即时消息传输控制方法、装置、计算机设备及存储介质与流程

2021-12-14 22:38:00 来源:中国专利 TAG:


1.本发明实施例涉及网络直播领域,尤其是一种即时消息传输控制方法、装置、计算机设备及存储介质。


背景技术:

2.电商直播是近几年新兴的一种购物方式,商家采用视频直播的形式,通过主播对商品的广告宣传等方式向用户推荐和销售商品,用户则通过在评论区进行评论、点击链接浏览网站等方式与主播进行交流、购物。
3.观看直播的观众鱼龙混杂,存在部分观众在直播间发表不良言论,如涉黄、涉暴、脏话等,严重影响其他人的直播观看体验和主播销售效果。同时,也存在部分观众存心捣乱,在直播间里帮助竞争对手进行其商品宣传,甚至故意抹黑主播及其商品,给观众和主播商家带来不好的影响和损失。
4.现有的直播平台一般没有提供不良发言的过滤服务,只能依靠主播提醒用户文明用语或选择性忽略,即便提供过滤服务的直播平台一般也通过识别涉及不良发言的关键字,将包含关键字的发言进行“一刀切”的过滤处理,或者需商家进行手动选择需过滤处理的发言,无法基于语义进行判断是否应当保留,直播平台并无法对来自竞争对手等的恶意抹黑、攻击言语进行自动过滤。
5.针对现有技术的直播间不良发言过滤方案中所存在的问题,本技术人出于该些问题做出相应的探索。


技术实现要素:

6.本技术的目的在于提供一种即时消息传输控制方法、装置、计算机设备及存储介质。
7.为实现本技术的目的,采用如下技术方案:
8.适应本技术的目的而提出的一种即时消息传输控制方法,包括如下步骤:
9.接收直播间中客户端提交的即时消息,以解析该即时消息获取其包含的文本内容;
10.调用语义识别模型确定所述文本内容在多个安全类别下的语义评分,所述语义识别模型根据所述文本内容的句子语义特征向量确定其在多个安全类别下的语义评分;
11.根据直播间中预设的表达关键词列表与所述文本内容进行匹配,判断该列表中包含的表达关键词与所述文本内容的匹配个数,进而确定该文本内容的词组评分;
12.根据直播间中预设的品牌关键词列表,判断所述文本内容中是否存在该列表中包含的品牌关键词,以确定该文本内容的品牌判断结果;
13.将语义评分、词组评分以及品牌判断结果进行融合判断,判定所述即时消息是否符合预设条件,将符合预设条件的即时消息推送至直播间中进行展示。
14.进一步的实施例中,调用语义识别模型确定所述文本内容在多个安全类别下的语
义评分,所述语义识别模型根据所述文本内容的句子语义特征向量确定其在多个安全类别下的语义评分的步骤,包括:
15.语义识别模型对所述文本内容进行预处理,删除该文本内容中包含的特殊字符及品牌关键词;
16.语义识别模型将完成预处理的文本内容转换为表征为词组向量的词组序列;
17.语义识别模型基于所述词组序列的上下文语义特征,获得文本内容的语义特征向量;
18.语义识别模型将所述语义特征向量与一个或多个关键词向量进行匹配,获取该语义特征向量通过匹配后所得的句子语义特征向量;
19.语义识别模型采用神经网络算法,基于所述句子语义特征向量所表征的语义特征,对该向量进行安全类别分类,以确定所述文本内容在各个安全类别下的语义评分。
20.进一步的实施例中,根据直播间中预设的表达关键词列表与所述文本内容进行匹配,判断该列表中包含的表达关键词与所述文本内容的匹配个数,进而确定该文本内容的词组评分的步骤,包括:
21.将所述文本内容与所述表达关键词列表中储存的所有表达关键词进行匹配,确定该文本内容所匹配的所述表达关键词;
22.根据所述文本内容所匹配的表达关键词的数量,确定该文本内容的所述词组评分。
23.进一步的实施例中,根据直播间中预设的品牌关键词列表,判断所述文本内容中是否存在该列表中包含的品牌关键词,以确定该文本内容的品牌判断结果的步骤,包括:
24.将所述文本内容与所述品牌关键词列表中储存的所有品牌关键词进行匹配,获取该文本内容的匹配结果,所述匹配结果表征文本内容中是否存在任意所述品牌关键词;
25.对所述文本内容进行分词处理,提取将该文本内容中各词组的语义特征,以计算各词组的语义特征各自与所有所述品牌关键词的语义特征的相似度,根据该些相似度,确定该文本内容的相似度结果,所述相似度结果表征文本内容中是否存在任意所述品牌关键词;
26.根据所述匹配结果及相似度结果,当任意结果表征所述文本内存中存在任意所述品牌关键词,该文本内容的所述品牌判断结果表征为存在品牌关键词。
27.进一步的实施例中,将语义评分、词组评分以及品牌判断结果进行融合判断,判定所述即时消息是否符合预设条件,将符合预设条件的即时消息推送至直播间中进行展示步骤中,所述融合判断的实施方式包括下列任一:
28.判断任意安全类别下的所述文本内容的各所述语义评分是否超过预设阈值,且判断所述词组评分表征该文本内容是否存在与该安全类别相对应表达关键词,若上述判断条件均通过,则将该文本内容相对应的即时消息推送至直播间中进行展示;
29.将所述文本内容的各所述语义评分、词组评分及品牌判断结果转换为各自对应的向量,采用预设的加权融合算法,判断计算所得融合结果是否超过预设阈值,若未超过,则将该文本内容相对应的即时消息推送至直播间中进行展示。
30.较佳的实施例中,本方法还包括如下平行步骤:
31.接收直播间管理端推送的关键词更新信息;
32.解析所述关键词更新信息,确定该关键词更新信息包含的一个或多个关键词及其相对应的类别标签;
33.根据该些关键词各自对应的所述类别标签,将该些关键词分类储存至该直播间的所述表达关键词列表及匹配关键词列表中。
34.较佳的实施例中,本方法还包括如下后置步骤:
35.根据不通过所述融合判断的文本内容相对应的即时消息,获取该即时消息所属的用户的身份特征信息,所述身份特征信息用于表征用户的个人信息;
36.将所述文本内容与身份特征信息对应储存至违规发言列表中,所述违规发言列表用于储存其所对应的直播间中存在违规发言的用户及其即时消息中包含的文本内容;
37.响应主播端推送的作用于所述违规发言列表的禁言指令,确定该指令所指向的身份特征信息,以禁止该身份特征信息所对应的用户在当前直播间中的推送即时消息;
38.响应主播端推送的作用于所述违规发言列表的放行指令,确定该指令所指向的即时消息,将该即时消息推送至直播间中进行展示。
39.适应本技术的目的而提出的一种核心产品词识别装置,其包括:
40.即时消息解析模块,用于接收直播间中客户端提交的即时消息,以解析该即时消息获取其包含的文本内容;
41.语义评分确定模块,用于调用语义识别模型确定所述文本内容在多个安全类别下的语义评分,所述语义识别模型根据所述文本内容的句子语义特征向量确定其在多个安全类别下的语义评分;
42.词组评分确定模块,用于根据直播间中预设的表达关键词列表与所述文本内容进行匹配,判断该列表中包含的表达关键词与所述文本内容的匹配个数,进而确定该文本内容的词组评分;
43.品牌判断结果确定模块,用于根据直播间中预设的品牌关键词列表,判断所述文本内容中是否存在该列表中包含的品牌关键词,以确定该文本内容的品牌判断结果;
44.融合判断模块,用于将语义评分、词组评分以及品牌判断结果进行融合判断,判定所述即时消息是否符合预设条件,将符合预设条件的即时消息推送至直播间中进行展示。
45.进一步的实施例中,所述语义评分确定模块包括:
46.预处理子模块,用于语义识别模型对所述文本内容进行预处理,删除该文本内容中包含的特殊字符及品牌关键词;
47.词组序列转换子模块,用于语义识别模型将完成预处理的文本内容转换为表征为词组向量的词组序列;
48.语义特征向量获取子模块,用于语义识别模型基于所述词组序列的上下文语义特征,获得文本内容的语义特征向量;
49.句子语义特效向量子模块,用于语义识别模型将所述语义特征向量与一个或多个关键词向量进行匹配,获取该语义特征向量通过匹配后所得的句子语义特征向量;
50.语义评分确定子模块,用于语义识别模型采用神经网络算法,基于所述句子语义特征向量所表征的语义特征,对该向量进行安全类别分类,以确定所述文本内容在各个安全类别下的语义评分。
51.进一步的实施例中,所述词组评分确定模块包括:
52.表达关键词匹配子模块,用于将所述文本内容与所述表达关键词列表中储存的所有表达关键词进行匹配,确定该文本内容所匹配的所述表达关键词;
53.词组评分确定子模块,用于根据所述文本内容所匹配的表达关键词的数量,确定该文本内容的所述词组评分。
54.进一步的实施例中,所述品牌判断结果确定模块包括:
55.匹配结果获取子模块,用于将所述文本内容与所述品牌关键词列表中储存的所有品牌关键词进行匹配,获取该文本内容的匹配结果,所述匹配结果表征文本内容中是否存在任意所述品牌关键词;
56.相似度结果确定子模块,用于对所述文本内容进行分词处理,提取将该文本内容中各词组的语义特征,以计算各词组的语义特征各自与所有所述品牌关键词的语义特征的相似度,根据该些相似度,确定该文本内容的相似度结果,所述相似度结果表征文本内容中是否存在任意所述品牌关键词;
57.品牌判断结果确定子模块,用于根据所述匹配结果及相似度结果,当任意结果表征所述文本内存中存在任意所述品牌关键词,该文本内容的所述品牌判断结果表征为存在品牌关键词。
58.进一步的实施例中,所述融合判断模块包括:
59.阈值判断子模块,用于判断任意安全类别下的所述文本内容的各所述语义评分是否超过预设阈值,且判断所述词组评分表征该文本内容是否存在与该安全类别相对应表达关键词,若上述判断条件均通过,则将该文本内容相对应的即时消息推送至直播间中进行展示;
60.融合结果判断子模块,用于将所述文本内容的各所述语义评分、词组评分及品牌判断结果转换为各自对应的向量,采用预设的加权融合算法,判断计算所得融合结果是否超过预设阈值,若未超过,则将该文本内容相对应的即时消息推送至直播间中进行展示。
61.为解决上述技术问题本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述即时消息传输控制方法的步骤。
62.为解决上述技术问题本发明实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述即时消息传输控制方法的步骤。
63.为解决上述技术问题本发明实施例还提供一种一种计算机程序产品,包括计算机程序及计算机指令,该计算机程序及计算机指令被处理器执行时,使得所述处理器执行上述所述即时消息传输控制方法的步骤。
64.本发明实施例的有益效果是:
65.本技术融合语义特征提取及关键词匹配构造直播间违规发言过滤服务,通过语义识别模型、表达关键词匹配及品牌关键词匹配,确定观众用户推送的即时消息的语义评分、词组评分及品牌判断结果,并根据所述语义评分、词组评分及品牌判断结果进行融合判断,判断即时消息是否可输出至直播间中进行展示,以构造从多个维度校验文本内容的违规内容的算法构架,对文本内容进行语义提取及关键词匹配,相比单一的检测方法,往往会侧重于关注某一维度的信息,无法准确地确定出文本内容中准确的语义,通过融合多种检测方
法,能够在提高过滤服务对各种文本信息的关注点覆盖能力的同时,也提升了整体方案的检测违规词的准确性。
66.其次,本技术在直播电商的应用场景中,基于语义特征及品牌关键词对观众推送的文本内容进行融合分析,可选择性地输出相对应的文本内容至直播间中进行展示,例如,若文本内容的语义特征为褒义内容且其包含的品牌关键词为当前直播间中进行销售的商品时,该文本内容将进行输出展示,可有效地刺激销售商品的销量,若仅语义提取确定文本内容为贬义且包含销售商品的品牌时,该文本内容将禁止输出展示,有效防止竞争对手故意抹黑销售商品,以维护直播间的销售环境。
附图说明
67.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
68.图1为实施本技术的技术方案相关的一种典型的网络部署架构示意图;
69.图2为本技术的即时消息传输控制方法的典型实施例的流程示意图;
70.图3为图2中步骤s12的具体步骤所形成的流程示意图;
71.图4为图2中步骤s13的具体步骤所形成的流程示意图;
72.图5为图2中步骤s14的具体步骤所形成的流程示意图;
73.图6为图2中步骤s15的具体步骤所形成的流程示意图;
74.图7为本技术的即时消息传输控制方法的一种实施例中由其所添加的平行步骤所构成的流程示意图;
75.图8为本技术的即时消息传输控制方法的另一种实施例中由其所添加的后置步骤所构成的流程示意图;
76.图9为本技术的核心产品词识别装置的典型实施例的原理框图;
77.图10为本技术一个实施例的计算机设备的基本结构框图。
具体实施方式
78.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
79.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
80.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的
意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
81.本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;pcs(personal communications service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;pda(personal digital assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或gps(global positioning system,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是pda、mid(mobile internet device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
82.本技术所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
83.需要指出的是,本技术所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本技术的网络部署方式的实施方式。
84.请参阅图1,本技术相关技术方案实施时所需的硬件基础可按图中所示的架构进行部署。本技术所称服务器80部署在云端,作为一个业务服务器,其可以负责进一步连接起相关数据服务器以及其他提供相关支持的服务器等,以此构成逻辑上相关联的服务机群,来为相关的终端设备例如图中所示的智能手机81和个人计算机82或者第三方服务器(未图示)提供服务。所述的智能手机和个人计算机均可通过公知的网络接入方式接入互联网,与云端的服务器80建立数据通信链路,以便运行所述服务器所提供的服务相关的终端应用程序。
85.对于服务器而言,所述的应用程序通常会被构建为服务进程,开放相应的程序接口,供各种终端设备上运行的应用程序进行远程调用,本技术中适于运行于服务器的相关技术方案,便可以此种方式实现于服务器中。
86.所述的应用程序,是指运行于服务器或终端设备上的应用程序,这一应用程序采用编程的方式实现了本技术的相关技术方案,其程序代码可被以计算机可执行指令的形式
保存于计算机能识别的非易失性存储介质中,并被中央处理器调入内存中运行,通过该应用程序在计算机的运行而构造出本技术的相关装置。
87.对于服务器而言,所述的应用程序通常会被构建为服务进程,开放相应的程序接口,供各种终端设备上运行的应用程序进行远程调用,本技术中适于运行于服务器的相关技术方案,便可以此种方式实现于服务器中。
88.对时下流行的各类终端设备而言,特别是平板、手机之类的移动设备,通常都内置配备有摄像头之类的摄像设备,或者个人计算机也可外置接入所述的摄像设备,理论上,本技术的终端设备的应用程序对于这些情况下的摄像设备均可实现调用。
89.本技术中适于在终端设备实现的技术方案也可以被编程内置于提供电商交易的应用程序中,作为其一部分扩展功能。所述的电商交易,是指一种基于前述的网络部署结构所显示的线上交易服务。
90.本领域技术人员对此应当知晓:本技术的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本技术所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
91.请参阅图2,本技术的一种即时消息传输控制方法,在其典型实施例中,其包括如下步骤:
92.步骤s11,接收直播间中客户端提交的即时消息,以解析该即时消息获取其包含的文本内容:
93.服务器获取直播间中所述客户端提交的所述即时消息,以解析该即时消息,获取该即时消息中不好的所述文本内容。
94.所述的即时消息一般由所述直播间的客户端推送的,用户通过直播间图形用户界面中的发言内容输入控件输入文本内容并提交后,该用户的客户端将所述发言内容输入控件中的发言内容与该用户的身份特征信息封装为所述即时消息,并将该即时消息推送至服务器中,以便服务器从所述发言消息解析获取所述文本内容进行违规校验处理,确定所述即时消息是否可输出至直播间的公屏流水中进行展示。
95.一种实施例中,所述的即时消息一般包含身份特征信息,该身份特征信息用于被服务器确定推送所述即使消息的客户端的用户,用于确定该用户在当前直播间中是否为黑名单用户,具体的,服务器获取所述即时消息后,将解析该即使消息,获取其包含的所述身份特征信息,并在当前直播间中所对应的黑名单列表中查询是否存在该身份特征信息所指向的用户,若存在,则停止该即时消息的后续校验,即馈入语音识别模型及相关的校验,以直接停止将该即时消息推送至直播间中进行展示,所述黑名单列表中的用户由直播间的主播用户或服务器将未通过后续校验的用户添加。
96.进一步的实施例中,所述即时消息包含的身份通知信息中一般包含对应用户的用户昵称及用户头像,以便通过所述用户昵称查询所述黑名单列表中是否存在该用户,且后续将所述即时消息推送至直播间中进行展示时,可将用户昵称或用户头像及文本内容输出至直播间中进行展示。
97.服务器获取所述即时消息中包含的所述文本内容后,将并行对该文本内容进行语义评分、词组评分及品牌判断结果的校验处理,各校验处理同时执行,以便后续服务器根据
该文本内容的所述语义评分、词组评分及品牌判断结果进行融合判断,判定所述即时消息是否符合预设条件,将符合预设条件的即时消息推送至直播间中进行展示,以通过多重校验的方式精确地判断所述即时消息是否适合展示至直播间中,相比单一校验文本内容的方式,本技术通过深度语义理解模型及关键字识别的融合方法实现评论文本违规用语的自动审核,有效地提升了校验的准确性,使输出至直播间中的即时消息符合平台及主播制定的规则;后续步骤s12

s14将同时执行,以步骤进行叙述仅为了叙述方便。
98.步骤s12,调用语义识别模型确定所述文本内容在多个安全类别下的语义评分,所述语义识别模型根据所述文本内容的句子语义特征向量确定其在多个安全类别下的语义评分:
99.服务器调用所述语义识别模型,将所述文本内容输出至该语义识别模型中,以便该语义识别模型根据该文本内容的所述句子语义特征向量,确定该文本内容在多个所述安全类别下的所述语义评分。
100.所述文本内容的语义特征向量由所述语义识别模型将该文本内容进行预处理及词组序列转换后,并基于词组序列的词组向量进行上下文语义特征获取表征所述文本内容的语义特征向量,以将所述语义特征向量与一个或多个关键词向量进行匹配,获取该语义特征向量通过匹配后所得的句子语义特征向量。
101.所述句子语义特征向量用于突出表征文本内容中包含的各词组的语义,且结合该些词组之间的组合,突出表征该文本内容中各词组组成的句子整体的语义特征,以便所述语义识别模型采用神经网络算法,基于所述句子语义特征向量所表征的语义特征,对该向量进行安全类别分类,以确定所述文本内容在各个安全类别下的语义评分。
102.所述语义识别模型为训练至收敛的模型,通过向该语义识别模型馈入大量的文本内容,以触发该语义识别模型通过该些文本内容进行预处理训练、词组训练转换训练、语义特征向量训练及句子语义特征训练,直至将该语义识别模型训练为收敛状态为止,以将训练至收敛状态的语义识别模型投放至直播平台中进行服务;所述语义识别模型一般采用监督训练,模型对训练结果与预设的答案结果进行对比,确定训练结果是否与所述答案结果相似,若否,则通过调节相对应的参数(如关键词向量等),使模型的训练结果与预设的答案结果无限接近,直至将语义识别模型训练至收敛状态以进行投放使用。
103.所述的安全类别是指用于表征所述文本内容的语义特征的类别,该安全类别的类型分为:赌博、诋毁、仿造、侵权或恐暴等违反网络安全或扰乱市场秩序的类型;所述语义识别模型通过文本内容的所述句子语义特征向量,确定文本内容在该些安全类别下的所述语义评分。
104.服务器将所述文本内容输入至所述语义识别模型后,语义识别模型将对该文本内容进行预处理,以移除该文本内容中包含的特殊字符及品牌关键词,以便后续进行语义提取时,防止所述特征字符及品牌关键词的干扰而造成提取的语义不精确,所述的特征字符一般是指空格及标点符号等无法用于表征文本内容的语义的字符,所述的品牌关键词一般是指如今市场中所存在的品牌的名称,例如“小米”、“苹果”、“华为”及该些品牌的外文名称等。
105.语义识别模型对所述文本内容完成预处理后,将该文本内容进行分词、编码处理,以将该文本内容转化为词典中的所述词组序列,所述语义识别模型通过查找预训练词向量
表,获取所述文本内容中所存在的词组的词组向量,以将该些词组向量组成该文本内容的所述词组序列。所述预训练词向量表储存的词组向量一般是指通过bert词向量、word2vec、glove、fasttext、elmo等获得的词组向量,也可以是其他形式的词组向量,且所述预训练词向量表也可为多种不同词组向量的特征组合。
106.语义识别模型将所述文本内容转换为所述词组序列后,将对所述词组序列进行上下文特征提取,提取上下文特征的方法包括但不限于bert、rnn、cnn等特征提取器,语义识别模型将输入的所述词组序列进行上下文建模,并映射到高维语义空间,从而获得该词组序列所对应的文本内容在高维语义空间中的语义特征向量。
107.语义识别模型获取所述语义特征向量后,将该语义特征向量与一个或多个关键词向量进行匹配,以获取该语义特征向量通过匹配后所得的句子语义特征向量,具体的,所述语义特征模型将对所述语义特征向量与一个或多个关键词向量采用注意力机制等方式,加强对所述语义特征向量中与关键词、关键词同义词、近义词等的特征建模,使句子语义特征向量构建中能更好地关注所述文本内容中一个或多个关键词向量等的语义信息,从而获得加强后的句子语义特征向量。
108.语义识别模型获取所述句子语义特征向量后,将采用神经网络算法,基于所述句子语义特征向量所表征的语义特征,对该向量进行安全类别分类,以确定所述文本内容在各个安全类别下的语义评分,具体的,采用多层分类神经网络对句子语义特征向量进行安全类别的分类,从而输出所述文本内容的情绪级向,包括正向(即对直播间商品大加赞扬)、中性、负向(即对商品进行批判),并输出各个安全类别下的的所述语义评分;所述的神经网络算法一般基于cnn或rnn构建,或通过将两者进行组成以构建所述神经网络算法。
109.请参考图3,关于所述语义识别模型确定所述文本内容在多个安全类别下的语义评分的具体实施方式,其具体实施步骤如下:
110.步骤s121,语义识别模型对所述文本内容进行预处理,删除该文本内容中包含的特殊字符及品牌关键词:
111.语义识别模型获取所述文本内容后,将对该文本内容进行预处理,以删除该文本内容中包含的特殊字符及品牌关键词,所述的特殊字符一般是指空格、逗号或算法符号等特殊字符,所述品牌关键词是指市面中已存在的品牌的词组,例如“苹果”、“华为”及“惠普”等该些品牌的中文及外文词组,语义识别模型将所述文本内容中的所述特征字符及品牌关键词进行移除,以免其影响后续的语义提取,提升语义识别模型对该文本内容进行语义提取时的准确性。
112.步骤s122,语义识别模型将完成预处理的文本内容转换为表征为词组向量的词组序列:
113.语义识别模型完成所述文本内容的所述预处理后,将对该文本内容进行词组向量提取,以间该些词组向量组成该文本内容的所述词组序列。
114.具体的,语义识别模型将首先对该文本内容进行分词处理,通过调用分词器,对所述文本内容进行分词处理,获取该文本内容包含的字符,并为该些字符转化为所述关键词序列,关于分词器的选择,当所述文本内容为中文文本时,选择面向于中文领域的ltp分词器、thulac分词器、jieba分词器或kcws分词器对所述文本内容进行分词,以初步获得所述文本内容中包含的所有字符,若所述文本内容为英文文本时,则可通过去除空格及非英文
的特殊字符以获取其所包含的关键词组,或选择相应的面向英文领域的分词器,例如,spacy的large model作为分词器。本领域技术人员可根据实际业务场景选择现有的分词器进行分词,恕不赘述。
115.所述词组序列由所述语义识别模型根据所述文本内容所包含的字符进行基于语义特征的词组向量提取,所述语义识别模型使用语义特征提取器,该语义特征提取器一般是指文本预训练模型bert,先将所述文本内容转为对于该文本内容包含的各字符的字向量,再将该些字向量转换为表征文本内容的全局语义信息的文本向量,最后向该文本向量的不同位置的字符附加一个不同的向量以转换为位置向量,以表征该文本内容中不同字符所携带的语义信息之间的差异,通过对该文本内容进行有序的向量转换,以构造表征所述文本内容的词组向量的所述关键词序列。
116.步骤s123,语义识别模型基于所述词组序列的上下文语义特征,获得文本内容的语义特征向量:
117.语义识别模型将所述文本内容转换为所述词组序列后,将基于该词组序列的上下文语义特征,获得文本内容的所述语义特征向量。
118.具体的,所述语义识别模型采用编码模型对所述词组序列进行上下文特征提取,所述编码模型一般基于bert、rnn、cnn等提取方法所构建,该编码器将输入的词组序列进行上下文建模、并映射到高维语义空间,从而获得评论文本在高维语义空间中的所述语义特征向量。
119.步骤s124,语义识别模型将所述语义特征向量与一个或多个关键词向量进行匹配,获取该语义特征向量通过匹配后所得的句子语义特征向量:
120.语义识别模型获取所述语义特征向量后,将该语义特征向量与一个或多个关键词向量进行匹配,以获取该语义特征向量通过匹配后所得的句子语义特征向量,具体的,所述语义特征模型将对所述语义特征向量与一个或多个关键词向量采用注意力机制等方式,加强对所述语义特征向量中与关键词、关键词同义词、近义词等的特征建模,使句子语义特征向量构建中能更好地关注所述文本内容中一个或多个关键词向量等的语义信息,从而获得加强后的句子语义特征向量。
121.所述关键词向量为预设设置在所述语义识别模型中,该些关键词向量一般储存至已预先配置的关键词向量库,所述关键词向量库中存储着的各关键词一般是通过爬虫系统或人工收集等数据捕捉方式所获取的词组,且将该些关键词对应转换为关键词向量进行储存。
122.步骤s125,语义识别模型采用神经网络算法,基于所述句子语义特征向量所表征的语义特征,对该向量进行安全类别分类,以确定所述文本内容在各个安全类别下的语义评分:
123.语义识别模型获取所述句子语义特征向量后,将采用神经网络算法,基于所述句子语义特征向量所表征的语义特征,对该向量进行安全类别分类,以确定所述文本内容在各个安全类别下的语义评分,具体的,采用多层分类神经网络对句子语义特征向量进行安全类别的分类,从而输出所述文本内容的情绪级向,包括正向(即对直播间商品大加赞扬)、中性、负向(即对商品进行批判),并输出各个安全类别下的的所述语义评分;所述的神经网络算法一般基于cnn或rnn构建,或通过将两者进行组成以构建所述神经网络算法。
124.语义识别模型确定所述文本内容在各个安全类别下的所述语义评分的总和一般为1,即语义识别模型将所述句子语义特征向量与所有安全类别分别进行语义特征的比对,语义特征模型基于归一化指数函数(softmax activation function),将该句子语义特征向量的语义特征与任意安全类别进行相似度计算,将该相似度作为所述文本内容在该安全类别下的所述语义评分。
125.一种实施例中,关于语义识别模型根据所述句子语义特征向量,所述文本内容在各个安全类别下的语义评分的实施方式,所述句子语义特征向量一般由多个关键词组向量所构成,语义识别模型确定所述句子语义特征向量中与所述安全类别分类所表征的词组向量相同或接近的关键词组向量,并确定该些关键词组向量各自的字数之和值,且确定完成所述预处理的文本内容的总字数,当需确定所述文本内容在某一安全类别下的评估分值时,以与该安全类别相对应的关键词组向量的所述和值与所述文本内容的总字数的比值作为该安全类别标签相对应的语义评分,以此类推,完成该文本内容在所有安全类别下的所述语义评分。
126.一种实施例中,语义特征模型采用所述神经网络对所述文本内容进行多安全类别标签提取判断,该些安全类别标签与所述安全类别相对应,安全类别标签的类型包括:涉黄内容标签、涉及暴力内容标签、涉及毒品内容标签以及涉及辱骂内容标签等,以便后续将该文本内容储存至相应的列表中进行展示时,可通过该文本内容所对应的标签,表征该文本内容所涉及的违规内容。
127.步骤s13,根据直播间中预设的表达关键词列表与所述文本内容进行匹配,判断该列表中包含的表达关键词与所述文本内容的匹配个数,进而确定该文本内容的词组评分:
128.服务器获取所述文本内容后,根据当前直播间中预设的所述表达关键词列表与该文本内容进行匹配,判断该表达关键词列表中包含的表达关键词与该文本内容所匹配的个数,以确定该文本内容的所述词组评分。
129.所述的表达关键词列表中储存的表达关键词由直播间的主播端及管理端所储存,主播用户或管理用户通过将相应的的表达关键词储存至所述表达关键词列表中,所述表达关键词一般是指违规的词组,其包含粗俗话语的词组等,包含该些表达关键词的文本内容其对应的即时消息将被禁止输出至直播间中进行展示,服务器通过将所述表达关键词列表中储存的各表达关键词与文本内容中包含的词组进行匹配,以确定与该文本内容匹配的表达关键词的数量,进而确定该文本内容的所述词组评分。
130.所述表达关键词类别中储存的表达关键词将以上述的安全类别进行分类,例如,表达关键词的类型为粗俗类型将与安全类别为粗俗类型相对应,以便后续进行融合判断时,可根据类型将语义评分及词组评分进行归类以实施融合判断,例如,当融合判断的预设条件中存在需结合所述语义评分及词组评分进行判断时,将判断类型为粗俗类型的安全类别下的语义评分是否超过相对应的预设阈值,且同所述词组评分中是否表征文本内容中存在粗俗类型的表达关键词,以所述语义评分的判断结果为超过预设阈值或所述词组评分的判断结果为存在粗俗类型的表达关键词时,相对应的即时消息将不可输出至直播间中进行展示。
131.请参考图4,关于服务器根据当前直播间中预设的所述表达关键词列表与所述文本内容进行匹配,判断该表达关键词列表中包含的表达关键词与所述文本内容的匹配个
数,进而确定该文本内容的词组评分的具体实施方式,其具体实施步骤如下:
132.步骤s131,将所述文本内容与所述表达关键词列表中储存的所有表达关键词进行匹配,确定该文本内容所匹配的所述表达关键词:
133.服务器将所述文本内容与所述表达关键词列表中储存的所有表达关键词进行匹配,以确定该文本内容与该关键词列表中相匹配的表达关键词。
134.服务器在对所述文本内容进行匹配前,一般将对该文本内容进行分词处理,服务器通过调用分词器,对所述文本内容进行分词处理,获取该文本内容包含的词组,关于分词器的选择,当所述文本内容为中文文本时,选择面向于中文领域的ltp分词器、thulac分词器、jieba分词器或kcws分词器对所述文本内容进行分词,以获得所述文本内容中包含的所有词组,若所述文本内容为英文文本时,则可通过去除空格及非英文的特殊字符以获取该文本内容所包含的词组,或选择相应的面向英文领域的分词器,例如,spacy的large model作为分词器。本领域技术人员可根据实际业务场景选择现有的分词器进行分词,恕不赘述。
135.服务器通过对所述文本内容进行分词处理,获取所述文本内容包含的词组后,将该些词组与所述表达关键词列表进行匹配,确定该些词组中与该列表中包含的表达关键词相匹配的词组。
136.服务器使用的匹配方式除了使用传统的相同词组匹配方式,同时也采用模糊匹配方式,以查找所述文本内容所包含的词组中是否存在与所述表达关键词列表中相似的表达关键词,以进一步地扩大匹配范围,防止用户通过输入近似的表达关键词而侥幸通过服务器的表达关键词校验处理。
137.步骤s132,根据所述文本内容所匹配的表达关键词的数量,确定该文本内容的所述词组评分:
138.服务器确定所述文本内容与所述表达关键词所匹配的表达关键词后,根据该文本内容所匹配的表达关键词的数量,确定该文本内容的所述词组评分,具体的,所述词组评分一般与文本内容所匹配的表达关键词的数量成正比提升,例如,当所述文本内容所匹配的表达关键词的数量为3时,其所述词组评分也将为3,当然,也可为6等以数量为单位进行相应的乘法或其他计算方式确定文本内容的所述词组评分。
139.步骤s14,根据直播间中预设的品牌关键词列表,判断所述文本内容中是否存在该列表中包含的品牌关键词,以确定该文本内容的品牌判断结果:
140.服务器获取所述文本内容后,根据当前直播间列表中预设的所述品牌关键词列表,判断所述文本内容中是否存在该品牌关键词列表中储存的品牌关键词,以确定该文本内容的所述品牌判断结果。
141.服务器采用两种匹配方式进行融合,对该文本内容与所述品牌关键词列表中储存的品牌关键词进行匹配,一种匹配方式时基于所述文本内容中包含的词组与所述品牌关键词列表中储存的品牌关键词进行词组匹配,另一种匹配方式为基于所述文本内容的语义特征与所述品牌关键词列表中储存的品牌关键词进行语义匹配。
142.所述的品牌关键词列表中储存的品牌关键词由直播间的主播端所制定,主播端通过自定义所述品牌关键词列表中储存的品牌关键词,该些品牌关键词具有禁止展示标签或允许展示标签,存在具有禁止展示标签的品牌关键词的文本内容所对应的即时消息输出至该主播端所处的直播间中进行展示,存在具有允许展示标签的品牌关键词的文本内容相对
应即时消息将结合文本内容的所述语义评分,判断该即时消息是否可输出至直播间中进行展示,例如,当所述文本内容的语义评分表征文本内容为贬低所述品牌关键词所指向的品牌时,该文本内容相对应的即时消息将禁止输出至直播间中进行展示,若所述文本内容的语义评分表征文本内容为称赞所述品牌关键词所指向的品牌时,该文本内容相对应的即时消息将输出至直播间中进行展示。
143.请参考图5,关于服务器根据当前直播间中预设的所述品牌关键词列表,判断所述文本内容中是否存在该列表中包含的品牌关键词,以确定该文本内容的品牌判断结果的具体实施方式,其具体实施步骤如下:
144.步骤s141,将所述文本内容与所述品牌关键词列表中储存的所有品牌关键词进行匹配,获取该文本内容的匹配结果,所述匹配结果表征文本内容中是否存在任意所述品牌关键词:
145.服务器将所述文本内容与所述品牌关键词列表中储存的所有品牌关键词进行匹配,以确定该文本内容与该关键词列表中相匹配的品牌关键词,获取表征文本内容中是否存在任意所述品牌关键词的所述匹配结果。
146.服务器在对所述文本内容进行匹配前,一般将对该文本内容进行分词处理,关于所述分词处理方式请参考上述步骤s131的相关实施方式,本步骤恕不赘述。
147.服务器通过对所述文本内容进行分词处理,获取所述文本内容包含的词组后,将该些词组与所述品牌关键词列表进行匹配,确定该些词组中与该列表中包含的品牌关键词相匹配的词组。
148.服务器使用的匹配方式除了使用传统的相同词组匹配方式,同时也采用模糊匹配方式,以查找所述文本内容所包含的词组中是否存在与所述品牌关键词列表中相似的品牌关键词,以进一步地扩大匹配范围,防止用户通过输入近似的品牌关键词而侥幸通过服务器的品牌关键词校验处理,例如,模糊匹配方式中将采用拼音匹配方式,将“小米”输入为“晓米”等通过同音字表征相应的品牌以通过品牌关键词校验,导致服务器无法拦截该类型的即时消息而将其输出至直播间中进行展示。
149.步骤s142,对所述文本内容进行分词处理,提取将该文本内容中各词组的语义特征,以计算各词组的语义特征各自与所有所述品牌关键词的语义特征的相似度,根据该些相似度,确定该文本内容的相似度结果,所述相似度结果表征文本内容中是否存在任意所述品牌关键词:
150.服务器对所述文本内容进行分词处理,以确定该文本内容包含的所有词组,并提取该些词组的语义特征,同时提取所述品牌关键词列表中储存的所有品牌管理层的语义特征,以计算该些词组的语义特征各自与所有所述品牌关键词的语义特征的相似度,以根据该些相似度,将相似度高于预设阈值的两者确定为相互匹配,进而确定所述文本内容中所存在的品牌关键词,以最终确定表征该文本内容中是否存在任意所述品牌关键词的所述相似度结果。
151.提取所述文本内容中包含的各词组的语义特征一般将该些词组转换为表征语义特征的词组向量,同时也将所述匹配关键词所储存的所有品牌关键词以相同的方式转换为表征语义特征词组向量,通过将所述词组的词组向量及品牌关键词的词组向量输入至神经网络模型中进行相似度计算,并根据双方的相似度,将相似度高于预设阈值的双方确定为
相匹配,以最终确定出所述文本内容总存在的所述品牌关键词,进而确定出所述文本内容的所述相似度结果。
152.步骤s143,根据所述匹配结果及相似度结果,当任意结果表征所述文本内存中存在任意所述品牌关键词,该文本内容的所述品牌判断结果表征为存在品牌关键词:
153.服务器根据所述文本内容的所述品牌结果及相似度结果,当任意结果表征所述文本内容中存在所述品牌关键词,将根据该品牌关键词所具有的标签,确定该文本内容的所述品牌判断结果,例如,当上述任意结果表征文本内容中存在的所有所述品牌关键词中存在所具有标签为禁止展示标签的品牌关键词时,该文本内容的所述品牌判断结果将为

1等用于表征文本内容存在禁止展示的品牌关键词的判断结果,当上述任意结果表征文本内容中存在的所有所述品牌关键词中存在所具有标签为允许展示标签的品牌关键词时,该文本内容的所述品牌判断结果将为1等用于表征文本内容存在允许展示的品牌关键词的判断结果。若上述任意结果表征所述文本内容中不存在所述品牌关键词,该文本内容的所述品牌判断结果将为0等用于表征文本内容中不存在品牌关键词的判断结果。
154.步骤s15,将语义评分、词组评分以及品牌判断结果进行融合判断,判定所述即时消息是否符合预设条件,将符合预设条件的即时消息推送至直播间中进行展示:
155.服务器将通过上述步骤所得的上述语义评分、存在评分及品牌判断结果进行融合判断,判断上述即时消息是否符合预设条件,以将符合预设条件的即时消息推送至当前直播间中进行展示。
156.服务器通过结合所述语义评分、词组评分及品牌判断结果中任意两项进行融合判断,判断所述即时消息是否符合预设条件,例如,通过结合所述语义评分及词组评分进行融合判断的方式中,该融合判断方式中的第一预设条件一般为判断某一安全类别的所述语义评分中是否超过预设阈值,该融合判断方式中的第二预设条件一般为判断所述词组评分中是否存在该安全类别相对应类型的所述表达关键词,当所述即时消息的所述语义评分及词组评分符合其相应的预设条件的判断时,该即时消息将输出至直播间中进行展示,当然,还可结合所述语义评分与品牌判断结果进行融合判断,判断类型为贬低的安全类别下的额所述语义评分是否超过相对应预设阈值,同时判断所述品牌判断结果中是否存在标签为允许展示标签的品牌关键词,所述允许展示标签的品牌关键词所对于的品牌一般为当前直播间中进行销售的产品的品牌,通过该融合判断,可阻止贬低当前直播间中进行销售的产品的品牌的文本内容所对应的即时消息输出至直播间中进行展示。
157.进一步的,服务器结合所述语义评分、词组评分及品牌判断结果进行融合判断的实施方式,一般是将所述语义评分、词组评分及品牌判断结果各自转换为对应的向量进行权重融合判断,具体的,根据各安全类别的所述语义评分,将些语义评分进行结合以转换为语义向量,根据所述词组评分的分值将该词组评分转换为表达向量,根据所述品牌判断结果中表征的文本内容中存在的品牌关键词的标签,将存在允许展示标签的品牌关键词的品牌判断结果转换为1的品牌向量,将存在禁止展示标签的品牌关键词的品牌判断结果转换为

1的品牌向量,将不存在品牌关键词的品牌判断结果转换为0的品牌向量,然后所述语义向量、表达向量及品牌向量分别经过映射层映射到相同空间,之后采用权重融合算法进行最终判断,确定相对应的即时消息是否可输出至直播间中进行展示,所述权重融合算法中的权重计算一般是通过数据驱动训练得到。
158.请参考图6,关于服务器结合所述语义评分、词组评分以及品牌判断结果进行融合判断,判断所述即时消息是否可输出至直播间中进行展示的具体实施方式,其具体实施步骤如下:
159.步骤s151,判断任意安全类别下的所述文本内容的各所述语义评分是否超过预设阈值,且判断所述词组评分表征该文本内容是否存在与该安全类别相对应表达关键词,若上述判断条件均通过,则将该文本内容相对应的即时消息推送至直播间中进行展示:
160.本融合判断中结合了所述文本内容的所述语义评分及词组评分进行条件判断,以判断该文本内容相对应的即时消息是否可输出至直播间中进行展示,具体的,该融合判断中将判断任意安全类别下的语义评分是否超过预设阈值作为第一预设条件,判断所述词组评分中是否表征所述文本内容存在与该安全类别相对应的表达关键词作为第二预设条件,若第一预设条件判断所述语义评分超过预设阈值,该文本内容所对应的即时消息将无法输出至直播间中进行展示,若第二预设条件判断所述词组评分中表征所述文本内容存在与该安全类别相对应的表达关键词,同理,该文本内容所对应的即时消息将无法输出至直播间中进行展示,若所述语义评分及词组评分均无法通过第一及第二预设条件的判断,该文本内容所对应的即时消息也将无法输出至直播间中进行展示,仅在文本内容通过所述第一及第二预设条件的判断后,该文本内容所对应的即时消息可输出至直播间中进行展示。
161.所述预设阈值一般由直播间的主播端所设置,以便主播端控制其直播间中进行输出展示的即时消息中的文本内容为符合当前直播间的直播坏境的即时消息。
162.步骤s152,将所述文本内容的各所述语义评分、词组评分及品牌判断结果转换为各自对应的向量,采用预设的加权融合算法,判断计算所得融合结果是否超过预设阈值,若未超过,则将该文本内容相对应的即时消息推送至直播间中进行展示:
163.本融合判断中结合了所述文本内容的各所述语义评分、词组评分及品牌判断结果相对应转换为各自对应的向量,采用预设的加权融合算法,判断即时所得融合结果是否超过预设阈值,若未超过,则将该文本内容相对应的即时消息推送至直播间中进行展示。
164.服务器结合所述语义评分、词组评分及品牌判断结果进行融合判断的实施方式,一般是将所述语义评分、词组评分及品牌判断结果各自转换为对应的向量进行权重融合判断,具体的,根据各安全类别的所述语义评分,将些语义评分进行结合以转换为语义向量,根据所述词组评分的分值将该词组评分转换为表达向量,根据所述品牌判断结果中表征的文本内容中存在的品牌关键词的标签,将存在允许展示标签的品牌关键词的品牌判断结果转换为1的品牌向量,将存在禁止展示标签的品牌关键词的品牌判断结果转换为

1的品牌向量,将不存在品牌关键词的品牌判断结果转换为0的品牌向量,然后所述语义向量、表达向量及品牌向量分别经过映射层映射到相同空间,之后采用权重融合算法进行最终判断,判断加权后的结果是否超过预设阈值,以确定相对应的即时消息是否可输出至直播间中进行展示,所述权重融合算法中的权重计算一般是通过数据驱动训练得到。
165.所述预设阈值一般由直播间的主播端及管理端所设置,以便控制直播间中进行输出展示的即时消息中的文本内容为符合直播平台所制定的文明规范的即时消息。
166.以上的典型实施例及其变化实施例充分揭示了本技术的即时消息传输控制方法的实施方案,但是,仍可通过对一些技术手段的变换和扩增而演绎出该方法的多种变化实施例,如下概要说明其他实施例:
167.一种实施例中,请参阅图7,所述即时消息传输控制方法包括如下平行步骤:
168.步骤s16,接收直播间管理端推送的关键词更新信息:
169.服务器接收由直播间的管理端推送的关键词更新消息,该关键词更新信息中一般包含一个或多个关键词,且该些关键词各自具有相对应类别标签以表征其所对应的类别,所述关键词的类别包含表达关键词类别或品牌关键类别词。
170.直播间的管理端通过响应提交指令,将管理用户所定义一个所述关键词及其所具有的所述类别标签封装为所述关键词更新信息,以将其推送至服务器中对应更新当前直播间中所述表达关键词列表及品牌关键词列表。
171.步骤s17,解析所述关键词更新信息,确定该关键词更新信息包含的一个或多个关键词及其相对应的类别标签:
172.服务器解析所述关键词更新信息,确定该关键词中包含的一个或多个所述关键词及其相对应的类别标签,以通过该些关键词所具有的类别标签,确定各关键词所对应的类别,以将该些关键词储存至相对应关键词列表中进行关键词列表更新。
173.步骤s18,根据该些关键词各自对应的所述类别标签,将该些关键词分类储存至该直播间的所述表达关键词列表及匹配关键词列表中:
174.服务器根据所述关键词更新信息中包含的各所述关键词各自对应的类别标签,确定该些关键词所对应的类别,如将具有的类别标签所对应的类别为表达关键词的关键词储存至表达关键词列表中,将将具有的类别标签所对应的类别为品牌关键词的关键词储存至品牌关键词列表中,以更新所述表达关键词列表及品牌关键词列表,进而提升直播间中即时消息输出展示的门槛,防止因所述表达关键词列表及品牌关键词列表不存在相对应关键词,而将不符合规范的即时消息推送至直播间中进行展示,破坏直播间的直播坏境。
175.一种实施例中,请参阅图8,所述即时消息传输控制方法包括如下后置步骤:
176.步骤s16’,根据不通过所述融合判断的文本内容相对应的即时消息,获取该即时消息所属的用户的身份特征信息,所述身份特征信息用于表征用户的个人信息:
177.任意文本内容相对应即时消息无法通过所述融合判断,即无法被输出至直播间中进行展示的即时消息,服务器将获取推送该些即时消息的用户的所述身份特征信息,所述即时消息中一般包含所述身份特征信息,以便服务器确定即时消息的推送用户。
178.步骤s17’,将所述文本内容与身份特征信息对应储存至违规发言列表中,所述违规发言列表用于储存其所对应的直播间中存在违规发言的用户及其即时消息中包含的文本内容:
179.服务器将所述文本内容及其对应的所述身份特征信息作为映射数据储存至所述违规发言列表中,该违规发言列表中储存着当前直播间中存在违规发言的用户及其违规的即时消息中包含的文本内容。
180.各直播间中具有各自的所述违规发言列表,以储存其直播间中存在违规发言的用户及其违规的即时消息中包含的文本内容,所述违规发言用户是指其推送的即时消息无法通过服务器的融合判断的用户,该些用户推送的即时消息被服务器确定为无法通过融合判断后,该即时消息的文本内容及用户的身份特征信息将对应储存指所述违规发言列表中,以便直播间的直播用户通过该违规发言列表确定当前直播间中存在的违规用户及其推送的违规即时消息中的文本内容,以确定是否对该用户进行禁言处理。
181.步骤s18’,响应主播端推送的作用于所述违规发言列表的禁言指令,确定该指令所指向的身份特征信息,以禁止该身份特征信息所对应的用户在当前直播间中的推送即时消息:
182.主播端向服务器推送作用于自身直播间的违规发言列表的所述禁用指令,以驱动服务器响应该禁用指令,确定该禁用指令所指向的身份特征信息,禁止该用户在当前直播间中推送任何的即时消息,完成该用户的禁言处理;通过对违规用户进行禁言处理,可有效地提升直播间的直播坏境,且同时将违规用户进行禁用处理后,服务器可直接该些用户推送的即时消息判断为不可输出至直播间中进行展示的即时消息,以节省服务器的算力。
183.步骤s19’,响应主播端推送的作用于所述违规发言列表的放行指令,确定该指令所指向的即时消息,将该即时消息推送至直播间中进行展示:
184.主播端向服务器推送作用于自身直播间的违规发言列表的所述放行指令,以放行无法通过服务器融合判断的即时消息输出至直播间中进行展示,服务器响应该放行指令以确定该指令所指向即时消息,在所述违规反应列表中查询获取该即时消息,以将该即时消息推送至直播间中进行展示。
185.推送所述放行指令的实施,向主播端放权,使主播端可将被服务器确定为无法通过融合判断的即时消息输出至直播间中进行展示,使直播间的主播用户有权管理输出至直播间中进行展示的即时消息,提升主播用户的使用体验。
186.进一步,可以通过将上述各实施例所揭示的方法中的各个步骤进行功能化,构造出本技术的一种核心产品词识别装置,按照这一思路,请参阅图9,即时消息传输控制方法的一个典型实施例中,该装置包括:即时消息解析模块11,用于接收直播间中客户端提交的即时消息,以解析该即时消息获取其包含的文本内容;语义评分确定模块12,用于调用语义识别模型确定所述文本内容在多个安全类别下的语义评分,所述语义识别模型根据所述文本内容的句子语义特征向量确定其在多个安全类别下的语义评分;词组评分确定模块13,用于根据直播间中预设的表达关键词列表与所述文本内容进行匹配,判断该列表中包含的表达关键词与所述文本内容的匹配个数,进而确定该文本内容的词组评分;品牌判断结果确定模块14,用于根据直播间中预设的品牌关键词列表,判断所述文本内容中是否存在该列表中包含的品牌关键词,以确定该文本内容的品牌判断结果;融合判断模块15,用于将语义评分、词组评分以及品牌判断结果进行融合判断,判定所述即时消息是否符合预设条件,将符合预设条件的即时消息推送至直播间中进行展示。
187.一种实施例中,所述语义评分确定模块12包括:预处理子模块,用于语义识别模型对所述文本内容进行预处理,删除该文本内容中包含的特殊字符及品牌关键词;词组序列转换子模块,用于语义识别模型将完成预处理的文本内容转换为表征为词组向量的词组序列;语义特征向量获取子模块,用于语义识别模型基于所述词组序列的上下文语义特征,获得文本内容的语义特征向量;句子语义特效向量子模块,用于语义识别模型将所述语义特征向量与一个或多个关键词向量进行匹配,获取该语义特征向量通过匹配后所得的句子语义特征向量;语义评分确定子模块,用于语义识别模型采用神经网络算法,基于所述句子语义特征向量所表征的语义特征,对该向量进行安全类别分类,以确定所述文本内容在各个安全类别下的语义评分。
188.一种实施例中,所述词组评分确定模块13包括:表达关键词匹配子模块,用于将所
述文本内容与所述表达关键词列表中储存的所有表达关键词进行匹配,确定该文本内容所匹配的所述表达关键词;词组评分确定子模块,用于根据所述文本内容所匹配的表达关键词的数量,确定该文本内容的所述词组评分。
189.一种实施例中,所述品牌判断结果确定模块14包括:匹配结果获取子模块,用于将所述文本内容与所述品牌关键词列表中储存的所有品牌关键词进行匹配,获取该文本内容的匹配结果,所述匹配结果表征文本内容中是否存在任意所述品牌关键词;相似度结果确定子模块,用于对所述文本内容进行分词处理,提取将该文本内容中各词组的语义特征,以计算各词组的语义特征各自与所有所述品牌关键词的语义特征的相似度,根据该些相似度,确定该文本内容的相似度结果,所述相似度结果表征文本内容中是否存在任意所述品牌关键词;品牌判断结果确定子模块,用于根据所述匹配结果及相似度结果,当任意结果表征所述文本内存中存在任意所述品牌关键词,该文本内容的所述品牌判断结果表征为存在品牌关键词。
190.一种实施例中,所述融合判断模块15包括:阈值判断子模块,用于判断任意安全类别下的所述文本内容的各所述语义评分是否超过预设阈值,且判断所述词组评分表征该文本内容是否存在与该安全类别相对应表达关键词,若上述判断条件均通过,则将该文本内容相对应的即时消息推送至直播间中进行展示;融合结果判断子模块,用于将所述文本内容的各所述语义评分、词组评分及品牌判断结果转换为各自对应的向量,采用预设的加权融合算法,判断计算所得融合结果是否超过预设阈值,若未超过,则将该文本内容相对应的即时消息推送至直播间中进行展示。
191.为解决上述技术问题,本技术实施例还提供一种计算机设备,用于运行根据所述即时消息传输控制方法所实现的计算机程序。具体请参阅图10,图10为本实施例计算机设备基本结构框图。
192.如图10所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种即时消息传输控制方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种即时消息传输控制方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图10中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
193.本实施方式中处理器用于执行本发明的核心产品词识别装置中的各个模块/子模块的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。
194.本实施方式中的存储器存储有核心产品词识别装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
195.本技术还提供一种非易失性存储介质,所述的即时消息传输控制方法被编写成计算机程序,以计算机可读指令的形式存储于该存储介质中,计算机可读指令被一个或多个
处理器执行时,意味着该程序在计算机中的运行,由此使得一个或多个处理器执行上述任一实施例的即时消息传输控制方法的步骤。
196.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read

only memory,rom)等非易失性存储介质,或随机存储记忆体(random access memory,ram)等。
197.综上所述,本技术融合了语义特征提取及关键词匹配对观众用户推送的即时消息进行融合判断,多维度地校验即时消息的文本内容,使直播间中展示的即时消息最大化地符合当前直播环境。
198.应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
199.本技术领域技术人员可以理解,本技术中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本技术中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本技术中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
200.以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献