一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

结合数据可视化的知识图谱大数据处理方法及系统与流程

2022-10-13 01:26:24 来源:中国专利 TAG:


1.本公开涉及大数据处理技术领域,尤其涉及一种结合数据可视化的知识图谱大数据处理方法及系统。


背景技术:

2.数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。知识图谱分析作为数据可视化的其中一个重要分支,在现阶段的大数据挖掘分析中起着关键作用。随着各类数字服务的线上规模不断扩大,服务运行过程中所生成的一系列大数据具有极高的挖掘价值和分析价值,然而,如果直接对这些大数据进行挖掘分析,无疑会增加处理负荷。因此,如何实现对这类复杂大数据的准确拆解和信息分类,是保障后续大数据挖掘以及大数据推荐等处理的关键。


技术实现要素:

3.本公开的一个目的是提供一种结合数据可视化的知识图谱大数据处理方法及系统。
4.本公开的技术方案是通过如下至少部分实施例实现的。
5.一种结合数据可视化的知识图谱大数据处理方法,应用于知识图谱大数据系统,所述方法包括:获得数字服务互动大数据的第一活动事件区分标签,以及所述数字服务互动大数据中的待拆解用户活动事件的第一活动事件知识短语和与所述第一活动事件知识短语对应的第一事件信息拆解窗口;利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行不少于两个处理周期的区分标签加权操作,得到第二事件信息拆解窗口;其中,将上一处理周期所述区分标签加权操作生成的第一活动事件知识短语进行知识扩展得到下一处理周期的活动事件知识短语,并利用所述下一处理周期的活动事件知识短语得到该活动事件知识短语对应的事件信息拆解窗口,将所述下一处理周期的所述活动事件知识短语、所述下一处理周期的事件信息拆解窗口和所述下一处理周期对应的活动事件区分标签作为下一处理周期区分标签加权操作的待处理知识;各处理周期对应的所述区分标签加权操作的待处理知识中的活动事件区分标签的质量评分与活动事件知识短语的质量评分一致。
6.可见,通过多个处理周期对待拆解用户活动事件的活动事件区分标签、活动事件知识短语和事件信息拆解窗口进行深度挖掘处理,每个处理周期获取前一轮处理周期生成的活动事件知识短语以及基于区分标签拆解补全的特征要素,可以尽可能地保障待拆解用户活动事件的事件信息拆解质量,从而将不同的用户活动事件对应的事件信息集从复杂的数字服务互动大数据拆解出来,提高大数据拆解和信息分类的准确性,便于后续针对不同的事件信息集进行独立的用户需求挖掘和大数据推送。
7.在一些可独立实施的示例中,所述利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行不少于两个处理周期的区分标签加权操作,得到第二事件信息拆解窗口,包括:利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行第一处理周期的区分标签加权操作,得到第二活动事件知识短语;利用所述第二活动事件知识短语、与所述第二活动事件知识短语对应的周期化事件信息拆解窗口和第二活动事件区分标签进行不少于一个处理周期的区分标签加权操作,得到所述第二事件信息拆解窗口;其中,所述第二活动事件区分标签的质量评分与所述第二活动事件知识短语的质量评分一致。
8.可见,对第一活动事件区分标签、第一活动事件知识短语和第一事件信息拆解窗口进行多处理周期的处理,可以保障每一处理周期的处理结果的质量评分大于其上一处理周期的处理结果的质量评分,从而能够为每一个待拆解用户活动事件确定高质量评分的事件信息拆解窗口。
9.在一些可独立实施的示例中,所述利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行第一处理周期的区分标签加权操作,得到第二活动事件知识短语,包括:将所述第一活动事件区分标签中的第一个性化知识短语和所述第一活动事件知识短语进行组合,得到第一联动知识短语;将所述第一联动知识短语、所述第一活动事件区分标签中第一窗口化描述内容和所述第一事件信息拆解窗口进行加权组合,得到所述第二活动事件知识短语。
10.可见,通过通过区分标签加权模块对待拆解用户活动事件的活动事件知识短语和窗口化描述内容进行组合,能够得到细节丰富度和准确度更高的第二活动事件知识短语。
11.在一些可独立实施的示例中,所述将所述第一活动事件区分标签中的第一个性化知识短语和所述第一活动事件知识短语进行组合,得到第一联动知识短语,包括:通过第一细节特征挖掘处理,对所述第一个性化知识短语和所述第一活动事件知识短语进行处理,得到第一知识特征挖掘结果;分别通过若干个第二细节特征挖掘处理,对所述第一知识特征挖掘结果进行处理,得到若干个第二知识特征挖掘结果;其中,所述第一细节特征挖掘处理的特征滤波单元小于所述第二细节特征挖掘处理的特征滤波单元,且所述若干个第二细节特征挖掘处理的膨胀变量不同;利用所述若干个第二知识特征挖掘结果,确定所述第一联动知识短语。
12.可见,通过上述方案得到的联动知识短语可以尽可能保留待拆解用户活动事件的局部特征要素,避免组合处理导致的信息丢失。
13.在一些可独立实施的示例中,所述利用所述第二活动事件知识短语、与所述第二活动事件知识短语对应的周期化事件信息拆解窗口和第二活动事件区分标签进行不少于一个处理周期的区分标签加权操作,得到所述第二事件信息拆解窗口,包括:对所述第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区分标签加权操作,得到第三活动事件知识短语和所述第三活动事件知识短语对应的第一膨胀处理窗口;利用所述第一膨胀处理窗口和所述周期化事件信息拆解窗口,确定第三事件信息拆解窗口;对所述第三活动事件知识短语、所述第一膨胀处理窗口和第三活动事件区分标签进行第三处理周期的区分标签加权操作,得到第四活动事件知识短语和所述第四活动事件知识短语对应的第二膨胀处理窗口;利用所述第二膨胀处理窗口和所述
第三事件信息拆解窗口,确定所述第二事件信息拆解窗口。
14.可见,基于膨胀处理(空洞卷积处理)可以精准可靠地拆解出对应于不同活动事件的目标知识字段集,进而提高事件信息的拆解质量。
15.在一些可独立实施的示例中,所述对所述第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区分标签加权操作,得到第三活动事件知识短语和所述第三活动事件知识短语对应的第一膨胀处理窗口,包括:对所述第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区分标签加权操作,得到所述第三活动事件知识短语;对所述第三活动事件知识短语中的目标知识字段集进行解析,得到所述第一膨胀处理窗口。
16.可见,通过通过在对待拆解用户活动事件进行事件拆解的过程中,进一步对待拆解用户活动事件的活动事件知识短语以及个性化知识短语进行二次组合,可以并入更高质量评分的短语拆解向量,从而使得到拆解的目标知识字段集具有更高的精度和可信度。
17.在一些可独立实施的示例中,所述利用所述第一膨胀处理窗口和所述周期化事件信息拆解窗口,确定第三事件信息拆解窗口,包括:确定所述周期化事件信息拆解窗口中的目标知识字段集;利用所述目标知识字段集和所述第一膨胀处理窗口,确定表征所述待拆解用户活动事件的目标知识字段集的字段集区分窗口;利用所述目标知识字段集和所述周期化事件信息拆解窗口,确定表征所述待拆解用户活动事件的非目标知识字段集的非字段集区分窗口;利用所述非字段集区分窗口和所述字段集区分窗口,确定所述第三事件信息拆解窗口。
18.可见,结合第一处理周期生成的不存在缺失的第一事件信息拆解窗口和第二处理周期生成的描述目标知识字段集的第一膨胀处理窗口,得到可以更为准确反映不存在缺失的第三事件信息拆解窗口。
19.在一些可独立实施的示例中,所述利用所述目标知识字段集和所述第一膨胀处理窗口,确定表征所述待拆解用户活动事件的目标知识字段集的字段集区分窗口,包括:利用所述第一膨胀处理窗口的质量评分,对所述周期化事件信息拆解窗口中的目标知识字段集进行知识扩展,得到第一目标知识字段集;利用所述第一目标知识字段集和所述第一膨胀处理窗口,得到所述字段集区分窗口。
20.可见,通过结合周期化事件信息拆解窗口的第一目标知识字段集和对待拆解用户活动事件进行目标知识字段集解析的第一膨胀处理窗口,可以尽可能精准地解析待拆解用户活动事件的目标知识字段集。
21.在一些可独立实施的示例中,所述利用所述目标知识字段集和所述周期化事件信息拆解窗口,确定表征所述待拆解用户活动事件的非目标知识字段集的非字段集区分窗口,包括:利用所述第一膨胀处理窗口的质量评分对所述周期化事件信息拆解窗口进行知识扩展,得到第一目标事件信息拆解窗口;对第一目标知识字段集进行调整处理,得到第二目标事件信息拆解窗口;利用所述第二目标事件信息拆解窗口和所述第一目标事件信息拆解窗口,得到所述非字段集区分窗口。
22.可见,可以精准表征待拆解用户活动事件的不存在缺失的第三事件信息拆解窗口。
23.在一些可独立实施的示例中,所述确定所述周期化事件信息拆解窗口中的目标知
识字段集,包括:利用所述周期化事件信息拆解窗口,确定所述待拆解用户活动事件的事件关键词;在所述数字服务互动大数据中,确定与所述事件关键词之间的最小词向量差异度小于设定词向量差异度的特征字符成员集合;利用所述特征字符成员集合,确定所述周期化事件信息拆解窗口中的目标知识字段集。
24.可见,通过分析特征字符成员与待拆解用户活动事件的事件关键词之间的词向量差异度,可以尽可能完整地记录待拆解用户活动事件的目标知识字段集的关键要素。
25.在一些可独立实施的示例中,所述确定数字服务互动大数据的第一活动事件区分标签之前,所述方法还包括:通过密集卷积模型densenet,对所述数字服务互动大数据进行知识挖掘,得到包括质量评分存在差异的若干个互动知识描述向量的互动知识描述向量集合;利用所述互动知识描述向量集合中质量评分匹配设定判定值的目标互动知识描述向量,确定所述数字服务互动大数据的活动事件区分标签。
26.可见,可获得尽可能完整且多样的活动事件区分标签和更加精准的活动事件知识短语和事件信息拆解窗口。
27.在一些可独立实施的示例中,所述利用所述互动知识描述向量集合中质量评分匹配设定判定值的目标互动知识描述向量,确定所述数字服务互动大数据的活动事件区分标签,包括:利用所述目标互动知识描述向量,对所述数字服务互动大数据进行短语拆解,得到个性化知识短语;利用所述个性化知识短语,确定所述数字服务互动大数据中各数据单元属于所述待拆解用户活动事件的可能性;利用所述可能性,确定所述数字服务互动大数据的窗口化描述内容;将所述个性化知识短语和所述窗口化描述内容,作为所述活动事件区分标签。
28.可见,能够确定出具有丰富关键要素的活动事件区分标签。
29.在一些可独立实施的示例中,所述获得数字服务互动大数据的第一活动事件区分标签,以及所述数字服务互动大数据中的待拆解用户活动事件的第一活动事件知识短语和与所述第一活动事件知识短语对应的第一事件信息拆解窗口,包括:通过特征匹配规则,在所述数字服务互动大数据的互动知识描述向量关系网集合中挑选匹配设定质量评分的第一互动知识描述向量;利用所述第一互动知识描述向量,确定所述第一活动事件知识短语和所述第一事件信息拆解窗口;通过所述特征匹配规则,在所述活动事件区分标签中挑选质量评分为所述设定质量评分的所述第一活动事件区分标签。
30.可见,通过通过通过特征匹配规则挑选匹配一定质量评分的活动事件区分标签、活动事件知识短语以及事件信息拆解窗口,可以针对性地实现特征要素缺失的补全处理。
31.一种知识图谱大数据系统,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。
32.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。
附图说明
33.图1是示出可以实现本公开的实施例的知识图谱大数据系统的一种通信配置的示意图。
34.图2是示出可以实现本公开的实施例的一种结合数据可视化的知识图谱大数据处
理方法的流程示意图。
35.图3是示出可以实现本公开的实施例的一种结合数据可视化的知识图谱大数据处理方法的应用环境的架构示意图。
具体实施方式
36.下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进一步地详细描述,所描述的实施例不应视为对本公开的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开实施例的目的,不是旨在限制本公开。
37.图1是示出可以实现本公开的实施例的知识图谱大数据系统100的一种通信配置的框图,知识图谱大数据系统100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本公开实施例中一种结合数据可视化的知识图谱大数据处理方法的处理器102。
38.图2是示出可以实现本公开的实施例的一种结合数据可视化的知识图谱大数据处理方法的流程示意图,一种结合数据可视化的知识图谱大数据处理方法可以通过图1所示的知识图谱大数据系统100实现,进一步可以包括以下相关步骤所描述的技术方案。
39.node101,获得数字服务互动大数据的第一活动事件区分标签,和数字服务互动大数据中的待拆解用户活动事件的第一活动事件知识短语和与所述第一活动事件知识短语对应的第一事件信息拆解窗口。
40.在一些可独立实施的示例中,数字服务互动大数据可以是包括若干个或者一个待拆解用户活动事件的业务交互日志。数字服务互动大数据(可以涉及云游戏、数字办公、元宇宙服务、在线教育、电子商务、区块链等领域)可以是任意数据采集系统/服务器/终端在任意具有待拆解用户活动事件的业务环境下采集到的业务交互日志。数字服务互动大数据中的待拆解用户活动事件可以是与实际业务环境匹配的任意的用户活动事件,例如,实际业务环境是服务反馈事件拆解,那么待拆解用户活动事件可以为数字服务互动大数据中的服务反馈事件;如果实际业务环境为话题评论事件拆解,那么待拆解用户活动事件为数字服务互动大数据中的话题评论事件。数字服务互动大数据的活动事件区分标签表征该数字服务互动大数据在数据单元(组成数字服务互动大数据的最小单位,例如可以是数据块、区域数据集等)层面的种类区分,例如,对业务交互日志中的每个数据单元都确定出相应的种类,得到数据单元层面的分类信息。该第一活动事件区分标签包括数字服务互动大数据的个性化知识短语和该数字服务互动大数据的窗口化描述内容。第一活动事件区分标签的质量评分与第一活动事件知识短语的质量评分一致;该第一事件信息拆解窗口用于描述待拆解用户活动事件所对应的业务交互日志内容集(局部数字服务互动大数据),例如反映待拆解用户活动事件的已围合数据区域。
41.对于一些独立性设计思路而言,示例性地可以通过通过密集卷积模型densenet,对数字服务互动大数据进行知识挖掘,以得到多样化的活动事件区分标签和更加精准的活动事件知识短语和事件信息拆解窗口,以上node101可以通过如下内容实现,具体可以包括node111-node115所记录的内容。
42.node111,通过密集卷积模型densenet,对所述数字服务互动大数据进行知识挖掘,得到包括质量评分存在差异的若干个互动知识描述向量的互动知识描述向量集合。
43.在一些可独立实施的示例中,通过密集卷积模型densenet(可以理解为但不限于现有的特征图金字塔网络),首先对数字服务互动大数据以设定规则进行知识挖掘(比如可以是特征提取);其次通过从上到下的思路对挖掘得到的高阶互动知识描述向量关系网(比如可以理解为但不限于用户活动特征图、互动特征矩阵等)进行知识扩展(比如但不限于现有的上采样处理);然后通过特征连接/拼接,将知识扩展结果和以设定规则确定出的大小一致的互动知识描述向量关系网进行组合;且将低质量评分(比如但不限于现有的特征识别度)的互动知识描述向量关系网进行2倍知识扩展(或者,通过关联知识扩展)。最后基于设定规则的加权处理(比如逐成员匹配加权),将知识扩展处理与相应的由下到上的映射进行组合。通过上述迭代循环,直至确定出最后的质量评分关系网,换言之,得到互动知识描述向量集合。
44.在另一些可独立实施的示例中,还可以是通过获得所述数字服务互动大数据在不同质量评分下的若干个业务交互日志,对若干个业务交互日志进行知识挖掘,得到包括质量评分存在差异的若干个互动知识描述向量的互动知识描述向量集合。例如,将数字服务互动大数据调整为在若干个不同质量评分下的业务交互日志,该不同质量评分的数目设定可以是与密集卷积模型densenet的单元数相配对,例如,密集卷积模型densenet若存在四个单元层,则可以设定5个相异的降序的质量评分。在一些示例中,可以通过设定的提炼方式(比如基于设定比例的数据压缩或者放大处理)对数字服务互动大数据进行提炼,从而得到不同质量评分下的若干个业务交互日志。
45.node112,利用所述互动知识描述向量集合中质量评分匹配设定判定值的目标互动知识描述向量,确定所述数字服务互动大数据的活动事件区分标签。
46.在一些可独立实施的示例中,所述设定判定值可以是根据互动知识描述向量集合中每一个互动知识描述向量关系网(例如可以通过特征图的形式进行记录)的质量评分大小设定的质量评分判定值,例如,在互动知识描述向量集合中确定质量评分最高的互动知识描述向量为目标互动知识描述向量。通过该目标互动知识描述向量分析该数字服务互动大数据全局的活动事件区分标签。这样一来,通过将高质量评分的目标互动知识描述向量作为短语拆解子模型的输入信息,解析该数字服务互动大数据全局的活动事件区分标签,能够为后期的用户活动事件拆解提供有利的拆解依据。
47.node113,通过特征匹配规则,在所述数字服务互动大数据的互动知识描述向量关系网集合中挑选匹配设定质量评分的第一互动知识描述向量。
48.在一些可独立实施的示例中,node113可以是通过特征匹配规则,首先对于数字服务互动大数据中每一个待拆解用户活动事件的识别窗口,从多尺度的互动知识描述向量关系网中挑选该识别窗口内的互动知识描述向量关系网;之后,将每一个识别窗口对应的互动知识描述向量关系网调整为设定尺寸的大小,例如可得到匹配设定质量评分的第一互动
知识描述向量。例如,通过7*7的特征匹配规则(特征对齐处理),设定7*7的互动知识描述向量关系网,得到第一互动知识描述向量。
49.对于一些独立性设计思路而言,事件信息拆解子模型可以是基于全卷积神经网络fcn实现,也可以通过残差网络实现,还可以通过深度学习网络实现等,在此不作限定。
50.node114,利用所述第一互动知识描述向量,确定所述第一活动事件知识短语和所述第一事件信息拆解窗口。
51.在一些可独立实施的示例中,通过对已完成维度设定的第一互动知识描述向量,进行细节特征挖掘处理(可以理解为卷积操作),得到第一活动事件知识短语;利用该第一活动事件知识短语对待拆解用户活动事件的已围合数据区域进行解析,得到第一事件信息拆解窗口。这样一来,通过包含若干个质量评分的多尺度的互动知识描述向量关系网(可以形成关系网金字塔),解析待拆解用户活动事件的第一活动事件知识短语和第一事件信息拆解窗口,能够提高解析的第一事件信息拆解窗口的精度。
52.node115,通过所述特征匹配规则,在所述活动事件区分标签中挑选质量评分为所述设定质量评分的所述第一活动事件区分标签。
53.在一些可独立实施的示例中,通过相同的特征匹配规则,在活动事件区分标签中挑选质量评分与第一活动事件知识短语的质量评分一致的第一个性化知识短语和第一窗口化描述内容,得到第一活动事件区分标签。如此一来,通过结合该模型的细节特征挖掘单元解析第一活动事件知识短语和第一事件信息拆解窗口(该事件信息拆解窗口可以用于指导相关活动事件的拆解处理,因而还可以理解为事件信息拆解的覆盖范围或者拆解范围),进而获得大致全面的事件信息拆解窗口,便于之后处理周期中利用该大致全面的第一事件信息拆解窗口进行逐一拆解,可以针对性地实现特征要素缺失的补全处理。
54.node102,利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行不少于两个处理周期的区分标签加权操作,得到第二事件信息拆解窗口。
55.在一些可独立实施的示例中,将上一轮所述区分标签加权操作生成的第一活动事件知识短语进行知识扩展之后得到的活动事件知识短语和与所述活动事件知识短语对应的事件信息拆解窗口,作为下一轮所述区分标签加权操作的待处理知识(可以理解为输入特征/输入信息);且每一轮所述区分标签加权操作的待处理知识中的活动事件区分标签的质量评分与活动事件知识短语的质量评分一致。首先,将第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口作为首轮区分标签加权操作的输入;其次,将首轮区分标签加权操作生成的活动事件知识短语,进行知识扩展后得到一活动事件知识短语;将该活动事件知识短语与对应的事件信息拆解窗口,以及质量评分与该活动事件知识短语的质量评分一致的个性化知识短语、窗口化描述内容,作为第二轮区分标签加权操作的输入信息。然后,利用第二轮区分标签加权操作的输出信息,得到能够准确且完整的描述待拆解用户活动事件不存在缺失的第二事件信息拆解窗口。
56.其中,处理周期可以理解为处理阶段或者处理环节,本公开实施例可以设置多个处理周期进行循环迭代处理。进一步地,区分标签加权操作可以理解为融合处理,比如基于类别信息的融合处理(也可以理解为语义融合)。
57.在本公开实施例中,对于获得的包含待拆解用户活动事件的数字服务互动大数
据,首先确定该业务交互日志的第一活动事件区分标签和待拆解用户活动事件的第一活动事件知识短语和第一事件信息拆解窗口;之后,通过对第一活动事件区分标签、第一活动事件知识短语和第一事件信息拆解窗口进行若干轮区分标签加权操作,得到第二事件信息拆解窗口。如此一来,将上一轮所述区分标签加权操作生成的第一活动事件知识短语进行知识扩展后得到的活动事件知识短语和与所述活动事件知识短语对应的事件信息拆解窗口,作为下一轮所述区分标签加权操作的待处理知识,而且通过引入与第一活动事件知识短语质量评分匹配的活动事件区分标签,能够添加对待拆解用户活动事件进行拆解时的关键要素(比如事件细节信息/事件细节特征),进而能够极大的提高待拆解用户活动事件的拆解效率。
58.在一些可独立实施的示例中,通过短语拆解子模型(数据拆分子网),对导入的多尺度的互动知识描述向量关系网中高质量评分的互动知识描述向量,进行短语拆解(也可以理解为文本语义分割处理),得到描述该数字服务互动大数据的活动事件区分标签,以上node112可以通过如下node1121-node1123所记录的内容实现。
59.node1121,利用所述目标互动知识描述向量,对所述数字服务互动大数据进行短语拆解,得到个性化知识短语。
60.在一些可独立实施的示例中,将目标互动知识描述向量加载至短语拆解子模型中,该短语拆解子模型可以是包括四个细节特征挖掘单元(比如可以理解为卷积层),以提取整个业务交互日志的个性化知识短语。此外,个性化知识短语可以理解为个性化知识特征、区别特征、语义特征等,个性化知识短语能够用于区分不同的用户行为活动,从而指导后续的信息拆解处理。
61.node1122,利用所述个性化知识短语,确定所述数字服务互动大数据中各数据单元属于所述待拆解用户活动事件的可能性。
62.在一些可独立实施的示例中,短语拆解子模型通过细节特征挖掘单元挖掘业务交互日志的个性化知识短语之后,通过二元回归模型(例如:二分类的分类器)解析每个数据单元属于业务交互日志中用户活动事件的可能性,例如,数字服务互动大数据中各数据单元属于所述待拆解用户活动事件的可能性。例如,待拆解用户活动事件可以为话题评论事件,那么通过二元回归模型解析每个数据单元属于话题评论事件的可能性,从而实现对数字服务互动大数据的窗口化描述内容的解析(比如可以理解为预测处理或者回归分析处理)。
63.node1123,利用所述可能性,确定所述数字服务互动大数据的窗口化描述内容,并将所述个性化知识短语和所述窗口化描述内容,作为所述活动事件区分标签。
64.在一些可独立实施的示例中,在短语拆解子模型中,通过在二元回归代价(例如:二分类损失)的辅助下,解析整个业务交互日志的高质量评分的窗口化描述内容。通过以上node1121-node1123所记录的内容,在短语拆解子模型中,通过对高质量评分的互动知识描述向量进行短语拆解,得到该业务交互日志的个性化知识短语,而且通过通过二元回归代价,解析该业务交互日志的窗口化描述内容,从而得到关键要素丰富的活动事件区分标签。
65.在一些可独立实施的示例中,对第一活动事件区分标签、第一活动事件知识短语和第一事件信息拆解窗口进行多处理周期的处理,可以保障每一处理周期的处理结果的质量评分大于其上一处理周期的处理结果的质量评分,从而能够为每一个待拆解用户活动事
件确定高质量评分的事件信息拆解窗口。
66.以下为本公开实施例提供的另一可独立实施的设计思路。
67.node201,利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行第一处理周期的区分标签加权操作,得到第二活动事件知识短语。
68.在一些可独立实施的示例中,第一活动事件知识短语可以是7*7的活动事件知识短语,第一事件信息拆解窗口可以为活动事件知识短语对应的7*7的事件信息拆解窗口;第一活动事件区分标签可以为7*7的第一个性化知识短语和7*7的第一窗口化描述内容。通过将7*7的第一个性化知识短语、7*7的第一窗口化描述内容、7*7的活动事件知识短语和7*7的事件信息拆解窗口输入区分标签加权模块,在区分标签加权模块中,分别对输入的四部分进行组合,得到具有更多关键要素的第二活动事件知识短语。
69.其中,活动事件知识短语可以理解为用户活动事件的特征信息或者特征向量,包括但不限于现有的游戏操作的特征,体验反馈评论的特征等。
70.node202,利用所述第二活动事件知识短语、与所述第二活动事件知识短语对应的周期化事件信息拆解窗口和第二活动事件区分标签进行不少于一个处理周期的组合处理,得到所述第二事件信息拆解窗口。
71.在一些可独立实施的示例中,第二活动事件区分标签的质量评分与所述第二活动事件知识短语的质量评分一致。第二活动事件区分标签可以是通过特征匹配规则,在通过短语拆解子模型,对数字服务互动大数据进行短语拆解得到的活动事件区分标签中,挑选的与第二活动事件知识短语的质量评分一致的个性化知识短语和窗口化描述内容。将首轮区分标签加权操作生成的第二活动事件知识短语进行知识扩展,将知识扩展后活动事件知识短语、相同质量评分的周期化事件信息拆解窗口(局部事件信息拆解窗口或者阶段事件信息拆解窗口)以及相同质量评分的第二活动事件区分标签,导入第二处理周期的区分标签加权模块中,进行第二轮的区分标签加权操作。利用第二轮区分标签加权操作的结果,得到描述待拆解用户活动事件的目标知识字段集的膨胀处理窗口,并且将该膨胀处理窗口(空洞处理窗口,可以基于现有的空洞卷积网络进行处理得到)与描述不存在缺失的周期化事件信息拆解窗口相结合,得到能够描述待拆解用户活动事件不存在缺失的(完整的)第二事件信息拆解窗口。
72.在一些可独立实施的示例中,通过通过区分标签加权模块对第一个性化知识短语和第一活动事件知识短语进行组合,得到第一联动知识短语,以上node201可以通过如下node211和node212实现。
73.node211,将所述第一活动事件区分标签中的第一个性化知识短语和所述第一活动事件知识短语进行组合,得到第一联动知识短语。
74.在一些可独立实施的示例中,第一活动事件区分标签中包括:第一个性化知识短语和第一窗口化描述内容;第一个性化知识短语与所述第一活动事件知识短语的质量评分一致;第一窗口化描述内容与第一事件信息拆解窗口的质量评分一致。
75.对于一些独立性设计思路而言,在短语拆解子模型生成的活动事件区分标签,例如生成的个性化知识短语和窗口化描述内容。鉴于第一活动事件知识短语的质量评分为7*7,因此首先通过7*7的特征匹配规则,在短语拆解子模型生成的个性化知识短语中,挑选质
量评分为7*7的第一个性化知识短语。其次,在所述窗口化描述内容中,确定与所述第一事件信息拆解窗口的质量评分相匹配的第一窗口化描述内容。例如,鉴于第一事件信息拆解窗口的质量评分为7*7(比如窗口维度或者分辨率为7*7),因此通过7*7的特征匹配规则,在短语拆解子模型生成的窗口化描述内容中,挑选质量评分为7*7的第一窗口化描述内容。
76.进一步地,将第一个性化知识短语和第一活动事件知识短语进行组合,可以是通过将第一个性化知识短语和第一活动事件知识短语加载至细节特征挖掘单元中,通过多种不同滤波覆盖区域对第一个性化知识短语和第一活动事件知识短语进行细节特征挖掘处理以及基于设定规则的加权处理等处理,从而得到第一联动知识短语。
77.对于一些独立性设计思路而言,可以通过如下node31-node33所记录的内容实现。
78.node31,通过第一细节特征挖掘处理,对所述第一个性化知识短语和所述第一活动事件知识短语进行处理,得到第一知识特征挖掘结果。
79.在一些可独立实施的示例中,第一细节特征挖掘处理可以是特征滤波单元小于一定判定值的细节特征挖掘模型还可以是一个细节特征挖掘处理,例如,1*1的细节特征挖掘单元。将第一个性化知识短语、第一活动事件知识短语、第一窗口化描述内容和第一事件信息拆解窗口,共同输出区分标签加权模块;通过1*1细节特征挖掘单元,对导入的第一个性化知识短语和第一活动事件知识短语进行细节特征挖掘处理,从而得到第一知识特征挖掘结果。
80.node32,分别通过若干个第二细节特征挖掘处理,对所述第一知识特征挖掘结果进行处理,得到若干个第二知识特征挖掘结果。
81.在一些可独立实施的示例中,第一细节特征挖掘处理的特征滤波单元小于所述第二细节特征挖掘处理的特征滤波单元,且所述若干个第二细节特征挖掘处理的膨胀变量存在差异,例如,通过这若干个第二细节特征挖掘处理对导入的知识短语进行细节特征挖掘处理时,单个细节特征挖掘单元的滤波覆盖区域存在差异(卷积核尺度存在差异)。例如,通过具有不同膨胀变量(比如可以理解为空洞大小)的三个并列的3*3细节特征挖掘单元,对第一知识特征挖掘结果进行处理,得到若干个第二知识特征挖掘结果。
82.node33,利用所述若干个第二知识特征挖掘结果,得到所述第一联动知识短语。
83.对于一些独立性设计思路而言,将若干个第二知识特征挖掘结果进行基于设定规则的加权处理,得到第一联动知识短语。这样一来,首先通过特征滤波单元较小的细节特征挖掘单元对导入的知识短语进行细节特征挖掘处理,能够减少特征挖掘过程中的噪声;之后,通过结合特征滤波单元较大,且膨胀不同的若干个细节特征挖掘单元对细节特征挖掘之后的知识短语进行细节特征挖掘处理;然后,将若干个知识特征挖掘结果相组合,使得到的联动知识短语可以尽可能保留待拆解用户活动事件的局部特征要素,避免组合处理导致的信息丢失。
84.node212,将所述第一联动知识短语、所述第一活动事件区分标签中第一窗口化描述内容和所述第一事件信息拆解窗口进行加权组合,得到所述第二活动事件知识短语。
85.在一些可独立实施的示例中,在区分标签加权模块中,通过对输入的第一个性化知识短语和第一活动事件知识短语进行组合之后,首先,对输入区分标签加权模块中的第一窗口化描述内容和第一事件信息拆解窗口的质量评分进行衍生操作;之后,将组合得到的第一联动知识短语(比如可以理解为融合特征)、质量评分衍生操作之后的(对质量评分
进行放大处理或者扩展处理)窗口化描述内容和事件信息拆解窗口,按照设定方式进行特征组合拼接,从而得到第二活动事件知识短语。
86.以上node211和node212中,通过通过区分标签加权模块对待拆解用户活动事件的活动事件知识短语和窗口化描述内容进行组合,能够得到细节丰富度和准确度更高的第二活动事件知识短语。
87.在一些可独立实施的示例中,通过对第二活动事件知识短语、周期化事件信息拆解窗口和第二活动事件区分标签进行第二处理周期的区分标签加权操作,关注待拆解用户活动事件的目标知识字段集,从而基于膨胀处理(空洞卷积处理)可以精准可靠地拆解出对应于不同活动事件的目标知识字段集,进而提高事件信息的拆解质量,以上node202可以通过如下node221-node224实现。
88.node221,对所述第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区分标签加权操作,得到第三活动事件知识短语和所述第三活动事件知识短语对应的第一膨胀处理窗口。
89.在一些可独立实施的示例中,第二活动事件知识短语的质量评分大于第一活动事件知识短语的质量评分。通过将第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签输入第二处理周期的区分标签加权模块中,得到第三活动事件知识短语;对该第三活动事件知识短语的目标知识字段集(比如活动事件知识短语的具有区别特性的短语集,一般可以理解为活动事件知识短语的边界特征或者区别特征)进行解析(预测),得到第一膨胀处理窗口。进一步地,第一膨胀处理窗口用于描述待拆解用户活动事件的目标知识字段集。如此,通过在对待拆解用户活动事件进行事件拆解的过程中,进一步对待拆解用户活动事件的活动事件知识短语以及个性化知识短语进行二次组合,可以并入更高质量评分的短语拆解向量,从而使得到拆解的目标知识字段集具有更高的精度和可信度。
90.进一步的,该目标知识字段集为以待拆解用户活动事件的事件关键词为参考,与该事件关键词的词向量差异度小于一定词向量差异度判定值的特征字符成员所组成的特征内容集。在一些示例中,以待拆解用户活动事件为话题评论事件为例,该目标知识字段集为以话题评论事件在数字服务互动大数据中的事件关键词为参考点形成的包括部分标的数据(比如:热力值较高的业务交互日志内容集),以及部分非标的数据的业务交互日志内容集。
91.node222,利用所述第一膨胀处理窗口和所述周期化事件信息拆解窗口,确定第三事件信息拆解窗口。
92.在一些可独立实施的示例中,通过将第一膨胀处理窗口和周期化事件信息拆解窗口输入设定窗口处理算法(比如窗口特征优化模块,类似于边缘识别模块)中,通过对第一膨胀处理窗口的目标知识字段集进行质量评分放大,结合解析结果和周期化事件信息拆解窗口,能够解析待拆解用户活动事件的已围合数据区域,得到第三事件信息拆解窗口。
93.对于一些独立性设计思路而言,对事件信息拆解过程的第二处理周期中,通过结合第一处理周期生成的不存在缺失的第一事件信息拆解窗口和第二处理周期生成的描述目标知识字段集的第一膨胀处理窗口,得到可以更为准确反映不存在缺失的第三事件信息拆解窗口;即以上node222可以通过如下node41-node44所记录的内容实现。
94.node41,确定所述周期化事件信息拆解窗口中的目标知识字段集。
95.在一些可独立实施的示例中,在事件信息拆解子模型中,依照周期化事件信息拆解窗口中的第一事件信息拆解窗口所反映的待拆解用户活动事件的数据区域,解析该数据区域在数字服务互动大数据中的目标知识字段集。
96.对于一些独立性设计思路而言,首先利用所述周期化事件信息拆解窗口,确定所述待拆解用户活动事件的事件关键词;例如,通过分析第一事件信息拆解窗口所表征的待拆解用户活动事件的已围合数据区域,确定该用户活动事件的事件关键词(用于对不同用户活动事件进行区分的字符信息或者字段信息)。其次,在所述数字服务互动大数据中,确定与所述事件关键词之间的最小词向量差异度(比如词向量距离)小于设定词向量差异度的特征字符成员(比如特征字段或者特征信息)集合;例如,在数字服务互动大数据中,分别确定每一特征字符成员与该特征字符成员相匹配的事件关键词,之间的词向量差异度;将词向量差异度小于设定词向量差异度的特征字符成员,组成特征字符成员集合。然后,利用所述特征字符成员集合,确定所述周期化事件信息拆解窗口中的目标知识字段集。例如,通过对该特征字符成员集合中的特征字符成员进行组合,组成一个业务交互日志内容集,例如,目标知识字段集;该目标知识字段集中包括事件关键词与非标的数据存在关联的业务交互日志内容集以及事件关键词与用户活动事件自身匹配的业务交互日志内容集。这样一来,通过分析特征字符成员与待拆解用户活动事件的事件关键词之间的词向量差异度,可以尽可能完整地记录待拆解用户活动事件的目标知识字段集的关键要素。
97.node42,利用所述目标知识字段集和所述第一膨胀处理窗口,确定表征所述待拆解用户活动事件的目标知识字段集的字段集区分窗口。
98.在一些可独立实施的示例中,通过对该目标知识字段集进行知识扩展,并将知识扩展后的知识字段集与第一膨胀处理窗口进行组合,得到描述拆解用户活动事件的目标知识字段集的字段集区分窗口。
99.对于一些独立性设计思路而言,首先利用所述第一膨胀处理窗口的质量评分,对所述周期化事件信息拆解窗口中的目标知识字段集进行知识扩展,得到第一目标知识字段集;例如,第一膨胀处理窗口的质量评分为14*14,按照该质量评分对解析的目标知识字段集进行知识扩展,得到14*14的第一目标知识字段集。其次,利用所述第一目标知识字段集和所述第一膨胀处理窗口,得到所述字段集区分窗口。例如,将第一目标知识字段集和第一膨胀处理窗口进行基于设定规则的全局处理(比如逐字段成员的作乘处理),得到该字段集区分窗口(用于对不同字段集进行区分的区域型数据或者标签集围合形成的窗口)。这样,通过结合周期化事件信息拆解窗口的第一目标知识字段集和对待拆解用户活动事件进行目标知识字段集解析的第一膨胀处理窗口,可以尽可能精准地解析待拆解用户活动事件的目标知识字段集。
100.node43,利用所述目标知识字段集和所述周期化事件信息拆解窗口,确定表征所述待拆解用户活动事件的非目标知识字段集的非字段集区分窗口。
101.在一些可独立实施的示例中,将质量评分衍生操作之后的目标知识字段集与质量评分衍生操作之后的周期化事件信息拆解窗口,进行基于设定规则的全局处理,得到描述待拆解用户活动事件的非目标知识字段集的非字段集区分窗口。
102.对于一些独立性设计思路而言,对于node42而言,可以通过如下内容实现。
103.首先,利用所述第一膨胀处理窗口的质量评分对所述周期化事件信息拆解窗口进行知识扩展,得到第一目标事件信息拆解窗口。
104.举例而言,按照第一膨胀处理窗口的质量评分,对所述第一事件信息拆解窗口的质量评分进行知识扩展,得到第一目标事件信息拆解窗口。
105.其次,对第一目标知识字段集进行调整处理,得到第二目标事件信息拆解窗口。
106.举例而言,首先利用第一事件信息拆解窗口,分析目标知识字段集所在的字段集区分窗口;其次将该字段集区分窗口的质量评分进行知识扩展,使得知识扩展后的拆解窗口质量评分与第一目标事件信息拆解窗口的质量评分一致;然后对知识扩展之后的拆解窗口进行调整处理,得到第二目标事件信息拆解窗口。例如,知识扩展之后的拆解窗口中的成员特征值(知识单元)为0或1;将知识扩展之后的拆解窗口中的成员特征值为1的调成成0;成员特征值为0的调成成1。
107.然后,利用所述第二目标事件信息拆解窗口和所述第一目标事件信息拆解窗口,得到所述非字段集区分窗口。
108.举例而言,将第二目标事件信息拆解窗口和第一目标事件信息拆解窗口进行基于设定规则的全局处理,得到不包含目标知识字段集的非字段集区分窗口。
109.node44,利用所述非字段集区分窗口和所述字段集区分窗口,确定所述第三事件信息拆解窗口。
110.在一些可独立实施的示例中,将非字段集区分窗口和字段集区分窗口进行基于设定规则的加权处理,得到可以精准表征待拆解用户活动事件的不存在缺失的第三事件信息拆解窗口。
111.node223,对所述第三活动事件知识短语、所述第一膨胀处理窗口和第三活动事件区分标签进行第三处理周期的区分标签加权操作,得到第四活动事件知识短语和所述第四活动事件知识短语对应的第二膨胀处理窗口。
112.在一些可独立实施的示例中,将上一处理周期生成的第三活动事件知识短语、描述目标知识字段集的第一膨胀处理窗口和质量评分一致的第三活动事件区分标签输入区分标签加权模块中,得到待拆解用户活动事件的第四活动事件知识短语,和对该第四活动事件知识短语的目标知识字段集进行解析得到的第二膨胀处理窗口。
113.node224,利用所述第二膨胀处理窗口和所述第三事件信息拆解窗口,确定所述第二事件信息拆解窗口。
114.在一些可独立实施的示例中,将描述目标知识字段集的第二膨胀处理窗口和描述不存在缺失的第三事件信息拆解窗口相结合,得到能够更加精确拆解待拆解用户活动事件的第二事件信息拆解窗口。
115.在本公开实施例中,通过对活动事件区分标签、活动事件知识短语和事件信息拆解窗口进行多处理周期组合处理的过程中,解析待拆解用户活动事件的目标知识字段集,能够为每一个待拆解用户活动事件解析精准的目标知识字段集。
116.对于一些示例而言,短语拆解子模型是输入信息为密集卷积模型densenet的最高质量评分互动知识描述向量关系网的全卷积模型。短语拆解子模型由四个细节特征挖掘单元组成,以提取整个业务交互日志的个性化知识短语,并通过二元回归模型解析每个数据单元属于相关活动事件的可能性。在二元回归代价的辅助下,解析整个业务交互日志的高
质量评分窗口化描述内容。将细节描述向量定义为个性化知识短语和窗口化描述内容的并集。这些细节描述向量还可以用来补充事件信息拆解子模型中遗漏的特征,从而实现高精度和可信度的窗口化描述内容解析。比如,可以将密集卷积模型densenet41的最高质量评分互动知识描述向量关系网输入短语拆解子模型42中,输出个性化知识短语和窗口化描述内容43。
117.又比如,对密集卷积模型densenet41的阶段化特征集(比如特征金字塔)进行特征匹配规则,得到尺度不变的活动事件知识短语feature44,对该活动事件知识短语feature44进行细节特征挖掘处理,得到卷积后的活动事件知识短语feature45。利用卷积后的活动事件知识短语feature45进行窗口解析,得到7*7的初始窗口。在第一处理周期中,通过特征匹配规则从短语拆解子模型42的输出中融合的个性化知识短语和窗口化描述内容43中取出大小为7*7个性化知识短语和窗口化描述内容。将密集卷积模型densenet41的卷积后的活动事件知识短语feature45、7*7初始窗口、7*7个性化知识短语和窗口化描述内容,输入第一处理周期的区分标签加权模块c411中;然后,区分标签加权模块c411对上述4部分内容进行组合,将组合后的特征按设定规则进行知识扩展处理,从而提高特征空间维度,得到14*14的活动事件知识短语feature46;并利用14*14的活动事件知识短语,解析该活动事件知识短语的完整的14*14的事件信息拆解窗口。
118.在第二处理周期中,通过特征匹配规则从短语拆解子模型42的输出中融合的个性化知识短语和窗口化描述内容43中取出大小为14*14个性化知识短语和窗口化描述内容;将活动事件知识短语feature46、完整的14*14的事件信息拆解窗口、14*14个性化知识短语和窗口化描述内容,输入第二处理周期的区分标签加权模块c412中;然后,区分标签加权模块c412对上述4部分内容进行组合,将组合后的特征按设定规则进行知识扩展处理,从而提高特征空间维度,输出28*28的活动事件知识短语feature47;并利用28*28的活动事件知识短语,解析该活动事件知识短语的目标知识字段集的事件信息拆解窗口w49。对第一处理周期得到表征活动事件不存在缺失的14*14的事件信息拆解窗口与事件信息拆解窗口w49相结合,得到能够表征活动事件不存在缺失的28*28的事件信息拆解窗口;这样,通过进一步提高活动事件知识短语的质量评分,以及对关键要素的补充处理,使得到的事件信息拆解窗口尽可能完整。
119.在第三处理周期中,通过特征匹配规则从短语拆解子模型42的输出中融合的个性化知识短语和窗口化描述内容43中取出大小为28*28个性化知识短语和窗口化描述内容;将活动事件知识短语feature47、事件信息拆解窗口w49、28*28个性化知识短语和窗口化描述内容,输入第三处理周期的区分标签加权模块c413中;然后,区分标签加权模块c413对上述4部分内容进行组合,将组合后的特征按设定规则进行知识扩展处理,从而提高特征空间维度,输出56*56的活动事件知识短语feature48;并利用56*56的活动事件知识短语,解析该活动事件知识短语的目标知识字段集的事件信息拆解窗口w410。通过将第二处理周期得到表征活动事件不存在缺失的28*28的事件信息拆解窗口与事件信息拆解窗口w410相结合,得到能够表征活动事件已围合数据区域56*56的事件信息拆解窗口;这样,通过更进一步提高活动事件知识短语的质量评分,以及对关键要素的补全处理,使得到的56*56的事件信息拆解窗口表征的活动事件已围合数据区域尽可能准确完整。
120.在本公开实施例中,通过考虑高质量评分的短语拆解向量,在拆解过程中逐处理
周期弥补丢失的关键要素,使得整体方案能够更加准确地拆解相关活动事件目标知识字段集,进而能够极大的提高了最后的拆解效果。此外,通过引入高质量评分的短语拆解向量,在拆解过程中逐处理周期弥补丢失的关键要素,使得整体方案基于膨胀处理(空洞卷积处理)可以精准可靠地拆解出对应于不同活动事件的目标知识字段集,进而能够极大的提高了最后的拆解质量。
121.在一些可独立实施的设计思路下,在利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行不少于两个处理周期的区分标签加权操作,得到第二事件信息拆解窗口之后,该方法还可以包括如下内容:基于所述第二事件信息拆解窗口对所述数字服务互动大数据进行活动事件信息拆解,得到目标活动事件信息;利用所述目标活动事件信息确定用户需求;基于所述用户需求进行服务更新。
122.可以理解,以第二事件信息拆解窗口为参考,能够实现目标活动事件信息的抽取,然后针对性地进行需求分析,以便实现灵活、准确的服务更新处理。
123.在一些可独立实施的设计思路下,利用所述目标活动事件信息确定用户需求,可以包括如下内容:获取针对所述目标活动事件信息的操作习惯特征簇,所述操作习惯特征簇包括至少两条操作习惯特征;获得所述操作习惯特征簇中的各条操作习惯特征与所述目标活动事件信息之间的关联系数;根据所述各条操作习惯特征对应的关联系数,以及所述各条操作习惯特征的行为倾向向量,对所述各条操作习惯特征进行顺序调整,得到相应的操作习惯特征队列;基于所述操作习惯特征队列生成针对所述目标活动事件信息的目标操作需求主题队列,所述目标操作需求主题队列包括至少两个目标用户操作需求信息。
124.这样一来,能够考虑不同操作习惯特征之间的关联性,并结合行为倾向向量进行排序处理,从而确保得到的目标操作需求主题队列可以反映用户用户的需求迫切程度,以便进行针对性的服务更新处理。
125.在一些可独立实施的设计思路下,所述根据所述各条操作习惯特征对应的关联系数,以及所述各条操作习惯特征的行为倾向向量,对所述各条操作习惯特征进行顺序调整,得到相应的操作习惯特征队列,包括:根据所述各条操作习惯特征对应的关联系数,以及所述各条操作习惯特征的行为倾向向量,对所述各条操作习惯特征进行分团,得到至少两个操作习惯特征子簇;对各个操作习惯特征子簇进行顺序调整,并分别对所述各个操作习惯特征子簇中的各条操作习惯特征进行顺序调整,得到所述操作习惯特征队列。
126.在一些可独立实施的设计思路下,所述根据所述各条操作习惯特征对应的关联系数,以及所述各条操作习惯特征的行为倾向向量,对所述各条操作习惯特征进行分团,得到至少两个操作习惯特征子簇,包括:分别根据所述各条操作习惯特征对应的关联系数,对所述各条操作习惯特征的行为倾向向量进行加权,得到所述各条操作习惯特征的活跃行为倾向向量;根据所述各条操作习惯特征的活跃行为倾向向量对所述各条操作习惯特征进行基于特征分析的多元回归处理,得到至少两个操作习惯特征子簇。
127.在一些可独立实施的设计思路下,所述对各个操作习惯特征子簇之间进行顺序调整,并分别对所述各个操作习惯特征子簇中的各条操作习惯特征进行顺序调整,得到所述操作习惯特征队列,具体包括:根据各个操作习惯特征子簇所包含的操作习惯特征的数量,对所述各个操作习惯特征子簇进行顺序调整;以及,针对所述各个操作习惯特征子簇,分别执行以下操作:根据所述操作习惯特征子簇中各条操作习惯特征的行为倾向向量与所述操
作习惯特征子簇的相关性系数,对所述操作习惯特征子簇中的各条操作习惯特征进行顺序调整;基于所述各个操作习惯特征子簇之间的顺序调整结果,以及所述各个操作习惯特征子簇中各条操作习惯特征的顺序调整结果,生成所述操作习惯特征队列。
128.图3是示出可以实现本公开的实施例的结合数据可视化的知识图谱大数据处理方法的应用环境的架构示意图,结合数据可视化的知识图谱大数据处理方法的应用环境中可以包括互相通信的知识图谱大数据系统100和数字服务互动端200。基于此,知识图谱大数据系统100和数字服务互动端200在运行时实现或者部分实现本公开实施例的结合数据可视化的知识图谱大数据处理方法。
129.以上已经结合附图描述了本公开的实施例,至少具有如下有益效果:通过多个处理周期对待拆解用户活动事件的活动事件区分标签、活动事件知识短语和事件信息拆解窗口进行深度挖掘处理,每个处理周期获取前一轮处理周期生成的活动事件知识短语以及基于区分标签拆解补全的特征要素,可以尽可能地保障待拆解用户活动事件的事件信息拆解质量,从而将不同的用户活动事件对应的事件信息集从复杂的数字服务互动大数据拆解出来,提高大数据拆解和信息分类的准确性,便于后续针对不同的事件信息集进行独立的用户需求挖掘和大数据推送。
130.以上所述,仅为本公开的较佳实施例而已,并非用于限定本公开的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献