一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

在数字化场景下的大数据用户画像处理方法及服务器与流程

2022-06-05 03:35:16 来源:中国专利 TAG:


1.本技术涉及数字化和大数据画像技术领域,更具体地,涉及一种在数字化场景下的大数据用户画像处理方法及服务器。


背景技术:

2.在数字化升级的大环境下,大数据和用户画像已不再是陌生的名词,大数据技术和用户画像分析技术的成熟应用能够提高现目前各类业务服务的办理效率和便捷程度。其中,业务服务质量与用户画像高度相关。
3.用户画像最早期的概念是“personas are a concrete representation of target users”,换言之,用户画像(personas)是真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型。通过用户调研去了解用户,并根据其目标、行为和观点的不同,将其区分为不同的类型,然后每种类型中抽取出典型特征,赋予相关描述以形成用户画像。
4.用户画像的应用领域较为广泛,比如可视化业务服务。在实际应用中,为了实现对可视化业务服务环境下的用户分析,需要进行一定程度的用户画像分析,然而相关技术难以确保用户画像分析的准确性,同时难以有效减少用户画像分析所占用的资源开销。


技术实现要素:

5.本技术的一个目的是提供一种用于确定感兴趣内容的新技术方案。
6.根据本技术的第一方面,提供一种在数字化场景下的大数据用户画像处理方法,应用于画像处理服务器,所述方法包括:获取待处理社交话题用户浏览的各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段;分析所述区域化分布内容和服务事项浏览时段,将所述各个目标可视化服务事项归类到至少一个业务浏览记录中;基于所述服务事项浏览时段,从每个所述业务浏览记录的目标可视化服务事项中挑选出对应所述业务浏览记录的可视化服务关键事项;基于所述可视化服务关键事项的区域化分布内容,将符合设定检测要求的可视化服务关键事项归类至同一服务事项簇;基于所述服务事项簇中所述可视化服务关键事项的区域化分布内容,确定所述待处理社交话题用户的感兴趣内容集。
7.在一个可独立实施的设计思路下,所述分析所述区域化分布内容和服务事项浏览时段,将所述各个目标可视化服务事项归类到至少一个业务浏览记录中包括:按照所述服务事项浏览时段从远至近的排序次序,将所述各个目标可视化服务事项进行整理;基于整理后的各个目标可视化服务事项对应的区域化分布内容和服务事项浏览
时段,确定所述待处理社交话题用户浏览所述各个目标可视化服务事项时的浏览关注度;若整理后的各个目标可视化服务事项中任意连续目标可视化服务事项对应的服务事项浏览时段的时长差异大于设定时长值,且所述任意连续目标可视化服务事项中至少一个所对应的浏览关注度小于设定关注度阈值,则将所述任意连续目标可视化服务事项归类至不同的业务浏览记录中。
8.在一个可独立实施的设计思路下,所述区域化分布内容包括多模态分布描述,所述基于所述可视化服务关键事项的区域化分布内容,将符合设定检测要求的可视化服务关键事项归类至同一服务事项簇包括:将所述多模态分布描述相同的可视化服务关键事项归类至同一服务事项簇;获取其中两个所述服务事项簇之间的第一量化差异数据;将所述第一量化差异数据小于等于第一设定量化差异阈值的其中两个所述服务事项簇整合为同一服务事项簇。
9.在一个可独立实施的设计思路下,所述获取其中两个所述服务事项簇之间的第一量化差异数据包括:将所述服务事项簇中可视化服务关键事项的多模态分布描述的全局化分析结果作为服务事项簇的热点服务事项的多模态分布描述;基于其中两个所述服务事项簇的热点服务事项的多模态分布描述,确定其中两个所述服务事项簇之间的第一量化差异数据;所述将所述第一量化差异数据小于等于第一设定量化差异阈值的其中两个所述服务事项簇整合为同一服务事项簇之后,所述方法还包括:抽取当前服务事项簇中与所述当前服务事项簇的热点服务事项之间的第二量化差异数据大于第二设定量化差异阈值的可视化服务关键事项;若抽取的可视化服务关键事项与其他服务事项簇的热点服务事项之间的第三量化差异数据小于等于第三设定量化差异阈值,则将抽取的可视化服务关键事项整合至所述其他服务事项簇;若抽取的可视化服务关键事项与任意所述其他服务事项簇的热点服务事项之间的第三量化差异数据大于所述第三设定量化差异阈值,则将抽取的可视化服务关键事项作为另外的服务事项簇。
10.在一个可独立实施的设计思路下,所述基于所述服务事项簇中所述可视化服务关键事项的区域化分布内容,确定所述待处理社交话题用户的感兴趣内容集包括:获取与所述服务事项簇的热点服务事项之间的量化差异数据最小的第一可视化服务关键事项,以及与所述服务事项簇的热点服务事项之间的量化差异数据最大的第二可视化服务关键事项;获取所述第一可视化服务关键事项对应的目标可视化服务事项的服务事项主题,并获取所述第二可视化服务关键事项到所述服务事项簇的热点服务事项之间的第四量化差异数据;将以所述服务事项簇的热点服务事项为基准,以所述第四量化差异数据为约束的候选服务事项集作为所述待处理社交话题用户的感兴趣内容集,并将所述第一可视化服务关键事项对应的目标可视化服务事项的服务事项主题作为所述感兴趣内容集的概括型主
题。
11.在一个可独立实施的设计思路下,所述基于所述服务事项簇中所述可视化服务关键事项的区域化分布内容,确定所述待处理社交话题用户的感兴趣内容集之后,所述方法还包括:基于所述待处理社交话题用户的感兴趣内容集内的可视化服务关键事项的服务事项浏览时段,获取所述感兴趣内容集的内容集特征;基于所述感兴趣内容集的内容集特征,确定两个所述待处理社交话题用户之间的社交网络联系。
12.在一个可独立实施的设计思路下,所述内容集特征包括:服务事项激活累计值、服务事项激活时长、服务事项激活时序描述、服务事项激活认证记录、感兴趣时段;所述基于所述感兴趣内容集的内容集特征,确定两个所述待处理社交话题用户之间的社交网络联系包括:基于所述服务事项激活累计值、所述服务事项激活时长和所述感兴趣时段,确定所述感兴趣内容集的内容集类别,其中,所述内容集类别包括:热门时段感兴趣内容集、冷门时段感兴趣内容集、即兴感兴趣内容集;若两个所述待处理社交话题用户的即兴感兴趣内容集的服务事项的激活认证记录相似性和内容集相似性符合第一设定指标,则确定所述社交网络联系为即时交互联系;若两个所述待处理社交话题用户的热门时段感兴趣内容集的服务事项激活时序描述相似性和内容集相似性符合第二设定指标,且两个所述待处理社交话题用户的冷门时段感兴趣内容集的服务事项激活时序描述相似性和内容集相似性符合所述第二设定指标,则确定所述社交网络联系为全时段持续性交互联系。
13.在一个可独立实施的设计思路下,所述基于所述服务事项浏览时段,从每个所述业务浏览记录的目标可视化服务事项中挑选出对应所述业务浏览记录的可视化服务关键事项包括:定位每个所述业务浏览记录中所述服务事项浏览时段最靠前的目标可视化服务事项,作为对应所述业务浏览记录的可视化服务关键事项中的起始服务事项;并定位每个所述业务浏览记录中所述服务事项浏览时段最靠后的目标可视化服务事项,作为对应所述业务浏览记录的可视化服务关键事项中的终止服务事项;所述基于所述待处理社交话题用户的感兴趣内容集内的可视化服务关键事项的服务事项浏览时段,获取所述感兴趣内容集的内容集特征包括:获取所述感兴趣内容集内可视化服务关键事项中的起始服务事项的服务事项浏览时段的统计学中值,作为所述感兴趣内容集的内容集关注转移时刻,并获取所述感兴趣内容集内可视化服务关键事项中的终止服务事项的服务事项浏览时段的统计学中值,作为所述感兴趣内容集的内容集关注触发时刻;将所述内容集关注触发时刻和所述内容集关注转移时刻之间的时段作为所述感兴趣内容集的感兴趣时段;并确定所述感兴趣内容集内所有可视化服务关键事项的激活累计值之和,作为所述感兴趣内容集的服务事项激活累计值;以及确定所述感兴趣内容集内所有可视化服务关键事项的激活时长之和,作为所述感兴趣内容集的服务事项激活时长;以及确定所述感兴趣内容集内所有可视化服务关键事项的激活日志,作为所述感兴趣内容
集的服务事项激活时序描述;以及确定所述感兴趣内容集内所有可视化服务关键事项的激活时间,作为所述感兴趣内容集的服务事项激活认证记录。
14.在一个可独立实施的设计思路下,所述第一设定指标包括:所述服务事项的激活认证记录相似性大于第一设定相似性阈值,且所述内容集相似性大于第二设定相似性阈值;和/或,所述第二设定指标包括:所述服务事项激活时序描述相似性大于第三设定相似性阈值,且所述内容集相似性大于第四设定相似性阈值。
15.在一个可独立实施的设计思路下,所述基于所述感兴趣内容集的内容集特征,确定两个所述待处理社交话题用户之间的社交网络联系还包括:定位所述服务事项激活认证记录在闲置时段之内的即兴感兴趣内容集,作为闲置即兴内容集;若两个所述待处理社交话题用户的闲置即兴内容集的服务事项的激活认证记录相似性大于第五设定相似性阈值,且内容集相似性大于第六设定相似性阈值,则确定所述社交网络联系为闲置时段即时交互联系。
16.在一个可独立实施的设计思路下,所述方法还包括:将所述感兴趣内容集传入至第一目标服务推送识别模型中的前置处理网络,得到所述前置处理网络输出的所述感兴趣内容集的第一兴趣倾向描述和第二兴趣倾向描述,其中,所述前置处理网络包括互相之间存在关联的多个特征提取单元,所述第一兴趣倾向描述是所述互相之间存在关联的多个特征提取单元中的除最后一个特征提取单元之外的的特征提取单元输出的兴趣倾向描述,所述第二兴趣倾向描述是所述互相之间存在关联的多个特征提取单元中的最后一个的特征提取单元输出的兴趣倾向描述;将所述第二兴趣倾向描述传入至所述第一目标服务推送识别模型中的候选服务粗筛网络,得到所述候选服务粗筛网络输出的目标粗筛结果,其中,所述目标粗筛结果为在所述感兴趣内容集中识别到的待处理社交话题用户所匹配的粗筛结果;将所述第一兴趣倾向描述、所述第二兴趣倾向描述和第三兴趣倾向描述以及所述目标粗筛结果传入至所述第一目标服务推送识别模型中的候选服务精筛网络,得到所述候选服务精筛网络输出的所述待处理社交话题用户的话题用户类型以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况,其中,所述第三兴趣倾向描述是所述候选服务粗筛网络中的特征提取单元根据已优化兴趣倾向描述输出的兴趣倾向描述,所述已优化兴趣倾向描述是对所述第二兴趣倾向描述进行描述调整得到的信息;基于所述待处理社交话题用户的话题用户类型以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况,确定所述待处理社交话题用户对应的待推送服务项目。
17.在一个可独立实施的设计思路下,所述将所述感兴趣内容集传入至第一目标服务推送识别模型中的前置处理网络,得到所述前置处理网络输出的所述感兴趣内容集的第一兴趣倾向描述和第二兴趣倾向描述,包括:将所述感兴趣内容集传入至所述前置处理网络中包括互相之间存在关联的原始层特征提取单元,得到所述原始层特征提取单元输出的原始层兴趣倾向描述;将所述原始层兴趣倾向描述传入至所述前置处理网络中包括互相之间存在关联
的中间层特征提取单元,得到所述中间层特征提取单元输出的中间层兴趣倾向描述,其中,所述第一兴趣倾向描述为所述中间层兴趣倾向描述;将所述中间层兴趣倾向描述传入至所述前置处理网络中包括互相之间存在关联的优化层特征提取单元,得到所述优化层特征提取单元输出的优化层兴趣倾向描述,其中,所述第二兴趣倾向描述为所述优化层兴趣倾向描述。
18.根据本技术的第二方面,提供一种画像处理服务器,包括:存储器,用于存储可执行的指令;处理器,用于根据所述可执行的指令的控制,运行所述画像处理服务器执行如第一方面任一项所述的方法。
19.根据本技术的一个实施例,在应用上述技术方案时,通过获取待处理社交话题用户浏览的各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段,从而分析区域化分布内容和服务事项浏览时段,并将各个目标可视化服务事项归类到至少一个业务浏览记录中,进而基于服务事项浏览时段,从每个业务浏览记录的目标可视化服务事项中挑选出对应业务浏览记录的可视化服务关键事项,能够筛除待处理社交话题用户在业务互动过程中所浏览的目标可视化服务事项,进而基于可视化服务关键事项的区域化分布内容,将符合设定检测要求的可视化服务关键事项归类至同一服务事项簇,并基于服务事项簇中可视化服务关键事项的区域化分布内容,确定待处理社交话题用户的感兴趣内容集,从而能够在不考虑待处理社交话题用户在业务互动过程中所浏览的目标可视化服务事项的前提下,确定待处理社交话题用户的感兴趣内容集,进而能够提高用户的兴趣画像分析的准确性。
20.此外,由于从每个业务浏览记录的目标可视化服务事项中挑选出对应业务浏览记录的可视化服务关键事项,能够筛除待处理社交话题用户在业务互动过程中所浏览的其他目标可视化服务事项,由此可得,也能够尽可能减少后续用户的兴趣画像分析的运算资源占用,有利于削减处理开销,加快用户的兴趣画像分析速度并减少兴趣画像挖掘耗时。
21.通过以下参照附图对本技术的示例性实施例的详细描述,本技术的其它特征及其优点将会变得清楚。
附图说明
22.被结合在说明书中并构成说明书的一部分的附图示出了本技术的实施例,并且连同其说明一起用于解释本技术的原理。
23.图1是示出可以实现本技术的实施例的画像处理服务器的一种硬件配置的框图。
24.图2是示出可以实现本技术的实施例的画像处理服务器的另一种硬件配置的框图。
25.图3是示出可以实现本技术的实施例的在数字化场景下的大数据用户画像处理方法的流程图。
26.图4是示出可以实现本技术的实施例的在数字化场景下的大数据用户画像处理系统的架构示意图。
具体实施方式
27.现在将参照附图来详细描述本技术的各种示例性实施例。应注意到:除非另外具
体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本技术的范围。
28.以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本技术及其应用或使用的任何限制。
29.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
30.在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
31.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
32.《硬件配置》图1是示出可以实现本技术的实施例的画像处理服务器100的一种硬件配置的框图,画像处理服务器100可以包括处理器110和存储器120,存储器120用于存储可执行的指令,处理器110用于根据可执行的指令的控制,运行画像处理服务器100执行本技术中的在数字化场景下的大数据用户画像处理方法。
33.图2是示出可以实现本技术的实施例的画像处理服务器100的另一种硬件配置的框图,画像处理服务器100可以包括处理器110、存储器120和在数字化场景下的大数据用户画像处理装置400,在数字化场景下的大数据用户画像处理装置400包括至少一个可以软件或固件(firmware)的形式储存于所述存储器120中的软件功能模块,所述处理器110通过运行存储在存储器120内的软件程序以及模块,例如本技术实施例中的在数字化场景下的大数据用户画像处理装置400,从而执行各种功能应用以及数据处理,即实现本技术实施例中的在数字化场景下的大数据用户画像处理方法。
34.《方法实施例》图3是示出可以实现本技术的实施例的在数字化场景下的大数据用户画像处理方法的流程图,在数字化场景下的大数据用户画像处理方法可以通过图1或图2所示的画像处理服务器100实现,进一步可以包括以下步骤所描述的技术方案。
35.步骤11:获取待处理社交话题用户浏览的各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段。
36.在本技术实施例中,目标可视化服务事项(预设的可视化服务事项)可以包括但不限于:身份校验服务事项和页面加载服务事项。相应地,可以在目标可视化服务事项对应的功能模块下配置例如合法网络爬虫等数据信息收集程序,从而对浏览目标可视化服务事项的待处理社交话题用户进行操作行为信息收集,进而获取到待处理社交话题用户浏览目标可视化服务事项的区域化分布内容和服务事项浏览时段。
37.此外,目标可视化服务事项还可以包括但不限于:信息确认服务事项和个性化设置服务事项。相应地,也可以在目标可视化服务事项对应的功能模块下配置数据信息收集程序,从而获取到待处理社交话题用户浏览并关注于目标可视化服务事项的区域化分布内容和服务事项浏览时段,本技术实施例在此不做具体限制。在一个可能的实施场景中,区域化分布内容可以包括目标可视化服务事项的多模态分布描述。例如,区域化分布内容可以理解为可视化界面上的区域信息,而多模态分布描述则通过多个维度/模态/层面对目标可
视化服务事项进行特征表达。因此,本技术实施例的场景可以理解为交互式的可视化场景比如页面场景或者触控屏场景等。
38.在一个可能的实施场景中,为了提高后续用户的兴趣画像分析的准确性,在获取到待处理社交话题用户浏览各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段之后,还可以对获取到的区域化分布内容和服务事项浏览时段进行非优质数据过滤,从而过滤掉一些不符合要求的数据信息。在一个可能的实施场景中,待处理社交话题用户为数字化社交话题客户端,当识别到的客户端数字签名等信息不符合规范,或者,当例如区域化分布内容等关键信息丢失,或者,当区域化分布内容存在异常时,可以将对应的数据数据信息移除,以保证后续进行用户的兴趣画像分析所运用的数据信息的有效性和质量。
39.在另一个可能的实施场景中,为了进一步提高用户的兴趣画像分析的准确性,可以获取预设时段内待处理社交话题用户浏览的各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段,预设时段可以是一分钟、一个小时等等,本技术实施例在此不做具体限制。
40.在又一个可能的实施场景中,为实际应用时,上述所获取到的各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段可能对应有不同的待处理社交话题用户,例如,待处理社交话题用户client1浏览目标可视化服务事项case1时的服务事项浏览时段为20:,待处理社交话题用户client2浏览目标可视化服务事项case1时的服务事项浏览时段为20:01:00等等,由此可得,为了将不同待处理社交话题用户浏览各个目标可视化服务事项时对应的区域化分布内容和服务事项浏览时段进行区分,还可以基于待处理社交话题用户的描述特征进行区分,例如,当待处理社交话题用户为数字化社交话题客户端时,描述特征可以是客户端mac地址和数字化社交话题客户端类别。当待处理社交话题用户为其他类别时,可以以此类推,本技术实施例在此不再一一举例。
41.步骤12:分析区域化分布内容和服务事项浏览时段,将各个目标可视化服务事项归类到至少一个业务浏览记录中。
42.在一个可能的实施场景中,可以按照服务事项浏览时段从远至近的排序次序,将各个目标可视化服务事项进行整理,并获取任意连续目标可视化服务事项对应的服务事项浏览时段的时长差异,若获取到的时长差异大于一设定时长值,则可以认为这两个连续目标可视化服务事项属于不同的业务浏览记录。
43.举例而言,以下为上述的待处理社交话题用户浏览的各个目标可视化服务事项一实施例的示例。例如,待处理社交话题用户client1在从页面p1逐一切换到页面p5的过程中会浏览目标可视化服务事项case1、目标可视化服务事项case2和目标可视化服务事项case3,在按照服务事项浏览时段从远至近的排序次序进行整理后,待处理社交话题用户client1浏览目标可视化服务事项case1的服务事项浏览时段为20:,浏览目标可视化服务事项case2的服务事项浏览时段为20:05:00,浏览目标可视化服务事项case3的服务事项浏览时段为20:10:00,紧接着,浏览目标可视化服务事项case3的服务事项浏览时段为22:00:00,浏览目标可视化服务事项case2的服务事项浏览时段为22:10:00,浏览目标可视化服务事项case1的服务事项浏览时段为22:15:00,可以理解的是,待处理社交话题用户client1两次浏览目标可视化服务事项case3时的时长差异较大,那么可以认为,待处理社交话题用
户client1在服务事项浏览时段20:至20:10:00的时段内浏览的目标可视化服务事项case1、目标可视化服务事项case2、目标可视化服务事项case3可以归类至业务浏览记录list1,而在服务事项浏览时段22:至22:15:00浏览的目标可视化服务事项case3、目标可视化服务事项case2、目标可视化服务事项case1可以归类至业务浏览记录list2。
44.在另一个可能的实施场景中,还可以按照服务事项浏览时段从远至近的排序次序,将各个目标可视化服务事项进行整理,并基于整理后的各个目标可视化服务事项对应的区域化分布内容和服务事项浏览时段,确定待处理社交话题用户浏览各个目标可视化服务事项时的浏览关注度,若整理后的各个目标可视化服务事项中任意连续目标可视化服务事项对应的服务事项浏览时段的时长差异大于设定时长值,且任意连续目标可视化服务事项(相邻的目标可视化服务事项)中至少一个所对应的浏览关注度小于设定关注度阈值,则将任意连续目标可视化服务事项归类至不同的业务浏览记录中。
45.可以理解的是,依旧以上述待处理社交话题用户client1从页面p1逐一切换到页面p5为例,根据各个目标可视化服务事项的区域化分布内容,可以确定出目标可视化服务事项case1和目标可视化服务事项case2之间的量化差异数据为“2”,目标可视化服务事项case2和目标可视化服务事项case3之间的量化差异数据为“5”,则相应地,待处理社交话题用户client1在20:时浏览目标可视化服务事项case1,以及在20:05:00浏览目标可视化服务事项case2时的浏览关注度可以认为是h2.4,在20:10:00时浏览目标可视化服务事项case3时的浏览关注度可以认为是h6.0,而在22:时浏览目标可视化服务事项case3时的浏览关注度可以认为是h0.0,在22:10:00时浏览目标可视化服务事项case2时的浏览关注度可以认为是h3.0,在22:15:00时浏览目标可视化服务事项case1时的浏览关注度可以认为是h2.4,由此可见,在20:10:00时浏览目标可视化服务事项case3以及在22:时浏览目标可视化服务事项case3时的时长差异较大,且两者之间在22:时浏览目标可视化服务事项case3时的浏览关注度较小,说明待处理社交话题用户client1在目标可视化服务事项case3处关注了较长时间,那么可以认为,待处理社交话题用户client1在服务事项浏览时段20:至20:10:00的时段内浏览的目标可视化服务事项case1、目标可视化服务事项case2、目标可视化服务事项case3可以归类至业务浏览记录list1,而在服务事项浏览时段22:至22:15:00浏览的目标可视化服务事项case3、目标可视化服务事项case2、目标可视化服务事项case1可以归类至业务浏览记录list2。
46.在本技术实施例中,量化差异数据用于表征不同目标可视化服务事项之间的差异,比如可以从不同的角度来衡量不同目标可视化服务事项之间的差异,然后通过一个综合值来进行量化表达,在上述示例中,量化差异数据越大,表明不同目标可视化服务事项之间的差异越大。相应的,浏览关注度通过hx.x表示,其中x.x的取值范围可以是0.0~10.0,hx.x的值越小,表明浏览关注度越低。
47.步骤13:基于服务事项浏览时段,从每个业务浏览记录的目标可视化服务事项中挑选出对应业务浏览记录的可视化服务关键事项。
48.在一个可能的实施场景中,在将各个目标可视化服务事项归类到至少一个业务浏览记录中之后,还可以将每个业务浏览记录中,服务事项浏览时段最靠前的目标可视化服务事项作为该业务浏览记录中的起始服务事项,并且将服务事项浏览时段最靠后的目标可视化服务事项作为该业务浏览记录中的终止服务事项,将上述起始服务事项和终止服务事
项作为对应业务浏览记录的可视化服务关键事项。
49.可以理解的是,依旧以上述待处理社交话题用户client1从页面p1逐一切换到页面p5为例,在上述业务浏览记录list1中,可以将目标可视化服务事项case1作为起始服务事项,并将目标可视化服务事项case3作为终止服务事项,换言之,可以将目标可视化服务事项case1和目标可视化服务事项case3作为上述业务浏览记录list1的可视化服务关键事项;而在上述业务浏览记录list2中,可以将目标可视化服务事项case3作为起始服务事项,并将目标可视化服务事项case1作为终止服务事项,换言之,可以将目标可视化服务事项case1和目标可视化服务事项case3作为业务浏览记录list2的可视化服务关键事项,从而能够筛除待处理社交话题用户在在业务互动过程中所浏览的其他目标可视化服务事项,将筛分得到的可视化服务关键事项作为后续用户的兴趣画像分析的分析依据。其他情况可以以此类推,本技术实施例在此不再一一举例。
50.步骤14:基于可视化服务关键事项的区域化分布内容,将符合设定检测要求的可视化服务关键事项归类至同一服务事项簇。
51.在一个可能的实施场景中,可以基于可视化服务关键事项的区域化分布内容,进行特征分析从而实现聚类处理(比如可以通过k均值聚类算法实现),将量化差异数据较为接近的可视化服务关键事项归类至同一服务事项簇(服务事项集合)。依旧以上述待处理社交话题用户client1从页面p1逐一切换到页面p5为例,可以将业务浏览记录list1和业务浏览记录list2中,目标可视化服务事项case1对应的可视化服务关键事项归类至服务事项簇cluster1,而将目标可视化服务事项case3对应的可视化服务关键事项归类至服务事项簇cluster2。
52.此外,在实际应用过程中,待处理社交话题用户client1的业务浏览记录还可能存在从页面p1逐渐切换到页面p4或者页面p6的情况,例如,还可能归类得到一个业务浏览记录list3,包括目标可视化服务事项case1对应的可视化服务关键事项和页面p4或者页面p6附近的目标可视化服务事项case4,此时可以将目标可视化服务事项case4对应的可视化服务关键事项归类至服务事项簇cluster3;或者,当目标可视化服务事项case4对应的可视化服务关键事项与目标可视化服务事项case3对应的可视化服务关键事项较为类似时,还可以将目标可视化服务事项case4对应的可视化服务关键事项也归类至服务事项簇cluster2中。其他情况可以以此类推,本技术实施例在此不再一一举例。
53.步骤15:基于服务事项簇中可视化服务关键事项的区域化分布内容,确定待处理社交话题用户的感兴趣内容集。
54.在一个可能的实施场景中,可以基于服务事项簇中所有可视化服务关键事项的区域化分布内容,获取服务事项簇中所有可视化服务关键事项的关联事项集,将该关联事项集作为待处理社交话题用户的感兴趣内容集,并确定关联事项集的基准,以及与该基准的关联程度最高的可视化服务关键事项,将最类似的可视化服务关键事项对应的目标可视化服务事项的服务事项主题作为该感兴趣内容集的概括型主题(比如可以是内容集的名称)。例如,与关联事项集最类似的可视化服务关键事项对应的目标可视化服务事项为目标可视化服务事项case1,则将目标可视化服务事项case1的服务事项主题(例如,xxx服务)作为感兴趣内容集的概括型主题。
55.在另一个可能的实施场景中,还可以基于服务事项簇中所有可视化服务关键事项
的区域化分布内容,获取所有可视化服务关键事项的热点信息,并确定与该热点信息最类似的可视化服务关键事项,以及类似程度最低的可视化服务关键事项,以上述热点信息为基准,以类似程度最低的可视化服务关键事项与该热点信息的化差异数据为约束的内容集作为待处理社交话题用户的感兴趣内容集,并以最类似的可视化服务关键事项对应的目标可视化服务事项的服务事项主题作为感兴趣内容集的概括型主题。例如,最类似的可视化服务关键事项对应的目标可视化服务事项为目标可视化服务事项case1,则将目标可视化服务事项case1的服务事项主题(例如,xxx服务)作为感兴趣内容集的概括型主题。
56.可以理解的是,依旧以上述待处理社交话题用户client1为例,最后获取到包括目标可视化服务事项case1对应的可视化服务关键事项的服务事项簇cluster1,包括目标可视化服务事项case3对应的可视化服务关键事项的服务事项簇cluster2,以及包括目标可视化服务事项case4对应的可视化服务关键事项的服务事项簇cluster3,则可以将以目标可视化服务事项case1为基准,以一个设定范围量化差异数据(例如:“4”)为约束的内容集作为待处理社交话题用户client1的感兴趣内容集,并将目标可视化服务事项case1的服务事项主题(例如:xxx服务)作为该感兴趣内容集的概括型主题;可以将以目标可视化服务事项case3为基准,以一设定范围量化差异数据(例如:“4”)为约束的内容集作为待处理社交话题用户client1的另一感兴趣内容集,并将目标可视化服务事项case3的服务事项主题(例如:xxx功能)作为该感兴趣内容集的概括型主题;可以将以目标可视化服务事项case4为基准,以一设定范围量化差异数据(例如:“4”)为约束的内容集作为待处理社交话题用户client1的又一感兴趣内容集,并将目标可视化服务事项case4的服务事项主题(例如:xxx页面)作为该感兴趣内容集的概括型主题。其他情况可以以此类推,本技术实施例在此不再一一举例。
57.在应用上述技术方案时,通过获取待处理社交话题用户浏览的各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段,从而分析区域化分布内容和服务事项浏览时段,并将各个目标可视化服务事项归类到至少一个业务浏览记录中,进而基于服务事项浏览时段,从每个业务浏览记录的目标可视化服务事项中挑选出对应业务浏览记录的可视化服务关键事项,能够筛除待处理社交话题用户在业务互动过程中所浏览的目标可视化服务事项,进而基于可视化服务关键事项的区域化分布内容,将符合设定检测要求的可视化服务关键事项归类至同一服务事项簇,并基于服务事项簇中可视化服务关键事项的区域化分布内容,确定待处理社交话题用户的感兴趣内容集,从而能够在不考虑待处理社交话题用户在业务互动过程中所浏览的目标可视化服务事项的前提下,确定待处理社交话题用户的感兴趣内容集,进而能够提高用户的兴趣画像分析的准确性。
58.此外,由于从每个业务浏览记录的目标可视化服务事项中挑选出对应业务浏览记录的可视化服务关键事项,能够筛除待处理社交话题用户在业务互动过程中所浏览的其他目标可视化服务事项,由此可得,也能够尽可能减少后续用户的兴趣画像分析的运算资源占用,有利于削减处理开销,加快用户的兴趣画像分析速度并减少兴趣画像挖掘耗时。
59.请参阅以下内容,是图1中步骤14一实施例进一步描述。在本技术实施例中,区域化分布内容可以包括多模态分布描述,具体可以包括如下步骤。
60.步骤141:将多模态分布描述相同的可视化服务关键事项归类至同一服务事项簇。
61.在一个可能的实施场景中,为了降低后续运算开销,提高用户画像分析速度,还可
以将多模态分布描述相同的可视化服务关键事项整合为一个服务事项簇,并记录该服务事项簇所包含的可视化服务关键事项的数目,以便后续分析使用。
62.步骤142:获取其中两个服务事项簇之间的第一量化差异数据。
63.可以理解的是,可以将服务事项簇中可视化服务关键事项的多模态分布描述的全局化分析结果(可以基于平均值思想进行处理)作为服务事项簇的热点服务事项的多模态分布描述,并基于其中两个服务事项簇的热点服务事项的多模态分布描述,确定其中两个服务事项簇之间的第一量化差异数据。
64.在一个可能的实施场景中,为了降低运算开销,可以将多模态分布描述相同的可视化服务关键事项整合为一个服务事项簇,并记录服务事项簇所包含的可视化服务关键事项的数目,此时在获取服务事项簇的服务事项热点的多模态分布描述时,可以确定服务事项簇的多模态分布描述与对应的数目之间的加权结果,以及与未整合的可视化服务关键事项的多模态分布描述之间的第一融合结果,并确定服务事项簇的数目以及未整合的可视化服务关键事项的数目之间的第二融合结果,最后将上述第一融合结果和第二融合结果之间的比较结果(比如商)作为服务事项簇的热点服务事项的多模态分布描述。在本技术实施例中,多模态分布描述可以是特征向量或者特征图。
65.步骤143:将第一量化差异数据小于等于第一设定量化差异阈值的其中两个服务事项簇整合为同一服务事项簇。
66.在实际应用过程中,其中两个服务事项簇之间的第一量化差异数据可能存在较小的情况,换言之,其中两个服务事项簇可能存在较为类似的情况,此时,可以设置一个第一设定量化差异阈值(例如:“4”),若其中两个服务事项簇之间的第一量化差异数据小于或等于第一设定量化差异阈值,则可以将两者进行整合,直至其中两个服务事项簇之间的第一量化差异数据大于第一设定量化差异阈值为止。
67.在一个可能的实施场景中,通过上述服务事项簇的整合之后,实际上会扩大服务事项簇的范围,为了提高感兴趣内容集的准确性,还可以对上述整合结果进行改进。可以理解的是,可以抽取当前服务事项簇中与当前服务事项簇的热点服务事项之间的第二量化差异数据大于第二设定量化差异阈值(例如:“1.5”)的可视化服务关键事项,若抽取的可视化服务关键事项与其他服务事项簇的热点服务事项之间的第三量化差异数据小于等于第三设定量化差异阈值(例如:“4”),则可以将抽取的可视化服务关键事项整合至其他服务事项簇,否则,可以将抽取的可视化服务关键事项作为另外的服务事项簇,上述方式,可以进一步改进量化差异数据范围过大的服务事项簇,使得后续的用户的兴趣画像分析更加准确。此外,在本技术实施例中,第一设定量化差异阈值、第二设定量化差异阈值,以及第三设定量化差异阈值可以根据实际情况进行设置,本技术实施例在此不做具体限制。
68.区别于前述实施例,通过将多模态分布描述相同的可视化服务关键事项归类至同一服务事项簇,并获取其中两个服务事项簇之间的第一量化差异数据,从而将第一量化差异数据小于等于第一设定量化差异阈值的其中两个服务事项簇整合为同一服务事项簇,能够将量化差异数据较为接近的可视化服务关键事项整合至同一服务事项簇,从而有利于合理性地限制后续获得的感兴趣内容集的范围,使得获取到的感兴趣内容集更准确,且更具参考价值。
69.请参阅以下内容,是图1中步骤15一实施例的进一步说明。具体可以包括如下步
骤。
70.步骤151:获取到服务事项簇的热点服务事项量化差异数据最小的第一可视化服务关键事项,以及到服务事项簇的热点服务事项量化差异数据最大的第二可视化服务关键事项。
71.获取服务事项簇的热点服务事项的具体实施过程可以参阅上述实施例中的相关步骤,本技术实施例在此不再赘述。
72.步骤152:获取第一可视化服务关键事项对应的目标可视化服务事项的服务事项主题,并获取第二可视化服务关键事项到服务事项簇的热点服务事项之间的第四量化差异数据。
73.目标可视化服务事项的服务事项主题可以是用户事先设置的,例如,目标可视化服务事项与xxx页面较为类似,则可以将该目标可视化服务事项命名为xxx页面,或者,目标可视化服务事项量化差异数据xxx服务较为类似,则可以将该目标可视化服务事项命名为xxx服务,或者,目标可视化服务事项与xxx功能较为类似,则可以将该目标可视化服务事项命名为xxx功能,本技术实施例在此不再一一举例。
74.步骤153:将以服务事项簇的热点服务事项为基准,以第四量化差异数据为约束的候选服务事项集作为待处理社交话题用户的感兴趣内容集,并将第一可视化服务关键事项对应的目标可视化服务事项的服务事项主题作为感兴趣内容集的概括型主题。
75.以服务事项簇的热点服务事项为基准,以第四量化差异数据为约束的候选服务事项集作为待处理社交话题用户的感兴趣内容集,并且将第一可视化服务关键事项对应的目标可视化服务事项的服务事项主题作为感兴趣内容集的概括型主题。
76.区别于前述实施例,通过获取到服务事项簇的热点服务事项量化差异数据最小的第一可视化服务关键事项,以及到服务事项簇的热点服务事项量化差异数据最大的第二可视化服务关键事项,并获取第一可视化服务关键事项对应的目标可视化服务事项的服务事项主题,以及第二可视化服务关键事项到服务事项簇的热点服务事项之间的第四量化差异数据,从而将以服务事项簇的热点服务事项为基准,以第四量化差异数据为约束的候选服务事项集作为待处理社交话题用户的感兴趣内容集,并将第一可视化服务关键事项对应的目标可视化服务事项的服务事项主题作为感兴趣内容集的概括型主题,能够使用户直观地获得待处理社交话题用户的感兴趣内容集,有利于提高后续进一步的画像挖掘处理。
77.请参阅如下内容,是本技术在数字化场景下的大数据用户画像处理方法另一实施例的技术方案。具体而言,可以包括如下步骤。
78.步骤51:获取待处理社交话题用户浏览的各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段。
79.进一步请参阅上述实施例中的相关步骤。
80.步骤52:分析区域化分布内容和服务事项浏览时段,将各个目标可视化服务事项归类到至少一个业务浏览记录中。
81.进一步请参阅上述实施例中的相关步骤。
82.步骤53:基于服务事项浏览时段,从每个业务浏览记录的目标可视化服务事项中挑选出对应业务浏览记录的可视化服务关键事项。
83.进一步请参阅上述实施例中的相关步骤。
84.步骤54:基于可视化服务关键事项的区域化分布内容,将符合设定检测要求的可视化服务关键事项归类至同一服务事项簇。
85.进一步请参阅上述实施例中的相关步骤。
86.步骤55:基于服务事项簇中可视化服务关键事项的区域化分布内容,确定待处理社交话题用户的感兴趣内容集。
87.进一步请参阅上述实施例中的相关步骤。
88.步骤56:基于待处理社交话题用户的感兴趣内容集内的可视化服务关键事项的服务事项浏览时段,获取感兴趣内容集的内容集特征。
89.在本技术实施例中,内容集特征可以包括:服务事项激活累计值、服务事项激活时长、服务事项激活时序描述、服务事项激活认证记录、感兴趣时段。
90.可以理解的是,可以获取感兴趣内容集内可视化服务关键事项中的起始服务事项的服务事项浏览时段的统计学中值(中位数),作为感兴趣内容集的内容集关注转移时刻,并获取感兴趣内容集内可视化服务关键事项中的终止服务事项的服务事项浏览时段的统计学中值,作为感兴趣内容集的内容集关注触发时刻,并将内容集关注触发时刻和内容集关注转移时刻之间的时段作为感兴趣内容集的感兴趣时段。依旧以上述待处理社交话题用户client1为例,可以确定感兴趣内容集“xxx服务”的内容集关注触发时刻为22:15:00,内容集关注转移时刻为20:,以及感兴趣内容集“xxx功能”的内容集关注触发时刻为20:10:00,内容集关注转移时刻为22:00:00,则感兴趣内容集“xxx服务”的感兴趣时段为22:15:00至20:00:00,而感兴趣内容集“xxx功能”感兴趣时段为20:10:00至22:。
91.可以理解的是,还可以记录感兴趣内容集内所有可视化服务关键事项的激活累计值之和,作为感兴趣内容集的服务事项激活累计值,依旧以上述待处理社交话题用户client1为例,可以确定感兴趣内容集“xxx服务”的服务事项激活累计值为一周内15次,感兴趣内容集“xxx功能”的服务事项激活累计值为一周内15次,感兴趣内容集“xxx页面”的服务事项激活累计值为一周内5次。
92.可以理解的是,还可以记录感兴趣内容集内所有可视化服务关键事项的激活时长之和,作为感兴趣内容集的服务事项激活时长,依旧以上述待处理社交话题用户client1为例,可以确定感兴趣内容集“xxx服务”的服务事项激活累计值为一周内激活3h,感兴趣内容集“xxx功能”的服务事项激活累计值为一周内激活2h,感兴趣内容集“xxx页面”的服务事项激活累计值为一周内激活1h。
93.可以理解的是,还可以记录感兴趣内容集内所有可视化服务关键事项的激活日志,作为感兴趣内容集的服务事项激活时序描述,依旧以上述待处理社交话题用户client1为例,可以确定感兴趣内容集“xxx服务”的服务事项激活时序描述为2019年7月1日至2019年7月31日,感兴趣内容集“xxx功能”的服务事项激活时序描述为2019年7月1日至2019年7月31日的非节假日,感兴趣内容集“xxx页面”的服务事项激活时序描述为2019年7月8日(礼拜五),以及2019年7月23日(礼拜六)。
94.可以理解的是,还可以记录感兴趣内容集内所有可视化服务关键事项的激活时间,作为感兴趣内容集的服务事项激活认证记录,依旧以上述待处理社交话题用户client1为例,可以确定感兴趣内容集“xxx服务”的服务事项激活认证记录2019年7月1日至2019年7月31日,且相关事件汇集在19:55:00至20:05:00之间,以及22:10:00至22:22:00之间,而感
兴趣内容集“xxx功能”的服务事项激活认证记录为2019年7月1日至2019年7月31日的非节假日,且相关事件汇集在20:05:00至20:15:00之间,以及22:05:00至22:15:00之间,而感兴趣内容集“xxx页面”的服务事项激活认证记录为2019年7月8日08:00:00,以及2019年7月8日13:00:00,以及2019年7月23日08:05:00,以及2019年7月8日14:00:00。
95.上述相关年月日以及时间仅仅作为示例,在具体应用时,可以是其他日期及时间,本技术实施例并不因此而具体限制相关年月日及时间。
96.步骤57:基于感兴趣内容集的内容集特征,确定两个待处理社交话题用户之间的社交网络联系。
97.在本技术实施例中,可以基于服务事项激活累计值、服务事项激活时长和感兴趣时段,确定感兴趣内容集的内容集类别。在本技术实施例中,内容集类别可以包括:热门时段感兴趣内容集、冷门时段感兴趣内容集、即兴感兴趣内容集。
98.在一个可能的实施场景中,当服务事项激活时长的比例超过一设定占比值时,则可以确定感兴趣内容集为非即兴感兴趣内容集,若非即兴感兴趣内容集的感兴趣时段位于社群互动时段时,则可以确定非即兴感兴趣内容集为热门时段感兴趣内容集,反之,若非即兴感兴趣内容集的感兴趣时段位于非社群互动时段时,则可以确定非即兴感兴趣内容集为冷门时段感兴趣内容集。
99.依旧以上述待处理社交话题用户client1为例,感兴趣内容集“xxx服务”的服务事项激活时长在其记录时间(2019年7月份)内的比例为90%,超过设定占比值(例如:40%),则可以确定感兴趣内容集“xxx服务”为非即兴感兴趣内容集,且感兴趣内容集“xxx功能”的服务事项激活时长在其记录时间(2019年7月份)内的比例为60%,超过设定占比值(例如:40%),则可以确定感兴趣内容集“xxx功能”为非即兴感兴趣内容集。进一步地,感兴趣内容集“xxx服务”的感兴趣时段(22:15:00至20:00:00 1)位于非社群互动时段,则可以确定感兴趣内容集“xxx服务”为冷门时段感兴趣内容集;感兴趣内容集“xxx功能”的感兴趣时段(20:10:00至22:00:00)位于社群互动时段,则可以确定感兴趣内容集“xxx功能”为热门时段感兴趣内容集。
100.在另一可能的实施场景中,当服务事项激活时长的比例低于一设定占比值,且服务事项激活累计值低于一设定累计值时,可以确定感兴趣内容集为即兴感兴趣内容集。依旧以上述待处理社交话题用户client1为例,感兴趣内容集“xxx页面”的服务事项激活时长在其记录时间(2019年7月份)的比例为20%,低于设定占比值(例如:40%),且服务事项激活累计值低于一设定累计值(例如:15次),则可以确定感兴趣内容集“xxx页面”为即兴感兴趣内容集。此外,在确定感兴趣内容集是否为即兴感兴趣内容集时,还可以进一步分析服务事项激活认证记录,若根据分析结果,服务事项激活无规律可循,则可以确定感兴趣内容集为即兴感兴趣内容集。
101.在本技术实施例中,若两个待处理社交话题用户的即兴感兴趣内容集的服务事项的激活认证记录相似性和内容集相似性符合第一设定指标,则确定社交网络联系为即时交互联系。在一个可能的实施场景中,第一设定指标可以包括:服务事项的激活认证记录相似性大于第一设定相似性阈值,且内容集相似性大于第二设定相似性阈值。
102.依旧以上述待处理社交话题用户client1为例,此外,除了待处理社交话题用户client1,还获取到待处理社交话题用户client2的即兴感兴趣内容集“xxx页面”,且该感兴
趣内容集的服务事项激活认证记录为2019年7月8日08:01:00,以及2019年7月8日13:10:00,以及2019年7月23日08:00:00,以及2019年7月8日14:05:00,由此可见,待处理社交话题用户client1和待处理社交话题用户client2的即兴感兴趣内容集无论是服务事项激活认证记录,还是感兴趣内容集都大范围地重复,故可以确定待处理社交话题用户client1和待处理社交话题用户client2存在即时交互联系。
103.在本技术实施例中,若两个待处理社交话题用户的热门时段感兴趣内容集的服务事项激活时序描述相似性和内容集相似性符合第二设定指标,且两个待处理社交话题用户的冷门时段感兴趣内容集的服务事项激活时序描述相似性和内容集相似性符合第二设定指标,则确定社交网络联系为全时段持续性交互联系。在一个可能的实施场景中,第二设定指标可以包括:服务事项激活时序描述相似性大于第三设定相似性阈值,且内容集相似性大于第四设定相似性阈值。依旧以上述待处理社交话题用户client1和待处理社交话题用户client2为例,待处理社交话题用户client2还存在热门时段感兴趣内容集“xxx功能”和冷门时段感兴趣内容集“xxx服务”,且热门时段感兴趣内容集“xxx功能”的服务事项激活时序描述为2019年7月1日至2019年7月31日的非节假日,冷门时段感兴趣内容集“xxx服务”的服务事项激活时序描述为2019年7月1日至2019年7月31日,由此可见,待处理社交话题用户client1和待处理社交话题用户client2的热门时段感兴趣内容集无论是服务事项激活时序描述,还是感兴趣内容集都大范围地重复,且待处理社交话题用户client1和待处理社交话题用户client2的冷门时段感兴趣内容集无论是服务事项激活时序描述,还是感兴趣内容集也都大范围地重复,故可以确定待处理社交话题用户client1和待处理社交话题用户client2存在全时段持续性交互联系(比如热门时段 冷门时段)。
104.在本技术实施例中,还可以定位服务事项激活认证记录在闲置时段之内的即兴感兴趣内容集,作为闲置即兴内容集,若两个待处理社交话题用户的闲置即兴内容集的服务事项的激活认证记录相似性大于第五设定相似性阈值,且内容集相似性大于第六设定相似性阈值,则确定社交网络联系为闲置时段即时交互联系。依旧以上述待处理社交话题用户client1和待处理社交话题用户client2为例,两者的即兴感兴趣内容集“xxx页面”符合服务事项激活认证记录在闲置时段之内,则可以将其作为闲置即兴内容集,且两者之间的服务事项激活认证记录,以及感兴趣内容集都大范围地重复,由此可得,还可以确定待处理社交话题用户client1和待处理社交话题用户client2为闲置时段即时交互联系。
105.上述第一设定相似性阈值、第二设定相似性阈值、第三设定相似性阈值、第四设定相似性阈值、第五设定相似性阈值,以及第六设定相似性阈值可以根据实际应用情况进行设置,本技术实施例在此不做具体限制。
106.区别于前述实施例,通过基于待处理社交话题用户的感兴趣内容集内的可视化服务关键事项的服务事项浏览时段,获取感兴趣内容集的内容集特征,从而基于感兴趣内容集的内容集特征,确定两个待处理社交话题用户之间的社交网络联系,能够根据待处理社交话题用户的感兴趣内容集进一步确定其中两个待处理社交话题用户之间是否存在社交网络联系(关联关系),进而能够实现智能化的用户兴趣画像分析。
107.在一个可能的且可独立实施的场景中,在步骤15所描述的基于服务事项簇中可视化服务关键事项的区域化分布内容,确定待处理社交话题用户的感兴趣内容集之后,还可以包括以下技术方案。
108.步骤161:将所述感兴趣内容集传入至第一目标服务推送识别模型中的前置处理网络,得到所述前置处理网络输出的所述感兴趣内容集的第一兴趣倾向描述和第二兴趣倾向描述。
109.在本技术实施例中,所述前置处理网络包括互相之间存在关联的多个特征提取单元,所述第一兴趣倾向描述是所述互相之间存在关联的多个特征提取单元中的除最后一个特征提取单元之外的的特征提取单元输出的兴趣倾向描述,所述第二兴趣倾向描述是所述互相之间存在关联的多个特征提取单元中的最后一个的特征提取单元输出的兴趣倾向描述。
110.例如,服务推送识别模型可以是神经网络模型,前置处理网络可以是预处理模块,特征提取单元可以是卷积单元,互相之间存在关联的多个特征提取单元可以是级联的卷积单元。
111.步骤162:将所述第二兴趣倾向描述传入至所述第一目标服务推送识别模型中的候选服务粗筛网络,得到所述候选服务粗筛网络输出的目标粗筛结果。
112.在本技术实施例中,所述目标粗筛结果为在所述感兴趣内容集中识别到的待处理社交话题用户所匹配的粗筛结果。
113.步骤163:将所述第一兴趣倾向描述、所述第二兴趣倾向描述和第三兴趣倾向描述以及所述目标粗筛结果传入至所述第一目标服务推送识别模型中的候选服务精筛网络,得到所述候选服务精筛网络输出的所述待处理社交话题用户的话题用户类型以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况。
114.在本技术实施例中,所述第三兴趣倾向描述是所述候选服务粗筛网络中的特征提取单元根据已优化兴趣倾向描述输出的兴趣倾向描述,所述已优化兴趣倾向描述是对所述第二兴趣倾向描述进行描述调整得到的信息。例如,已优化兴趣倾向描述可以是重构的兴趣倾向描述。
115.步骤164:基于所述待处理社交话题用户的话题用户类型以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况,确定所述待处理社交话题用户对应的待推送服务项目。
116.例如,可以基于所述待处理社交话题用户的话题用户类型以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况,并结合感兴趣内容集中的感兴趣内容,从相关的服务项目中确定出待推送服务项目。待推送服务项目包括但不限于购物服务、游戏服务、业务办理服务等。
117.采用第一目标服务推送识别模型进行分析的方式,对感兴趣内容集进行预处理后进行多方针待推送服务挖掘,从而得到感兴趣内容集中的待处理社交话题用户所匹配的粗筛结果,以及待处理社交话题用户的话题用户类型以及待处理社交话题用户的关注内容在感兴趣内容集中的分布情况,这样可以通过对候选服务先后进行粗筛和精筛,进而确保得到的待处理社交话题用户的话题用户类型以及待处理社交话题用户的关注内容在感兴趣内容集中的分布情况的准确性和可信度,这样可以通过待处理社交话题用户的话题用户类型以及待处理社交话题用户的关注内容在感兴趣内容集中的分布情况准确可靠地确定出待推送服务项目,提高后续待推送服务项目的推送效率,避免低效推送带来的网络资源浪费。
118.在一些可能的实施例中,所述将所述感兴趣内容集传入至第一目标服务推送识别模型中的前置处理网络,得到所述前置处理网络输出的所述感兴趣内容集的第一兴趣倾向描述和第二兴趣倾向描述,包括:将所述感兴趣内容集传入至所述前置处理网络中包括互相之间存在关联的原始层特征提取单元,得到所述原始层特征提取单元输出的原始层兴趣倾向描述;将所述原始层兴趣倾向描述传入至所述前置处理网络中包括互相之间存在关联的中间层特征提取单元,得到所述中间层特征提取单元输出的中间层兴趣倾向描述,其中,所述第一兴趣倾向描述为所述中间层兴趣倾向描述;将所述中间层兴趣倾向描述传入至所述前置处理网络中包括互相之间存在关联的优化层特征提取单元,得到所述优化层特征提取单元输出的优化层兴趣倾向描述,其中,所述第二兴趣倾向描述为所述优化层兴趣倾向描述。
119.例如,原始层特征提取单元、中间层特征提取单元和优化层特征提取单元分别可以理解为第一层特征提取单元、第二层特征提取单元和第三层特征提取单元。可以理解,原始层特征提取单元、中间层特征提取单元和优化层特征提取单元互相级联,如此一来,能够基于不同的特征提取单元进行特征提取处理,从而确保第一兴趣倾向描述和第二兴趣倾向描述的可靠性和完整性。
120.在一些可能的实施例中,所述原始层兴趣倾向描述的描述维度小于所述中间层兴趣倾向描述的描述维度,所述原始层兴趣倾向描述的模态数小于所述中间层兴趣倾向描述的模态数,所述中间层兴趣倾向描述的描述维度等于所述优化层兴趣倾向描述的描述维度,所述中间层兴趣倾向描述的模态数大于所述优化层兴趣倾向描述的模态数。
121.在一些可能的实施例中,所述第二兴趣倾向描述传入至所述第一目标服务推送识别模型中的候选服务粗筛网络,得到所述候选服务粗筛网络输出的目标粗筛结果,包括:将所述第二兴趣倾向描述传入至所述候选服务粗筛网络中的描述优化单元,得到所述描述优化单元输出的所述已优化兴趣倾向描述;将所述已优化兴趣倾向描述传入至所述候选服务粗筛网络中的特征提取单元,得到所述候选服务粗筛网络中的特征提取单元输出的所述第三兴趣倾向描述;将所述第三兴趣倾向描述传入至所述候选服务粗筛网络中的第一服务筛分单元,得到所述第一服务筛分单元输出的所述目标粗筛结果。
122.在一些可能的实施例中,将所述第三兴趣倾向描述传入至所述候选服务粗筛网络中的第一服务筛分单元,得到所述第一服务筛分单元输出的所述目标粗筛结果包括:根据所述第三兴趣倾向描述,确定所述待处理社交话题用户所匹配的多个粗筛结果中每个粗筛结果的可信系数(比如可以是置信度);根据所述多个粗筛结果中每个粗筛结果的可信系数,在所述多个粗筛结果中确定出所述目标粗筛结果。
123.在一些可能的实施例中,所述第一兴趣倾向描述、所述第二兴趣倾向描述和第三兴趣倾向描述以及所述目标粗筛结果传入至所述第一目标服务推送识别模型中的候选服务精筛网络,得到所述候选服务精筛网络输出的所述待处理社交话题用户的话题用户类型以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况,包括:将所述第一兴趣倾向描述、所述第二兴趣倾向描述和所述第三兴趣倾向描述传入至所述候选服务精筛网络中的描述关联单元,得到所述描述关联单元输出的关联化兴趣倾向描述,其中,所述描述关联单元用于将所述第一兴趣倾向描述、所述第二兴趣倾向描述和所述第三兴趣倾向描述调整为第一目标描述维度和目标模态数的兴趣倾向描述,并将调整后的兴趣倾向
描述进行关联,得到所述关联化兴趣倾向描述;将所述关联化兴趣倾向描述传入至所述候选服务精筛网络中的特征提取单元,得到所述候选服务精筛网络中的特征提取单元输出的第四兴趣倾向描述;将所述第四兴趣倾向描述和所述目标粗筛结果传入至所述候选服务精筛网络中的第一差异化分类单元,得到所述第一差异化分类单元输出的第一兴趣倾向分类描述,其中,所述第一差异化分类单元用于在所述第四兴趣倾向描述中获取与所述目标粗筛结果对应的兴趣倾向描述,并将获取到的兴趣倾向描述调整成第二目标描述维度的特征,得到所述第一兴趣倾向分类描述;将所述第一兴趣倾向分类描述传入至所述候选服务精筛网络中的第二服务筛分单元,得到所述第二服务筛分单元输出的所述待处理社交话题用户的话题用户类型以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况。
124.在本技术实施例中,差异化分类单元可以理解为池化模块。如此,可以准确确定所述待处理社交话题用户的话题用户类型以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况。
125.在一些可能的实施例中,所述第一兴趣倾向分类描述传入至所述候选服务精筛网络中的第二服务筛分单元,得到所述第二服务筛分单元输出的所述待处理社交话题用户的话题用户类型以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况,包括:根据所述第一兴趣倾向分类描述,确定所述待处理社交话题用户的多个话题用户类型中每个话题用户类型的可信系数、以及所述待处理社交话题用户的关注内容在所述感兴趣内容集中的多个内容区域中的每个内容区域的可信系数;根据所述多个话题用户类型中每个话题用户类型的可信系数,在所述多个话题用户类型中确定出所话题用户类型,并根据所述待处理社交话题用户的关注内容在所述感兴趣内容集中的多个内容区域中的每个内容区域的可信系数,在所述多个内容区域中确定所述待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况。
126.如此,通过考虑所述待处理社交话题用户的关注内容在所述感兴趣内容集中的多个内容区域中的每个内容区域的可信系数,能够确保待处理社交话题用户的关注内容在所述感兴趣内容集中的分布情况的可信度。
127.《系统实施例》在上述的方法实施例的基础上,本技术实施例还提出了一种系统实施例,也即在数字化场景下的大数据用户画像处理系统,请结合参阅图4,在数字化场景下的大数据用户画像处理系统30可以包括互相通信的画像处理服务器100和社交话题客户端200。进一步地,在数字化场景下的大数据用户画像处理系统30的功能性描述如下。
128.画像处理服务器100通过社交话题客户端200获取待处理社交话题用户浏览的各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段;分析所述区域化分布内容和服务事项浏览时段,将所述各个目标可视化服务事项归类到至少一个业务浏览记录中;基于所述服务事项浏览时段,从每个所述业务浏览记录的目标可视化服务事项中挑选出对应所述业务浏览记录的可视化服务关键事项;基于所述可视化服务关键事项的区域化分布内容,将符合设定检测要求的可视化服务关键事项归类至同一服务事项簇;基于所述服务事项簇中所述可视化服务关键事项的区域化分布内容,确定所述待处理社交话题用户的感兴趣内容集。
129.以上已经结合附图描述了本技术的实施例,根据本实施例,在应用上述技术方案时,通过获取待处理社交话题用户浏览的各个目标可视化服务事项所对应的区域化分布内容和服务事项浏览时段,从而分析区域化分布内容和服务事项浏览时段,并将各个目标可视化服务事项归类到至少一个业务浏览记录中,进而基于服务事项浏览时段,从每个业务浏览记录的目标可视化服务事项中挑选出对应业务浏览记录的可视化服务关键事项,能够筛除待处理社交话题用户在业务互动过程中所浏览的目标可视化服务事项,进而基于可视化服务关键事项的区域化分布内容,将符合设定检测要求的可视化服务关键事项归类至同一服务事项簇,并基于服务事项簇中可视化服务关键事项的区域化分布内容,确定待处理社交话题用户的感兴趣内容集,从而能够在不考虑待处理社交话题用户在业务互动过程中所浏览的目标可视化服务事项的前提下,确定待处理社交话题用户的感兴趣内容集,进而能够提高用户的兴趣画像分析的准确性。
130.此外,由于从每个业务浏览记录的目标可视化服务事项中挑选出对应业务浏览记录的可视化服务关键事项,能够筛除待处理社交话题用户在业务互动过程中所浏览的其他目标可视化服务事项,由此可得,也能够尽可能减少后续用户的兴趣画像分析的运算资源占用,有利于削减处理开销,加快用户的兴趣画像分析速度并减少兴趣画像挖掘耗时。
131.本领域技术人员公知的是,随着诸如大规模集成电路技术的电子信息技术的发展和软件硬件化的趋势,要明确划分计算机系统软、硬件界限已经显得比较困难了。因为,任何操作可以软件来实现,也可以由硬件来实现。任何指令的执行可以由硬件完成,同样也可以由软件来完成。对于某一机器功能采用硬件实现方案还是软件实现方案,取决于价格、速度、可靠性、存储容量、变更周期等非技术性因素。因此,对于电子信息技术领域的普通技术人员来说,更为直接和清楚地描述一个技术方案的方式是描述该方案中的各个操作。在知道所要执行的操作的情况下,本领域技术人员可以基于对所述非技术性因素的考虑直接设计出期望的产品。
132.本技术可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本技术的各个方面的计算机可读程序指令。
133.计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
134.这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计
算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
135.用于执行本技术操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c 等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本技术的各个方面。
136.这里参照根据本技术实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本技术的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
137.这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
138.也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
139.附图中的流程图和框图显示了根据本技术的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
140.以上已经描述了本技术的各实施例,上述说明是示例性的,并非穷尽性的,并且也
不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本技术的范围由所附权利要求来限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献