一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据调用处理方法及其装置、设备、介质、产品与流程

2022-05-31 23:47:06 来源:中国专利 TAG:


1.本技术涉及电商信息技术领域,尤其涉及一种数据调用处理方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。


背景技术:

2.跨境电商平台不同于普通的电商平台,其为每个线上店铺提供一个独立站点,多独立站点分布式运营,因此需要跨境电商平台一般通过集群服务器对海量的独立站点所需的应用服务实现集中统一的管控。
3.众所周知的,电商平台日常产生的各种用户活动数据,依赖于电商平台的消费者用户在各个线上店铺活动产生,包括但不限于用户的行为数据、用户所在的终端设备中的运行性能相关的数据、用户注册数据、用户交易数据、用户交互数据等,均属于用户的活动数据的范畴,此类活动数据类型多样而且散见分布,然而海量的活动数据本身蕴藏着丰富的数据价值,对这些活动数据进行有效的数据挖掘,获得有价值的加工信息,能够为电商平台改善和提升服务品质添砖加瓦。
4.现有技术中,对跨境电商平台的用户活动数据的利用,通常基于某一具体的业务需求而调用,不同的业务需求采用其自身固有的业务逻辑对平台内产生的某些类别的活动数据进行利用,最终导致电商平台的数据的熵增,导致产生各种各样的垃圾数据,降低电商平台的运行效率和服务体验。
5.本技术人长期从事跨境电商平台相关技术的研发,因此,尝试对现有技术中存在的问题做出行之有效的探索。


技术实现要素:

6.本技术的首要目的在于解决上述问题至少之一而提供一种数据调用处理方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
7.为满足本技术的各个目的,本技术采用如下技术方案:
8.适应本技术的目的之一而提供的一种数据调用处理方法,包括如下步骤:
9.接收电商平台的多个独立站点采集的目标数据,所述目标数据为电商平台消费者用户对应产生的活动数据,由电商平台的集群服务器分发至各个所述的独立站点中运行的数据采集插件负责采集,该数据采集插件工作于第一协议层;
10.由工作于第二协议层的数据优化模块根据第三协议层所需的数据格式对所述目标数据进行数据预处理并持久化至数据库,以供第三协议层的数据封装模块调用;
11.由工作于第三协议层的数据封装模块对所述数据库中的目标数据进行数据挖掘,以根据所述目标数据中生成适配电商平台的消费者用户的画像标签及其对应的属性数据;
12.响应工作于第四协议层的预设应用服务的调用指令,为该预设应用服务执行对所述画像标签及其对应的属性数据的调用输出,使所述预设应用服务根据电商平台中的独立站点产生的消费者用户的活动数据而确定其画像标签,而实现预设的下游任务。
13.扩展的实施例中,接收电商平台的多个独立站点采集的目标数据的步骤之前,包括如下步骤:
14.响应所述电商平台中的任意独立站点的数据采集插件配置请求,向该独立站点分发相应的数据采集插件,将其配置于该独立站点的后台中运行;
15.将该配置了数据采集插件的独立站点注册至配置信息库中;
16.获取该配置了数据采集插件的独立站点发送的目标数据接入请求,查询所述配置信息库是否存在该独立站点,若存在该独立站点,向该独立站点发送目标数据传输令牌,以在该独立站点传输其目标数据时根据该目标数据携带的所述数据传输令牌而接收该目标数据。
17.深化的实施例中,由工作于第三协议层的数据封装模块对所述数据库中的目标数据进行数据挖掘,以根据所述目标数据中生成适配电商平台的消费者用户的画像标签及其对应的属性数据,包括如下步骤:
18.由所述数据封装模块中的数据建模子模块对所述目标数据进行数据抽象,将所述目标数据处理为标准格式规范,使每个目标数据包括多个属性数据;
19.由所述数据封装模块中的数据画像子模块对所述目标数据进行数据聚合,以获得所述目标数据相对应的画像标签,构成画像标签集;
20.根据所述画像标签集中的画像标签与所述目标数据中的属性数据的对应关系构造出映射关系数据集,以供预设应用服务调用。
21.扩展的实施例中,响应工作于第四协议层的预设应用服务的调用指令,为该预设应用服务执行对所述画像标签及其对应的属性数据的调用输出的步骤之后,包括如下步骤:
22.由所述预设应用服务调用所述画像标签及其属性数据构成训练样本,对神经网络分类模型实施训练,将其训练至收敛状态,其中,所述画像标签用作该神经网络分类模型对所述属性数据进行分类预测的监督标签;
23.由所述预设应用服务启用已被训练至收敛状态的所述神经网络分类模型使其适于对输入其中的加工数据进行推理以确定相应的画像标签;
24.由所述预设应用服务接收任意独立站点提交的消费者用户的活动数据,调用所述数据优化模块进行数据预处理后进行分词获得分词集,构造出该分词集相对应的编码信息;
25.由所述预设应用服务调用所述神经网络分类模型对所述编码信息进行表示学习并分类,获得该编码信息相对应的画像标签并向提交该活动数据的独立站点返回。
26.变通扩展的一种实施例中,获得该编码信息相对应的画像标签并向提交该活动数据的独立站点返回的步骤之后,包括如下步骤:
27.由所述独立站点根据预设应用服务所返回的画像标签搜索相应的商品项,获得由该些商品项构成的商品列表;
28.将所述商品列表输出至产生据以确定该画像标签的活动数据的消费者用户的图形用户界面显示。
29.变通扩展的另一实施例中,获得该编码信息相对应的画像标签并向提交该活动数据的独立站点返回的步骤之后,包括如下步骤:
30.由所述独立站点判断预设应用服务所返回的画像标签是否属于预设的违规标签,若属于违规标签,阻断产生据以确定该画像标签的活动数据的消费者用户的访问事件。
31.适应本技术的目的之一而提供的一种数据调用处理装置,包括:数据采集单元、数据优化单元、数据画像单元,以及数据调用单元,其中,所述数据采集单元,用于接收电商平台的多个独立站点采集的目标数据,所述目标数据为电商平台消费者用户对应产生的活动数据,由电商平台的集群服务器分发至各个所述的独立站点中运行的数据采集插件负责采集,该数据采集插件工作于第一协议层;所述数据优化单元,用于由工作于第二协议层的数据优化模块根据第三协议层所需的数据格式对所述目标数据进行数据预处理并持久化至数据库,以供第三协议层的数据封装模块调用;所述数据画像单元,用于由工作于第三协议层的数据封装模块对所述数据库中的目标数据进行数据挖掘,以根据所述目标数据中生成适配电商平台的消费者用户的画像标签及其对应的属性数据;所述数据调用单元,用于响应工作于第四协议层的预设应用服务的调用指令,为该预设应用服务执行对所述画像标签及其对应的属性数据的调用输出,使所述预设应用服务根据电商平台中的独立站点产生的消费者用户的活动数据而确定其画像标签,而实现预设的下游任务。
32.扩展的实施例中,本技术的数据调用处理装置,还包括:请求响应单元,用于响应所述电商平台中的任意独立站点的数据采集插件配置请求,向该独立站点分发相应的数据采集插件,将其配置于该独立站点的后台中运行;站点注册单元,用于将该配置了数据采集插件的独立站点注册至配置信息库中;鉴权处理单元,用于获取该配置了数据采集插件的独立站点发送的目标数据接入请求,查询所述配置信息库是否存在该独立站点,若存在该独立站点,向该独立站点发送目标数据传输令牌,以在该独立站点传输其目标数据时根据该目标数据携带的所述数据传输令牌而接收该目标数据。
33.深化的实施例中,所述数据画像单元,包括:建模子单元,被配置为由所述数据封装模块中的数据建模子模块对所述目标数据进行数据抽象,将所述目标数据处理为标准格式规范,使每个目标数据包括多个属性数据;聚合子单元,被配置为由所述数据封装模块中的数据画像子模块对所述目标数据进行数据聚合,以获得所述目标数据相对应的画像标签,构成画像标签集;映射子单元,被配置为根据所述画像标签集中的画像标签与所述目标数据中的属性数据的对应关系构造出映射关系数据集,以供预设应用服务调用。
34.扩展的实施例中,本技术的数据调用处理装置,还包括:模型训练单元,被配置为由所述预设应用服务调用所述画像标签及其属性数据构成训练样本,对神经网络分类模型实施训练,将其训练至收敛状态,其中,所述画像标签用作该神经网络分类模型对所述属性数据进行分类预测的监督标签;模型启用单元,被配置为由所述预设应用服务启用已被训练至收敛状态的所述神经网络分类模型使其适于对输入其中的加工数据进行推理以确定相应的画像标签;分词编码单元,被配置为由所述预设应用服务接收任意独立站点提交的消费者用户的活动数据,调用所述数据优化模块进行数据预处理后进行分词获得分词集,构造出该分词集相对应的编码信息;标签获取单元,被配置为由所述预设应用服务调用所述神经网络分类模型对所述编码信息进行表示学习并分类,获得该编码信息相对应的画像标签并向提交该活动数据的独立站点返回。
35.变通扩展的一种实施例中,本技术的数据调用处理装置,还包括:列表生成单元,被配置为由所述独立站点根据预设应用服务所返回的画像标签搜索相应的商品项,获得由
该些商品项构成的商品列表;列表推送单元,被配置为将所述商品列表输出至产生据以确定该画像标签的活动数据的消费者用户的图形用户界面显示。
36.变通扩展的另一实施例中,本技术的数据调用处理装置,还包括:安全控制单元,被配置为由所述独立站点判断预设应用服务所返回的画像标签是否属于预设的违规标签,若属于违规标签,阻断产生据以确定该画像标签的活动数据的消费者用户的访问事件。
37.适应本技术的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本技术所述的数据调用处理方法的步骤。
38.适应本技术的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的数据调用处理方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
39.适应本技术的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本技术任意一种实施例中所述方法的步骤。
40.相对于现有技术,本技术的优势如下:
41.本技术在不同协议层分别采用数据采集模块、数据优化模块、数据封装模块完成对跨境电商平台的独立站点产生的消费者用户的活动数据的全业务链条数据处理过程,实现数据挖掘,并允许预设应用服务通过另一协议层调用数据挖掘生成的画像标签及相应的属性数据,通过不同协议层解耦数据处理及应用流程中的各个环节,又通过电商平台的集群服务器实现对数据的集中管控,使电商平台产生的用户活动数据可以服务于各种应用服务而实现相应的下游任务,为跨境电商平台的用户活动数据的标准化管控提供了行之有效的技术框架,避免电商平台在日常运营过程中产生过多的数据熵增,使相同数据得以供多种预设服务复用,避免产生过多数据垃圾,确保电商平台的集群服务器和各个独立站点的具有较高的运行效率。
附图说明
42.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
43.图1为本技术数据调用处理方法的应用环境的网络架构示意图;
44.图2为本技术的数据调用处理方法的典型实施例的流程示意图;
45.图3为本技术实施例中配置数据采集插件过程的流程示意图;
46.图4为本技术实施例中数据封装模块工作过程的流程示意图;
47.图5为本技术实施例中预设应用服务工作过程的流程示意图;
48.图6为本技术的数据调用处理装置的原理框图;
49.图7为本技术所采用的一种计算机设备的结构示意图。
具体实施方式
50.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
51.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
52.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
53.本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;pcs(personal communications service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;pda(personal digital assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或gps(global positioning system,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是pda、mid(mobile internet device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
54.本技术所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
55.需要指出的是,本技术所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本技术的网络部署方式的实施方式。
56.本技术的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来
实施访问。
57.本技术中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
58.本技术所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本技术的技术方案所调用即可。
59.本领域技术人员对此应当知晓:本技术的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本技术所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
60.本技术即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本技术的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
61.本技术的一种数据调用处理方法,可被编程为计算机程序产品,部署于电商平台集群服务器中运行而实现。
62.请参阅图1所示的跨境电商平台的网络部署架构,其包括一处集群服务器和分布式运行的大量的独立站点,所述的集群服务器向各个独立站点提供注册和配置服务,因而两者之间可以互相通信,而由集群服务器获取各个独立站点产生的用户流量数据并对各个独立站点的注册、配置、运行等功能做出相应的控制。每个独立站点用于运行实现一个线上店铺,让电商平台的消费者用户可以在该线上店铺进行访问活动,而产生相应的活动数据。所述的活动数据,包括但不限于用户的行为数据、用户所在的终端设备中的运行性能相关的数据、用户注册数据、用户交易数据、用户交互数据等,通常可以由独立站点负责采集和提供,独立站点所采集的活动数据,可以作为目标数据提交给电商平台的集群服务器,用做进一步的数据挖掘处理。
63.请参阅图2,本技术的数据调用处理方法在其典型实施例中,包括如下步骤:
64.步骤s1100、接收电商平台的多个独立站点采集的目标数据,所述目标数据为电商平台消费者用户对应产生的活动数据,由电商平台的集群服务器分发至各个所述的独立站点中运行的数据采集插件负责采集,该数据采集插件工作于第一协议层:
65.为了方便跨境电商平台向其平台内预注册的海量的独立站点获取目标数据,集群服务器中预先向所述的独立站点分发数据采集插件,独立站点接收所述的数据采集插件后实现后台安装,使其启动对应的进程,用于处理该独立站点的线上店铺中活动的消费者用户产生的活动数据,将所述的活动数据作为目标数据提交至集群服务器。
66.所述的数据采集插件,遵守预先规范的协议,工作在第一协议层,专门用于对独立站点中消费者用户触发提交的所述活动数据进行初步的加工处理,按照本领域技术人员可以根据此处的揭示而灵活预设的协议规范而转换为相应的目标数据,然后将目标数据提交至集群服务器。
67.所述的集群服务器,在第一协议层源源不断地接收电商平台内的所有配置了所述
的数据采集插件的独立站点所提交的目标数据,这些目标数据主要是独立站点内产生的用户活动数据,但在某些变通的实施例中,也可进一步扩展数据来源,例如,可以是从电商平台之外的其他外部站点爬取的其他各种预知类型的目标数据,以丰富目标数据来源和数据潜在价值。
68.一般而言,消费者用户产生的活动数据中,通常包含数据的属性字段名称以及该属性字段名称相对应的属性数据。现实应用中,由于具有同一属性的某项数据,在不同的开发场景中,可能存在不同的属性字段名称,因此,海量的活动数据是相对杂乱的,并且不同页面产生的活动数据的格式可能也是不一致的,故一种变通的方式中,可先由所述的数据采集插件负责对活动数据进行基本的格式规范,例如整理成属性字段名称与其属性数据的数据对,以便形成所述的目标预设规范的目标数据,便于第二协议层调用。
69.步骤s1200、由工作于第二协议层的数据优化模块根据第三协议层所需的数据格式对所述目标数据进行数据预处理并持久化至数据库,以供第三协议层的数据封装模块调用:
70.集群服务器中运行有数据优化模块,该数据优化模块工作在本技术所述的预先规范的协议的第二协议层,其可以服务于第三层协议所需的数据格式规范对所述目标数据进行数据预处理,包括对所述的目标数据进行结构化抽象和非结构化抽象等,然后对数据抽象后的目标数据进行数据清洗或计算,最终将目标数据持久化至预设的数据库中,以便工作在第三层协议的数据封装模块可直接从所述的数据库中调用数据。
71.对所述的目标数据进行结构化抽象,示例而言,可以为具有相同属性的不同属性字段名称的各个目标数据进行同类项合并,从而压缩目标数据的总量,抽象出更为有效的目标数据。
72.对所述的目标数据进行非结构化抽象,示例而言,将同一属性字段名称不同属性数据进行字符串拼接,同理也可压缩目标数据的总量,抽象出更为集中的目标数据。
73.对抽象后的目标数据进行数据清洗,主要是删除目标数据中不符合预设第三层协议所需的预设目标的部分数据,例如,对于其中不具有数据挖掘价值的部分属性字段相对应的数据对进行删除。
74.对抽象后的目标数据进行数据计算,主要是对目标数据中的数值型的属性字段相对应的属性数据进行统计形成新的综合性的属性字段及其相应的统计数值,重新构造为新的属性字段名称与属性数据之间的数据对。
75.在对最终目标数据进行持久化时,所述数据优化模块可以同时维护与多个不同类型不同任务的数据库的连接,然后根据预设的分类标准,将相应的目标数据持久化存储到相应的数据库中。所述的数据库包括但不限于hdfs、mangodb、hbase、redis、sql server等,可由本领域技术人员灵活设定,只要在所述的数据优化模块中实现相应的数据库的访问功能即可。
76.步骤s1300、由工作于第三协议层的数据封装模块对所述数据库中的目标数据进行数据挖掘,以根据所述目标数据中生成适配电商平台的消费者用户的画像标签及其对应的属性数据:
77.集群服务器也在其后台运行一数据封装模块,该数据封装模块工作于本技术所称的预设协议的第三协议层,其用于执行对所述的数据库中的目标数据的数据挖掘任务。
78.所述的数据封装模块,可以由本领域技术人员灵活采用任意公知的数据挖掘算法实现之,使其运行时,适于采用其相应的数据挖掘算法,从所述的数据库中获取原始目标数据,然后利用这些目标数据生成相对应的画像标签,并进一步利用这些画像标签对这些目标数据进行分类,构造出画像标签与属性数据之间的知识图谱。
79.数据封装模块在对目标数据进行数据挖掘时,首先适应一个预设下游任务,确定其所需调用的目标数据范围,然后,可根据基于预设规则、基于数学模型、基于预设算法等方式,对该范围内的目标数据进行数据建模,以获得适于构造画像标签的规范化的目标数据。
80.在规范化的目标数据的基础上,进一步使用预设的数据画像算法对该些目标数据构造画像标签,构造画像标签的过程,也是对规范化目标数据中的属性字段进行归类聚合的过程,通过归类,将目标数据划分为多个分类标签,即画像标签,然后采用文本对这些画像标签进行描述,由这些画像标签构成画像标签集,构成一个相应的标签体系。
81.为了便于后续根据标签体系中的画像标签调用其存储于所述数据库中相对应的原始目标数据,还可使用所述的画像标签进一步对数据库中由第二协议层持久化的原始目标数据进行标注,以此建立画像标签到该些原始目标数据中的属性数据之间的映射关系,使得数据库中的每条目标数据均被标注了相应的画像标签,从而方便通过画像标签对其实施调用。
82.步骤s1400、响应工作于第四协议层的预设应用服务的调用指令,为该预设应用服务执行对所述画像标签及其对应的属性数据的调用输出,使所述预设应用服务根据电商平台中的独立站点产生的消费者用户的活动数据而确定其画像标签,而实现预设的下游任务:
83.跨境电商平台中,其集群服务器可以通过运行工作于本技术所称的预设协议的第四协议层的后台服务进程而响应其自身或其独立站点,甚至是第三方中运行的应用服务触发的调用指令,而为其调用所述画像标签及其对应的属性数据。
84.所述的应用服务是预先注册到集群服务器的,具有合法身份,因而对于集群服务器而言,触发所述调用指令的应用服务一般是预设应用服务,该应用服务旨在实现对应预设的下游任务,例如实现电商平台中的商品的分类模型训练任务、实现商品搜索任务、实现安全操作识别任务等。所述应用服务具体执行何种下游任务,可因应具体业务场景而由本领域技术人员灵活实施,不影响本技术的创造性的体现。
85.但是,作为本技术对所述调用指令进行响应的固有机制,在集群服务器接收到所述的调用指令之后,响应该调用指令,便可根据该调用指令指定的数据范围,从所述的数据库中为其调用所述的画像标签及其对应的属性数据,返回给相应的应用服务使用。所述的数据范围的确定,可以通过在调用指令中携带信息予以指定,所述的信息包括指定所述的画像标签、指定目标数据相对应的时间范围、指定目标数据相对应的其他字段信息等,可由本领域技术人员根据实际下游任务的需要而灵活确定,同理不影响本技术的创造性的体现。
86.当所述的预设应用服务获取本技术的集群服务器输出的所述画像标签及其目标数据后,便可根据该应用服务自身预设的业务逻辑实现其自身预期的业务功能,使得其后续可以根据电商平台中的独立站点产生的消费者用户的活动数据,而快速确定该活动数据
相对应的画像标签,从而可以进一步根据该画像标签进行相似内容的检索,例如根据某个用于描述商品分类的画像标签,查找出属于该画像标签的其他商品信息,达到商品检索的目的,实现预设的商品搜索任务。
87.经过本典型实施例的揭示不难看出,本技术在不同协议层分别采用数据采集模块、数据优化模块、数据封装模块完成对跨境电商平台的独立站点产生的消费者用户的活动数据的全业务链条数据处理过程,实现数据挖掘,并允许预设应用服务通过另一协议层调用数据挖掘生成的画像标签及相应的属性数据,通过不同协议层解耦数据处理及应用流程中的各个环节,又通过电商平台的集群服务器实现对数据的集中管控,使电商平台产生的用户活动数据可以服务于各种应用服务而实现相应的下游任务,为跨境电商平台的用户活动数据的标准化管控提供了行之有效的技术框架,避免电商平台在日常运营过程中产生过多的数据熵增,使相同数据得以供多种预设服务复用,避免产生过多数据垃圾,确保电商平台的集群服务器和各个独立站点的具有较高的运行效率。
88.请参阅图3,扩展的实施例中,所述步骤s1100、接收电商平台的多个独立站点采集的目标数据的步骤之前,包括如下步骤:
89.步骤s2100、响应所述电商平台中的任意独立站点的数据采集插件配置请求,向该独立站点分发相应的数据采集插件,将其配置于该独立站点的后台中运行:
90.本实施例中,工作在第一协议层的数据采集插件由本技术的集群服务器负责按需分发,因而,当任意一个独立站点需要安装该数据采集插件时,便由该独立站点向集群服务器发送相应的配置请求,集群服务响应于该请求而向该独立站点分发所述的数据采集插件,独立站点下载该数据采集插件后,便将其安装配置至所述线上店铺的后台中运行,使其根据预设的编程业务逻辑,启动对线上店铺产生的用户活动数据的监听,以便开始采集所述的目标数据。
91.步骤s2200、将该配置了数据采集插件的独立站点注册至配置信息库中:
92.当所述的独立站点完成所述数据采集插件在其后台的安装装置后,便向集群服务器返回通知消息,集群服务器根据这一通知消息,便可向其预设的配置信息库中存入该独立站点的注册信息,表示该独立站点配置了所述的数据采集插件,而具有向集群服务器提交目标数据的合法身份。
93.步骤s2300、获取该配置了数据采集插件的独立站点发送的目标数据接入请求,查询所述配置信息库是否存在该独立站点,若存在该独立站点,向该独立站点发送目标数据传输令牌,以在该独立站点传输其目标数据时根据该目标数据携带的所述数据传输令牌而接收该目标数据:
94.当运行于独立站点的数据采集插件开始向集群服务器发送其所采集的目标数据之先,为了建立与集群服务器的稳定的数据传输链路,先由数据采集插件向集群服务器发送目标数据接入请求。集群服务器响应该接入请求而在所述配置信库中查询触发该接入请求的独立站点是否已经预先注册到该配置信息库中,若配置信息库中存在该独立站点的注册信息,便可为其生成一个最新的数据传输令牌,将该数据传输令牌发送给发起该接入请求的独立站点使用。所述的数据传输令牌,可以采用非对称密钥中的公钥,后续由独立站点采用该公钥对其目标数据进行加密形成加密目标数据,在集群服务器收到加密目标数据后采用该非对称密钥中的私钥进行解密获得对应的原文。由此不难理解,该数据传输令牌起
到供集群服务器校验独立站点提交的目标数据的合法有效性的作用,后续,独立站点可以根据目标数据所推荐的数据传输令牌校验该目标数据是否适于为其所接收和进一步处理,从而避免集群服务器遭受饱和攻击,使其集中处理合法的目标数据。
95.本实施例对数据采集插件的分发和目标数据传输采用特有的前置安全措施,提升了电商平台中集群服务器和独立站点之间数据传输的安全性。
96.请参阅图4,深化的实施例中,所述步骤s1300、由工作于第三协议层的数据封装模块对所述数据库中的目标数据进行数据挖掘,以根据所述目标数据中生成适配电商平台的消费者用户的画像标签及其对应的属性数据,包括如下步骤:
97.步骤s1310、由所述数据封装模块中的数据建模子模块对所述目标数据进行数据抽象,将所述目标数据处理为标准格式规范,使每个目标数据包括多个属性数据:
98.本实施例中,所述的数据封装模块被实现为包括功能相对独立的多个子模块,其中第一个子模块为数据建模子模块,数据建模子模块用于对从第二协议层的数据库中调用的目标数据进行数据抽象,使所述目标数据被处理为标准格式规范,从而使目标数据根据该规范而包括多个属性数据。这一标准格式规范是根据本领域技术人员对数据挖掘的需求而可灵活设定的。应当理解,一般一条目标数据会包含多个属性字段用于描述一个事件,对应也便会有多个属性数据。
99.如前所述,数据抽象的具体方式及其算法,也可由本领域的技术人员按需灵活设定,均不影响本技术的创造性的体现。
100.步骤s1320、由所述数据封装模块中的数据画像子模块对所述目标数据进行数据聚合,以获得所述目标数据相对应的画像标签,构成画像标签集:
101.数据封装模块中的另一子模块为数据画像子模块,其主要采用k-means之类的数据聚合算法实现,用于根据所述目标数据中的属性字段名称,对各个目标数据进行数据聚合,从而聚合出多个目标数据集,为每个目标数据集确定出其相对应的画像标签,由这些画像标签构成画像标签集,即为一个标签体系。数据聚合的其他方式也可应用于本实施例中,例如均值漂移聚类算法、基于密度的聚类算法、用高斯混合模型(gmm)的最大期望(em)聚类算法、凝聚层次聚类算法、图团体检测聚类算法等,本领域技术人员可按需灵活选用。
102.步骤s1330、根据所述画像标签集中的画像标签与所述目标数据中的属性数据的对应关系构造出映射关系数据集,以供预设应用服务调用:
103.确定了所述的画像标签集后,每个画像标签与所述目标数据中的属性数据之间的对应关系便已确定,据此,可以进一步修正所述的数据库,进一步突出画像标签与所述目标数据中的属性数据之间的对应关系,一种较为便捷的处理方式中,可直接在数据库中目标数据的属性数据所在处标注其相应的画像标签,使两者之间建立映射关系,从而在数据库中实现映射关系数据集的构造,后续便可供所述的预设应用服务直接调用。
104.本实施例通过数据建模子模块先对第二协议层形成的目标数据进行数据建模获得规范化目标数据,然后进一步通过数据画像子模块对所述的目标数据进行聚类构造出标签体系,实现对目标数据的高层语义抽象,从而实现对海量的目标数据的数据价值的有效挖掘,使其适于开放给多种预设应用服务调用,为电商平台的用户活动数据的高效利用奠定了坚实的基础。
105.请参阅图5,扩展的实施例中,所述步骤s1400、响应工作于第四协议层的预设应用
服务的调用指令,为该预设应用服务执行对所述画像标签及其对应的属性数据的调用输出的步骤之后,包括如下步骤:
106.步骤s1500、由所述预设应用服务调用所述画像标签及其属性数据构成训练样本,对神经网络分类模型实施训练,将其训练至收敛状态,其中,所述画像标签用作该神经网络分类模型对所述属性数据进行分类预测的监督标签:
107.本实施例中,一个预设应用服务被实现为利用本技术的目标数据对一个神经网络分类模型实施训练,然后将其投入使用。据此,由工作于第四协议层的预设应用服务通过接口调用所述数据库中,由第三协议层完成数据挖掘后获得的画像标签与属性数据之间的映射关系数据集用做该分类模型训练所需的训练集,其中的每个映射关系数据便构成其训练样本,每个训练样本中,属性数据构成分类模型的输入数据,而其相对应的画像标签则构成其分类监督标签。
108.所述神经网络分类模型包括一个文本特征提取子模型以及分类器,所述文本特征提取子模型可采用textcnn、lstm、transformer、bert、albert、electra等公知的基础模型担任,用于对所述训练样本所提供的输入数据的编码信息进行表示学习,获得相应的文本特征信息。所述分类器采用全连接层对所述的文本特征信息映射到该分类器预设的分类空间,该分类空间包含由所述画像标签集中的各个画像标签对应构成的多个分类标签,经映射到该分类空间后,获得所述输入数据对应各个分类标签的分类概率,确定其中分类概率最大者为所述输入数据相对应的分类标签。所述训练样本相对应的画像标签被用于校正该训练样本提供的输入数据被分类后获得的分类标签,计算该分类标签相对应的模型损失,获得相应的损失值,然后在该损失值未达到预设阈值时,对整个神经网络分类模型实施梯度更新,通过反向传播修正该模型的权重参数,使其逼近收敛状态;当该损失值达到所述预设阈值时,视为该分类模型已经被训练至收敛状态,从而可终止对该分类模型的训练任务。
109.步骤s1600、由所述预设应用服务启用已被训练至收敛状态的所述神经网络分类模型使其适于对输入其中的加工数据进行推理以确定相应的画像标签:
110.将所述的神经网络分类模型训练至收敛状态后,便可由该预设应用服务将其配置后电商平台的集群服务器或指定的独立站点中,并将其启用,据此,该分类模型便习得对输入其中的属性数据的编码信息进行分类的能力,可服务于该应用服务相对应的下游任务。一种实施例中,所述预设应用服务部署于某一独立站点中,因此,该神经网络分类模型可在该独立站点中训练并启用,而专用服务于该独立站点范围内产生的活动数据,根据这些活动数据加工处理出编码信息后确定这些活动数据相对应的画像标签。另一实施例中,所述预设应用服务为所述集群服务器运行的服务,因此,其在集群服务器处训练所述神经网络分类模型并在集群服务器的后台启用,而服务于整个电商平台的任意独立站点,为任意独立站点的活动数据直接确定相应的画像标签。
111.步骤s1700、由所述预设应用服务接收任意独立站点提交的消费者用户的活动数据,调用所述数据优化模块进行数据预处理后进行分词获得分词集,构造出该分词集相对应的编码信息:
112.所述的预设应用服务,独立地负责任意独立站点提交的消费者用户的活动数据,同理,遵守本技术所称协议规范的第二协议层的具体规范,调用所述数据优化模型对所述活动数据进行数据预处理获得相应格式的目标数据,然后,对预处理后的目标数据直接进
行分词,从而获得相应的分词集,然后根据预设的分词词典,将该分词集转换为适于所述神经网络分类模型处理的相应的编码信息。
113.步骤s1800、由所述预设应用服务调用所述神经网络分类模型对所述编码信息进行表示学习并分类,获得该编码信息相对应的画像标签并向提交该活动数据的独立站点返回:
114.如前所述,神经网络分类模型将采用其文本特征提取子模型对前一步骤的编码信息进行表示学习,提取出分词集相对应的深层语义信息,即文本特征信息,然后,采用分类器对该文本特征信息做分类映射,获得其相对应的分类标签,即确定了该分类标签相对应的画像标签,这一画像标签便可被返回给提交该活动数据的独立站点做进一步的处理,也即是说,实现所述的预设应用服务之后,该预设应用服务已经借助本技术所称的数据库习得了根据输入数据直接做画像标签判定的能力,因而,后续服务于各独立站点时,无需经过本技术其他协议层的参与,便可直接对独立站点产生的消费者用户的活动数据做分类判定,快速地确定活动数据相对应的画像标签,供下游任务使用。
115.本实施例中,通过第四协议层的预设应用服务实现对本技术加工形成的数据库库中的数据的复用,在预设应用服务借助神经网络分类模型习得根据底层输入数据直接确定画像标签的能力之后投入使用,从而,使预设应用服务可以服务于下游任务,而无需再经过本技术在先各个步骤对后续产生的活动数据做多层协议的规范,便可迅速确定相对应的画像标签,提升了数据识别的能力,使商品搜索、信息安全识别之类的下游任务的实现更为高效。
116.变通扩展的一种实施例中,所述步骤s1800中,获得该编码信息相对应的画像标签并向提交该活动数据的独立站点返回的步骤之后,包括如下步骤:
117.步骤s1911、由所述独立站点根据预设应用服务所返回的画像标签搜索相应的商品项,获得由该些商品项构成的商品列表:
118.所述独立站点配置有用于存储自身上线的商品相对应的商品信息数据库,其中预先存储每个商品单位相对应的商品信息,且基于所述的商品信息而预先标注有所述标签体系中的画像标签,据此,根据一个画像标签便可搜索出相关联的商品单位。
119.当所述的预设应用服务根据某独立站点产生的消费者用户的活动数据而返回该活动数据相对应的画像标签后,例如,消费者用户在线上店铺上点击访问一个商品,由此向该独立站点提交一个活动数据,该活动数据包含了该商品相对应的描述信息,包括该商品的各种商品属性、详情文本、商品标题等,这些描述信息被视为活动数据的构成而一并提交给该预设应用服务确定出相应的画像标签,独立站点于是便可根据被确定出的画像标签向其商品信息数据库中检索携带该画像标签的所有商品项,然后将检索出的商品项构造成商品列表。
120.步骤s1912、将所述商品列表输出至产生据以确定该画像标签的活动数据的消费者用户的图形用户界面显示:
121.独立站点获得所述的商品列表后,便可将其推送给产生所述活动数据的消费者用户的终端设备,由该终端设备解析该商品列表并显示至其图形用户界面中,以便完成与消费者用户的信息交互,实现商品推荐、相似商品匹配等目的。
122.本实施例通过展示所述预设应用服务与独立站点的业务逻辑相配合而实现的一
个用于执行商品搜索的具体下游任务,彰显了本技术的技术方案的现实价值,不难理解,借助本技术的技术框架,通过预设应用服务可以实现对本技术技术方案挖掘出来的画像标签的高效复用,对于电商平台而言,可以大幅提升服务效率,改善和提升服务体验。
123.变通扩展的另一实施例中,所述步骤s1800中,获得该编码信息相对应的画像标签并向提交该活动数据的独立站点返回的步骤之后,包括如下步骤:
124.步骤s1920、由所述独立站点判断预设应用服务所返回的画像标签是否属于预设的违规标签,若属于违规标签,阻断产生据以确定该画像标签的活动数据的消费者用户的访问事件:
125.跨境电商平台对其平台所产生的活动数据的安全管控也是至关重要的,服务于这一下游任务,所述预设应用服务所确定的画像标签被返回给相应的独立站点做寿进一步的违规检测,因此,所述的画像标签可以是用于表示信息安全相对应的识别标签,例如“涉黄”、“涉赌”等。预设应用服务识别出独立站点提交的活动数据的画像标签后,返回给该独立站点。该独立站点便对画像标签进行识别,检测其是否属于预设的违规标签,若是,则可阻断产生该活动数据的消费者用户当前正在进行的访问事件,从而确保平台的信息安全。
126.本实施例通过展示所述预设应用服务与独立站点的业务逻辑相配合而实现的一个用于执行信息安全识别的具体下游任务,彰显了本技术的技术方案的现实价值,与前一实施例类似,借助本技术的技术框架,通过预设应用服务可以实现对本技术技术方案挖掘出来的画像标签的高效复用,对于电商平台而言,可以提供信息安全检测的智能化程度,确保信息安全。
127.请参阅图6,适应本技术的目的之一而提供的一种数据调用处理装置,是对本技术的数据调用处理方法的功能化体现,该装置包括:数据采集单元1100、数据优化单元1200、数据画像单元1300,以及数据调用单元1400,其中,所述数据采集单元1100,用于接收电商平台的多个独立站点采集的目标数据,所述目标数据为电商平台消费者用户对应产生的活动数据,由电商平台的集群服务器分发至各个所述的独立站点中运行的数据采集插件负责采集,该数据采集插件工作于第一协议层;所述数据优化单元1200,用于由工作于第二协议层的数据优化模块根据第三协议层所需的数据格式对所述目标数据进行数据预处理并持久化至数据库,以供第三协议层的数据封装模块调用;所述数据画像单元1300,用于由工作于第三协议层的数据封装模块对所述数据库中的目标数据进行数据挖掘,以根据所述目标数据中生成适配电商平台的消费者用户的画像标签及其对应的属性数据;所述数据调用单元1400,用于响应工作于第四协议层的预设应用服务的调用指令,为该预设应用服务执行对所述画像标签及其对应的属性数据的调用输出,使所述预设应用服务根据电商平台中的独立站点产生的消费者用户的活动数据而确定其画像标签,而实现预设的下游任务。
128.扩展的实施例中,本技术的数据调用处理装置,还包括:请求响应单元,用于响应所述电商平台中的任意独立站点的数据采集插件配置请求,向该独立站点分发相应的数据采集插件,将其配置于该独立站点的后台中运行;站点注册单元,用于将该配置了数据采集插件的独立站点注册至配置信息库中;鉴权处理单元,用于获取该配置了数据采集插件的独立站点发送的目标数据接入请求,查询所述配置信息库是否存在该独立站点,若存在该独立站点,向该独立站点发送目标数据传输令牌,以在该独立站点传输其目标数据时根据该目标数据携带的所述数据传输令牌而接收该目标数据。
129.深化的实施例中,所述数据画像单元1300,包括:建模子单元,被配置为由所述数据封装模块中的数据建模子模块对所述目标数据进行数据抽象,将所述目标数据处理为标准格式规范,使每个目标数据包括多个属性数据;聚合子单元,被配置为由所述数据封装模块中的数据画像子模块对所述目标数据进行数据聚合,以获得所述目标数据相对应的画像标签,构成画像标签集;映射子单元,被配置为根据所述画像标签集中的画像标签与所述目标数据中的属性数据的对应关系构造出映射关系数据集,以供预设应用服务调用。
130.扩展的实施例中,本技术的数据调用处理装置,还包括:模型训练单元,被配置为由所述预设应用服务调用所述画像标签及其属性数据构成训练样本,对神经网络分类模型实施训练,将其训练至收敛状态,其中,所述画像标签用作该神经网络分类模型对所述属性数据进行分类预测的监督标签;模型启用单元,被配置为由所述预设应用服务启用已被训练至收敛状态的所述神经网络分类模型使其适于对输入其中的加工数据进行推理以确定相应的画像标签;分词编码单元,被配置为由所述预设应用服务接收任意独立站点提交的消费者用户的活动数据,调用所述数据优化模块进行数据预处理后进行分词获得分词集,构造出该分词集相对应的编码信息;标签获取单元,被配置为由所述预设应用服务调用所述神经网络分类模型对所述编码信息进行表示学习并分类,获得该编码信息相对应的画像标签并向提交该活动数据的独立站点返回。
131.变通扩展的一种实施例中,本技术的数据调用处理装置,还包括:列表生成单元,被配置为由所述独立站点根据预设应用服务所返回的画像标签搜索相应的商品项,获得由该些商品项构成的商品列表;列表推送单元,被配置为将所述商品列表输出至产生据以确定该画像标签的活动数据的消费者用户的图形用户界面显示。
132.变通扩展的另一实施例中,本技术的数据调用处理装置,还包括:安全控制单元,被配置为由所述独立站点判断预设应用服务所返回的画像标签是否属于预设的违规标签,若属于违规标签,阻断产生据以确定该画像标签的活动数据的消费者用户的访问事件。
133.为解决上述技术问题,本技术实施例还提供计算机设备。如图7所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种数据调用处理方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本技术的数据调用处理方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
134.本实施方式中处理器用于执行图6中的各个单元及其子单元的具体功能,存储器存储有执行上述单元或子单元所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本技术的数据调用处理装置中执行所有单元/子单元所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子单元的功能。
135.本技术还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本技术任一实施例的数据调用处理方法的步骤。
136.本技术还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本技术任一实施例所述方法的步骤。
137.本领域普通技术人员可以理解实现本技术上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)等计算机可读存储介质,或随机存储记忆体(random access memory,ram)等。
138.综上所述,本技术适于应用于跨境电商平台中实现对平台内各独立站点产生的用户活动数据的标准化数据挖掘和利用,最终服务于多种预设的应用服务而实现相应的下游任务,避免产生信息垃圾,确保电商平台整体维持较高的运行效率。
139.本技术领域技术人员可以理解,本技术中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本技术中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本技术中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
140.以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献