一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于业务优先级的自助数据标签方法以及装置与流程

2022-02-22 06:54:20 来源:中国专利 TAG:


1.本发明涉及信息处理技术领域,尤其涉及一种基于业务优先级的自助数据标签方法以及装置。


背景技术:

2.在如今大数据行业的发展下,合法收集用户的属性、行为等数据,根据业务逻辑为用户打上标签,以实现营销活动的千人千面,是精细化运营必不可少的必备步骤。依托多个平台的大数据采集,以及大数据技术的分析与预测能力,能够使营销活动更加精准有效地投放,给品牌或者企业带来更高的投资回报率。
3.标签的运算需要保证较高的准确性,否则会一定程度削减营销活动的投放效果。
4.现有技术一的处理方式为:一种基于大数据技术的自助数据标签平台,通过完全可视化的方式在界面上定义标签的计算过程,并通过大数据spark、hive、hbase等技术实现在pb级别数据中计算出复合业务需求的标签数据,进一步为用户分群、用户标签提供数据基础。
5.现有技术一的缺点:该技术主要着重于处理pb级别的数据进行标签计算,没有标签优先级的概念;如标签计算结果不能满足业务需求,该技术暂不支持灵活调整运算规则。
6.现有技术二的处理方式为:基于大数据采集和分析,得到采集到的用户信息所涉及用户的用户画像;将采集到的所述用户信息预存为不同属性的维度,并预存与所述维度对应的权重系数;将采集到的所述用户信息划分成不同类型的用户群;采集目标用户的相关标签,并基于各标签输出所述目标用户的画像,将所述目标用户的画像与维度和用户群进行比对和计算,以确定所述目标用户与某个维度和某个用户群的相似度;比较所述相似度与预设阈值的关系,确定所述目标用户的优先等级;输出所述目标用户在最优等级下的营销策略数据。
7.该技术与此技术的差异主要在于:1)该技术也有“优先级”的概念,但是优先级并不是用于标签计算,而是用于给用户分级,即在最终的营销活动中用于先后投放。
8.现有技术二的缺点:该技术直接确定目标用户的优先等级进行营销投放,而如果在前一步,即标签计算精准度有所欠缺,则会影响用户的优先等级计算及投放的效果。


技术实现要素:

9.本发明所要解决的技术问题是针对现有技术的不足,提供一种基于业务优先级的自助数据标签方法以及装置。
10.本发明解决上述技术问题的技术方案如下:一种基于业务优先级的自助数据标签方法,其包括:
11.获取用户输入的标签信息;
12.对所述标签信息进行标签层级以及标签规则处理,生成主题域标签信息;
13.对所述主题域标签信息进行优先级配置,生成优先级排序后的标签信息;
14.对所述优先级排序后的标签信息进行标签计算,生成组合标签信息;
15.将所述组合标签信息写入标签结果表中,生成标签结果信息;
16.接收用户输入的标签调整指令;
17.根据所述标签调整指令,调整所述标签结果信息。
18.进一步地,所述对所述优先级排序后的标签信息进行标签计算,生成组合标签信息的步骤,包括:
19.获取预设配置计算规则、实时数据仓库存储的结果数据以及生产的计算逻辑代码;
20.根据所述预设配置计算规则,通过所述实时数据仓库存储的结果数据以及所述生产的计算逻辑代码对所述优先级排序后的标签信息进行实时计算,生成组合标签信息。
21.进一步地,在所述获取用户输入的标签信息的步骤之前,还包括:
22.获取各个数据源收集的原始数据以及预设主题域拆分规则;
23.对所述原始数据进行合法性校验、清洗以及分区处理,生成事实数据;
24.对所述事实数据进行转化、拆分以及合并处理,生成中间数据;
25.根据所述预设主题域拆分规则,对所述中间数据进行拆分,生成标签结果信息直接可以调用的结果数据。
26.进一步地,所述对主题域标签信息进行优先级配置包括:对主题域标签信息中的单主题域的优先级配置、分主题域依赖全局事件时间的优先级配置以及不依赖全局事件时间的优先级配置。
27.进一步地,所述标签层级处理为将标签信息进行标签类别定义,按照业务需求进行人为划分,其中,标签信息分为事实标签、模型标签以及主观标签;
28.所述标签规则处理为初步定义标签信息如何赋值。
29.本发明的有益效果是:提出基于业务自定义优先级的方式跨主题域、跨时间维度进行用户标签填充的方法,帮助品牌方、业务人员快速根据优先级定义标签的定义方式。主要着重于让用户在可视化的界面上定义标签,提高用户友好度,本发明着重于标签赋值方式的多维度,即基于优先级定义。优先级体现在计算标签这一步。帮助业务人员可以根据业务优先级定义标签的计算方法。提升了标签计算的准确程度,并且由于多优先级的数据来源,丰富了标签计算的取值方式,解决了常规标签定义方式中容易出现的填充率低等问题。标签配置灵活,从计算到落地免去了代码修改上线等技术操作,也为品牌方和业务人员降低了试错成本。可覆盖多数标签体系的设计需求,提高适用性。
30.此外,本发明还提供了一种基于业务优先级的自助数据标签装置,其包括:
31.获取设备,用于获取用户输入的标签信息;
32.处理设备,用于对所述标签信息进行标签层级以及标签规则处理,生成主题域标签信息;
33.所述处理设备,还用于对所述主题域标签信息进行优先级配置,生成优先级排序后的标签信息;
34.所述处理设备,还用于对所述优先级排序后的标签信息进行标签计算,生成组合标签信息;
35.所述处理设备,还用于将所述组合标签信息写入标签结果表中,生成标签结果信
息;
36.所述获取设备,还用于接收用户输入的标签调整指令;
37.所述处理设备,还用于根据所述标签调整指令,调整所述标签结果信息。
38.进一步地,所述获取设备,还用于获取预设配置计算规则、实时数据仓库存储的数据以及生产的计算逻辑代码;
39.所述处理设备,还用于根据所述预设配置计算规则,通过所述实时数据仓库存储的数据以及所述生产的计算逻辑代码对所述优先级排序后的标签信息进行实时计算,生成组合标签信息。
40.进一步地,所述获取设备,还用于获取各个数据源收集的原始数据以及预设主题域拆分规则;
41.所述处理设备,还用于对所述原始数据进行合法性校验、清洗以及分区处理,生成事实数据;
42.所述处理设备,还用于对所述事实数据进行转化、拆分以及合并处理,生成中间数据;
43.所述处理设备,还用于根据所述预设主题域拆分规则,对所述中间数据进行拆分,生成标签结果信息直接可以调用的结果数据。
44.进一步地,所述对主题域标签信息进行优先级配置包括:对主题域标签信息中的单主题域的优先级配置、分主题域依赖全局事件时间的优先级配置以及不依赖全局事件时间的优先级配置。
45.进一步地,所述标签层级处理为将标签信息进行标签类别定义,按照业务需求进行人为划分,其中,标签信息分为事实标签、模型标签以及主观标签;
46.所述标签规则处理为初步定义标签信息如何赋值。
47.本发明的有益效果是:提出基于业务自定义优先级的方式跨主题域、跨时间维度进行用户标签填充的装置,帮助品牌方、业务人员快速根据优先级定义标签的定义方式。主要着重于让用户在可视化的界面上定义标签,更加注重用户友好度,而此技术着重于标签赋值方式的多维度,即基于优先级定义。优先级体现在计算标签这一步。帮助业务人员可以根据业务优先级定义标签的计算方法。提升了标签计算的准确程度,并且由于多优先级的数据来源,丰富了标签计算的取值方式,解决了常规标签定义方式中容易出现的填充率低等问题。标签配置灵活,从计算到落地免去了代码修改上线等技术操作,也为品牌方和业务人员降低了试错成本。可覆盖多数标签体系的设计需求,提高适用性。
48.本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
49.图1为本发明实施例提供的基于业务优先级的自助数据标签方法的示意性流程图。
50.图2为本发明实施例提供的基于业务优先级的自助数据标签装置的示意性结构框图。
具体实施方式
51.以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
52.如图1所示,本发明实施例提供了一种基于业务优先级的自助数据标签方法,其包括:
53.s1、获取用户输入的标签信息;
54.s2、对所述标签信息进行标签层级以及标签规则处理,生成主题域标签信息;
55.s3、对所述主题域标签信息进行优先级配置,生成优先级排序后的标签信息;
56.s4、对所述优先级排序后的标签信息进行标签计算,生成组合标签信息;
57.s5、将所述组合标签信息写入标签结果表中,生成标签结果信息;
58.s6、接收用户输入的标签调整指令;
59.s7、根据所述标签调整指令,调整所述标签结果信息。
60.本发明实施例提出大数据营销平台通用的基于业务优先级计算用户标签的方法,提供一套标签配置体系,帮助业务人员可以根据业务优先级定义标签的计算方法。
61.本发明实施例主要包含如下大的步骤:数据准备与主题域定义;标签规则,标签层级定义;标签优先级定义(核心);标签计算与结果写入;标签后验与逻辑更新。
62.具体为:打标签的前置步骤,数据准备与主题域定义
63.首先对于各个数据源收集回来的原始数据做清洗和分区。未校验未清洗未分区的数据在逻辑上称为原始数据层。
64.然后经过合法性校验并完成清洗后以日期为分区字段进行存储的数据逻辑上称为事实数据层。
65.之后按照不同的主题和业务意义,对新进数据进行转化,拆分,合并等操作后的数据逻辑上称为抽象数据层或者中间数据层。
66.再接着,这条数据会按照预先定义的不同的主题域进行拆分。例如针对电商的数据解决方案中,可以将主题域划分为会员主题域、粉丝主题域、产品、活动主题域等。
67.会员主题域,可分为会员注册表,会员绑定表,会员购买表,会员积分表等等;
68.粉丝主题域,可分为粉丝关注表,粉丝绑定表,粉丝互动表等等;
69.产品主题域,可分为产品购买记录表,产品评价表,产品发货周期表,产品主数据等;
70.活动主题域,可分为活动参与表、活动排期执行表等;
71.按照主题域拆分好的数据会保存在结果数据层,即打标签直接可以调用的数据。
72.以上都是属于打标签的前置步骤。
73.1、标签层级,标签规则定义
74.针对拆分到具体主数据的标签规则和层级的定义比较简单。标签层级的定义是指先将数据进行标签类别的定义,包括事实标签、模型标签和主观标签等,其次再按照业务需求进行人为的划分。例如“性别”、“年龄”、“地域”、“注册时间”都属于事实标签,但是用户可以进行更加细致的划分,将“性别”、“年龄”、“地域”划分至人口属性类别,将“注册时间”划分至会员属性类别。标签规则的定义则是初步定义标签如何赋值。例如“年龄”标签,可以简单定义为用当前日期减去会员生日后得到天数、除以365后计算出年再取整。
75.2、标签的优先级定义
76.如果多主题域都存在相同可用于定义计算的字段的话,则需要引入优先级定义的概念,在定义具体标签规则时,支持针对单主题域、分主题域分表的,依赖/不依赖全局事件时间的优先级配置。
77.2.1单主题域内的优先级配置
78.例如“年龄”标签,基础做法是取用户注册时填写的生日计算,但是会员很可能在注册的时候随便乱填写了一个日期,这样就会导致计算有偏差。
79.而会员有可能在其他渠道进行过绑定操作(例如支付宝小程序账号绑定时选择了授权获取身份信息)。在会员主题域内,业务人员用户因此可能会认为会员通过支付宝小程序绑定的信息可信度优于用户自行填写的,可以自定义优先级会员绑定>会员注册。
80.2.2跨主题域的优先级配置
81.例如“地域”标签,品牌主希望通过此标签获取到会员当前最可能所在的区域,以便完成区域的定向投放。一般情况下,品牌可以通过会员微信个人信息、会员注册填写信息、会员注册所用的手机号头、会员参与活动所在地、会员购买记录中的快递收货地址获取到用户的位置信息。而以上信息很可能同一个会员都是截然不同的。一个会员可能微信个人信息中填写所在地为a省,但是其手机号头属于b省,活动参与地址在c省,快递收货地址可以有d、e、f省
……
因此,此技术提出让用户自定义打标签优先级的分级方法。
82.仅跨主题域的优先级配置
83.比如品牌方认为,最后的一次的线下行为最可以证明用户当前所在地域。在此案例中,用户可以定义取值主题域优先级:活动主题域(活动参与表)》会员主题域(会员购买表)》会员注册表>粉丝主题域。
84.即,取会员最后一次线下行为的所在地域用于标签赋值,若取不到,就取会员的最后一次购买快递收货地址所在地域,然后如果还是取不到值则是用户注册所填地域、用户微信个人信息中的所在地赋值。
85.跨主题域-依赖全局事件时间的优先级配置
86.但是如果品牌方觉得近期线下活动较少(比如最近一次线下活动已经是两个月前了,两个月前会员参与线下活动相比用户今天新产生的购买,可能就并没有很强的可信度了),品牌方也可以重新定义为最新的一次行为(无论线上购买还是线下参与活动)最能证明用户当前所在地域。在此案例中,用户可以重新定义取值主题域优先级:活动主题域(活动参与表)=会员主题域(会员购买表)>会员注册表》粉丝主题域。
87.3、标签计算与结果写入
88.组合标签计算步骤,根据配置的计算规则,通过实时读取数据仓库存储的数据及生产的计算逻辑代码实时计算出组合标签,并将计算好的组合标签更新写入到一张标签结果表中。
89.4、标签的实时调整
90.用户获取到标签结果后,如对于标签计算值计算结果存疑或不满(例如,标签优先级设定要求过高导致填充率低无法满足业务需求),可随时调整标签优先级重新运算写入,实时验证。
91.并且,由于优先级的定义并不是写死在代码中,可以随时灵活调整,那么在今后如
果接入了品牌方认为可信度更高的数据源,也可以随时进行标签优先级的优化。
92.一定程度上提升了标签计算的准确程度,并且由于多优先级的数据来源,丰富了标签计算的取值方式,也一定程度上降低了常规标签定义方式中容易出现的填充率低等问题。
93.标签配置灵活,从计算到落地免去了代码修改上线等技术操作,也为品牌方和业务人员降低了试错成本。
94.本发明中,模型的抽象、主题域的设置、标签的计算写入是脱离具体代码和工具的,因此具体应用哪一种大数据组件,完全可以根据预算成本,具体业务,数据规模等灵活替换。
95.通用的打标签优先级方法论:本发明实施例的设计思想可覆盖多数标签体系的设计需求。
96.进一步地,所述对所述优先级排序后的标签信息进行标签计算,生成组合标签信息的步骤,包括:
97.获取预设配置计算规则、实时数据仓库存储的结果数据以及生产的计算逻辑代码;
98.根据所述预设配置计算规则,通过所述实时数据仓库存储的结果数据以及所述生产的计算逻辑代码对所述优先级排序后的标签信息进行实时计算,生成组合标签信息。
99.进一步地,在所述获取用户输入的标签信息的步骤之前,还包括:
100.获取各个数据源收集的原始数据以及预设主题域拆分规则;
101.对所述原始数据进行合法性校验、清洗以及分区处理,生成事实数据;
102.对所述事实数据进行转化、拆分以及合并处理,生成中间数据;
103.根据所述预设主题域拆分规则,对所述中间数据进行拆分,生成标签结果信息直接可以调用的结果数据。
104.进一步地,所述对主题域标签信息进行优先级配置包括:对主题域标签信息中的单主题域的优先级配置、分主题域依赖全局事件时间的优先级配置以及不依赖全局事件时间的优先级配置。
105.进一步地,所述标签层级处理为将标签信息进行标签类别定义,按照业务需求进行人为划分,其中,标签信息分为事实标签、模型标签以及主观标签;
106.所述标签规则处理为初步定义标签信息如何赋值。
107.本发明的有益效果是:提出基于业务自定义优先级的方式跨主题域、跨时间维度进行用户标签填充的方法,帮助品牌方、业务人员快速根据优先级定义标签的定义方式。主要着重于让用户在可视化的界面上定义标签,更加注重用户友好度,而此技术着重于标签赋值方式的多维度,即基于优先级定义。优先级体现在计算标签这一步。帮助业务人员可以根据业务优先级定义标签的计算方法。提升了标签计算的准确程度,并且由于多优先级的数据来源,丰富了标签计算的取值方式,解决了常规标签定义方式中容易出现的填充率低等问题。标签配置灵活,从计算到落地免去了代码修改上线等技术操作,也为品牌方和业务人员降低了试错成本。可覆盖多数标签体系的设计需求,提高适用性。
108.如图2所示,此外,本发明还提供了一种基于业务优先级的自助数据标签装置,其包括:
109.获取设备,用于获取用户输入的标签信息;
110.处理设备,用于对所述标签信息进行标签层级以及标签规则处理,生成主题域标签信息;
111.所述处理设备,还用于对所述主题域标签信息进行优先级配置,生成优先级排序后的标签信息;
112.所述处理设备,还用于对所述优先级排序后的标签信息进行标签计算,生成组合标签信息;
113.所述处理设备,还用于将所述组合标签信息写入标签结果表中,生成标签结果信息;
114.所述获取设备,还用于接收用户输入的标签调整指令;
115.所述处理设备,还用于根据所述标签调整指令,调整所述标签结果信息。
116.进一步地,所述获取设备,还用于获取预设配置计算规则、实时数据仓库存储的数据以及生产的计算逻辑代码;
117.所述处理设备,还用于根据所述预设配置计算规则,通过所述实时数据仓库存储的数据以及所述生产的计算逻辑代码对所述优先级排序后的标签信息进行实时计算,生成组合标签信息。
118.进一步地,所述获取设备,还用于获取各个数据源收集的原始数据以及预设主题域拆分规则;
119.所述处理设备,还用于对所述原始数据进行合法性校验、清洗以及分区处理,生成事实数据;
120.所述处理设备,还用于对所述事实数据进行转化、拆分以及合并处理,生成中间数据;
121.所述处理设备,还用于根据所述预设主题域拆分规则,对所述中间数据进行拆分,生成标签结果信息直接可以调用的结果数据。
122.进一步地,所述对主题域标签信息进行优先级配置包括:对主题域标签信息中的单主题域的优先级配置、分主题域依赖全局事件时间的优先级配置以及不依赖全局事件时间的优先级配置。
123.进一步地,所述标签层级处理为将标签信息进行标签类别定义,按照业务需求进行人为划分,其中,标签信息分为事实标签、模型标签以及主观标签;
124.所述标签规则处理为初步定义标签信息如何赋值。
125.本发明的有益效果是:提出基于业务自定义优先级的方式跨主题域、跨时间维度进行用户标签填充的装置,帮助品牌方、业务人员快速根据优先级定义标签的定义方式。主要着重于让用户在可视化的界面上定义标签,更加注重用户友好度,而此技术着重于标签赋值方式的多维度,即基于优先级定义。优先级体现在计算标签这一步。帮助业务人员可以根据业务优先级定义标签的计算方法。提升了标签计算的准确程度,并且由于多优先级的数据来源,丰富了标签计算的取值方式,解决了常规标签定义方式中容易出现的填充率低等问题。标签配置灵活,从计算到落地免去了代码修改上线等技术操作,也为品牌方和业务人员降低了试错成本。可覆盖多数标签体系的设计需求,提高适用性。
126.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽
管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献