一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于数据时效更新的定制产品隐性需求挖掘方法与系统

2022-06-01 01:11:18 来源:中国专利 TAG:


1.本发明涉及定制产品隐性需求挖掘技术,尤其涉及一种基于数据时效更新的定制产品隐性需求挖掘方法与系统。


背景技术:

2.隐性需求是指客户在产品需求提出过程中未表达或表达不清晰的需求。挖掘隐性需求能够使需求信息更完整,有助于设计人员设计出客户满意的产品。随着工业4.0概念的引入,客户需求的个性化程度进一步得到提升,越来越多的需求被隐藏在显性模糊需求下,隐性需求挖掘的重要性再次增加。作为隐性需求挖掘输入的历史订单数据的时效性越来越短。越新的订单应在需求挖掘过程中有更大的影响力,久远且低频的订单应被及时地从数据库中删除,以保证隐性需求挖掘的准确性。
3.现有的隐性需求挖掘方法缺少对数据时效性的考虑,认为所有的历史订单数据影响力是相等的。这导致需求挖掘的准确度降低,间接影响产品设计过程,降低客户的满意程度。为了缓解这个问题,有的方法增加新的列表或树结构来储存时间信息,逐个评估每条数据的时效程度再重新构造数据结构,这导致了计算资源和时间的浪费。本方法针对该问题,提出一种可将订单信息和时间信息压缩储存的生命树结构。在利用衰减窗口模型评估订单时效性,通过节点链接检索时间信息,快速删除树结构中失效的数据信息并调整数据结构。根据从生命树结构提取出的关联规则,实现隐性需求表达的高效、准确转化。


技术实现要素:

4.本发明的目的是针对现有技术不足,提供一种基于数据时效更新的定制产品隐性需求挖掘方法,其利用衰减窗口模型评估订单时效性,通过节点链接检索时间信息,快速删除树结构中失效的数据信息并调整数据结构。根据从生命树结构提取出的关联规则,实现隐性需求表达的高效、准确转化。
5.为了实现上述目的,本发明采用技术方案为:
6.本发明实施例的第一方面提供了一种基于数据时效更新的定制产品隐性需求挖掘方法,具体包括以下步骤:
7.(1)获取并标准化定制产品历史订单信息;
8.(2)以定制产品订单数据构建生命树结构;
9.(3)检索生命树中所有的时间净叶节点并根据节点的频率和时间信息,通过衰减窗口模型计算节点的活力值;
10.(4)从第一个时间净叶节点开始,若节点活力值小于设定的最低阈值,则删除净叶节点对应的树路径并调整树结构;若节点活力值大于设定的最低阈值,则跳转至下一净叶节点,直至所有净叶节点被遍历;
11.(5)根据频率阈值重构生命树并生成关联规则;
12.(6)基于步骤(5)得到的关联规则集,完成定制产品需求隐性需求的挖掘。
13.进一步地,步骤(2)中的生命树结构用于储存订单数据;所述订单数据包括项目信息、时间信息和项目频率;所述项目信息以树路径进行表示,项目频率保存在树节点中,时间信息在树路径的叶节点中;生命树中最大的时间节点信息保存于根节点中。
14.进一步地,生命树的树路径通过树节点的链接表示;所述树节点包括时间根节点、时间叶节点、路径节点和时间净叶节点;所述时间根节点是生命树结构的起点,用于保存生命树结构的最大时间;所述时间叶节点为生命树路径的尾端节点,用于保存订单数据的时间信息和项目信息;所述路径节点为链接根节点和叶节点的节点,用于订单数据的项目信息;所述时间净叶节点为不属于其他路径的路径节点的叶节点;
15.具有相同项目名称的节点通过节点链接连接在一起。
16.进一步地,树路径的节点以项目频率降序先后顺序排列,频率越高的项目节点越靠近根节点;每当新的数据插入时,项目频率将同步更新,树结构将根据新的项目频率顺序调整节点位置;树结构的数据更新步骤为:
17.重新统计项目频率,并以降序排序,得到频率变化的项目列表l
change

18.根据新的项目频率重构树结构,检索项目列表l
change
中相关项目的树节点,从下而上进行节点调换,直到满足最新的项目频率顺序;若在这个过程中,一个树路径的时间叶节点变为路径节点,则其时间信息保存到新产生的叶节点中;若调换的父节点r频率大于子节点q,则父节点分裂出一个兄弟节点r

,所述兄弟节点r

频率计数为父节点r与子节点q的频率计数之差,再将父节点r和子节点q调换;
19.将新订单中的项目按照项目频率降序逐个插入生命树中,每个订单时间信息保存在对应树路径的叶节点中;当插入的订单时间大于根节点时间时,更新根节点时间信息。插入后,树结构中的每一级存在两个或多个相同项目名称的节点,则合并节点,他们的计数相加;若新的数据时间大于根节点的时间,则更新根节点的时间信息;重复上述步骤,直到新增订单数据全被插入到生命树结构中。
20.进一步地,所述步骤(3)中具体为:
21.计算每笔交易td的活力值v(td),计算公式如下:
22.v(td)=∑v(i,td)/|td|
23.其中,i为交易里的项目,v(i,td)是项目i在交易td中的相对重要程度衡量因子,|td|为交易的项目数。
24.基于每笔交易的活力值v(td),计算每一个时间叶节点的活力值v(ld),计算公式如下:
25.v(ld)=∑v(td)
×ft-d
26.其中,d为每个交易td的时间信息,t为时间根节点包含的时间信息,f为活力衰减因子。
27.进一步地,所述步骤(4)中删除失效路径的步骤为:
28.对于单个失效路径,失效路径的时间叶子节点首先被删除,路径上其他路径节点的计数减去时间叶子节点的计数;若计数相减后,路径节点的计数为0,则删除该节点;当所有的失效路径都被删除后,更新并调整生命树结构。
29.进一步地,所述步骤(5)具体为:
30.通过生命树结构挖掘稀有项目和频繁项目,稀有项目支持度supp(x)满足maxrare
>supp(x)≥minrare,频繁项目支持度满足supp(x)≥minfre;
31.其中minrare为稀有项目最小阈值,maxrare为稀有项目最大阈值,minfre为频繁项目最小阈值;
32.获得两类项目后,通过剔除生命树结构中不满足稀有或频繁阈值的树路径,获得条件模式树以及频繁/稀有模式集合,生成关联规则。
33.进一步地,将用户的需求信息分类,并检验是否满足产品设计要求,得到需求分类信息;再将需求分类信息转化为标准需求;基于标准需求与步骤(5)得到的关联规则集,完成定制产品需求隐性需求的挖掘。
34.本发明实施例的第二方面提供了一种基于数据时效更新的定制产品隐性需求挖掘系统,包括:
35.交互界面,用于协助用户选择产品,表达需求信息;
36.需求分析模块,用于分类需求信息,并检验是否满足产品设计,输出需求分类信息;
37.需求标准化模块,用于将需求分析模块输出的需求分类信息转化为标准需求;
38.生命树构建模块,用于将历史订单信息压缩保存为生命树结构,保存订单数据;
39.树结构优化模块,用于计算树结构的时间叶子节点的活力值,删除树结构中无效的路径;
40.模式提取模块,用于通过支持度阈值和最终的树结构,获得流行项目的条件模式树,并整合统计流行模式;
41.规则提取模块,用于通过流行模式集,计算并筛选得出可靠的关联规则;
42.需求挖掘模块,利用需求标准化模块输出的标准需求和规则提取模块输出的隐性需求关联规则挖掘隐性需求并转化可用的显式需求。
43.本发明实施例的第三方面提供了一种基于数据时效更新的定制产品隐性需求挖掘装置,包括一个或多个处理器,用于上述的基于数据时效更新的定制产品隐性需求挖掘方法。
44.本发明实施例的第四方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,用于实现上述的基于数据时效更新的定制产品隐性需求挖掘方法。
45.本发明的有益效果为:本发明通过一种可同时存储时间信息和订单信息的数据结构,利用衰减窗口模型评估订单时效性,通过节点链接检索时间信息,快速删除树结构中失效的数据信息并调整数据结构,提高了关联规则的挖掘质量和效率,实现隐性需求表达的高效、准确转化。本发明通过分析订单信息的时效性,识别并剔除了数据结构中的失效订单,减少不准确的规则产生,更可靠地挖掘客户未表达或表达不清晰的定制产品需求。
附图说明
46.图1为一种基于数据时效更新的定制产品隐性需求挖掘方法的流程图;
47.图2为本发明定制产品隐性需求挖掘方法的生命树结构示意图;
48.图3为一种基于数据时效更新的定制产品隐性需求挖掘系统的架构图;
49.图4为本发明装置的示意图。
具体实施方式
50.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
51.在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
52.应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
53.下面结合附图对本发明的具体实施方式进行更为完整、清晰地描述,图1为一种基于数据时效更新的定制产品隐性需求挖掘方法,包括如下步骤:
54.(1)获取并标准化定制产品历史订单信息,将用户的需求信息转化为标准化需求;具体为:
55.从用户数据库中导出定制产品的历史订单信息,并标准化该历史订单信息和订单时间。将用户的需求信息分类,并检验是否满足产品设计要求,得到需求分类信息;再将需求分类信息转化为标准需求。所述标准化具体为订单中的需求参数和设计参数可分为连续参数和离散参数,将连续参数按照一定的数值间隔划分为离散参数,并对所有离散参数进行数值编码。订单时间以时间戳的形式进行表示,提高数据处理效率。
56.(2)将订单数据转化为生命树结构,订单信息以树路径的形式表示;具体为:
57.所述生命树结构融合了真实树木的生命周期特征,用于储存订单信息和时间信息的数据结构。所述订单数据包括项目信息、时间信息和项目频率;所述项目信息以树路径进行表示,项目频率保存在树节点中,时间信息在树路径的叶节点中;生命树中最大的时间节点信息保存于根节点中,当插入的订单时间大于根节点时间时,更新根节点时间信息。
58.所述生命树结构具有以下特性:树路径通过树节点的链接表示,树节点可分为时间根节点、路径节点、时间叶节点。时间根节点是树结构的起点,保存了树结构内部最大时间;时间叶节点为树路径的尾端节点,保存了订单的时间信息和项目信息;路径节点为链接根节点和叶节点的节点,只保存了订单的项目信息。具有相同项目名称的节点通过节点链接连接在一起。树路径的节点以项目的频率降序先后顺序排列,频率越高的项目节点越靠近根节点。每当新的数据插入时,项目频率将同步更新,树结构将根据新的项目频率顺序调整节点位置。
59.所述树结构的数据更新具体为:首先,重新统计项目的频率信息,并以降序排序。其次,通过对比前后项目频率顺序,得到频率变化的项目列表l
change
。根据新的项目频率重构树结构,检索l
change
中项目相关的树节点,从下而上进行节点调换,直到满足最新的项目频率顺序。
60.若在这个过程中,一个树路径的时间叶节点变为路径节点,则其时间信息保存到新产生的叶节点中;若调换的父节点r频率大于子节点q,则父节点分裂出一个兄弟节点r

,r

频率计数为父节点r与子节点q的频率计数之差,即r

.count=r.count-q.count,再将节点r和节点q调换。
61.将新订单中的项目按照项目频率降序逐个插入生命树中,每个订单时间信息保存在对应树路径的叶节点中。当插入的订单时间大于根节点时间时,更新根节点时间信息。插入后,树结构中的每一级存在两个或多个相同项目名称的节点,则合并节点,他们的计数相加。若新的数据时间大于根节点的时间,则更新根节点的时间信息。重复上述步骤,直到新增订单数据全被插入到生命树结构中。
62.(3)通过衰减窗口模型计算节点活力值;具体为:
63.衰减窗口模型中,通过节点链接遍历时间叶节点,获得节点中每个交易td的时间信息和项目信息,计算每个交易td的活力值v(td),计算公式如下:
64.v(td)=∑v(i,td)/|td|
65.其中,i为交易里的项目,v(i,td)是项目i在交易td中的相对重要程度衡量因子,|td|为交易的项目数。根据每笔交易的活力值v(td),计算每一个时间叶节点的活力值v(ld),计算公式如下:
66.v(ld)=∑v(td)
×ft-d
67.其中,d为每个交易td的时间信息,t为时间根节点包含的时间信息,f为活力衰减因子。
68.(4)判断并删除无效树路径并调整树结构;具体为:
69.从第一个时间净叶节点开始,当时间净叶节点的活力低于设定的最低阈值时,其关联的树路径被定义为失效路径。对于单个失效路径,失效路径的时间叶子节点首先被删除,路径上其他路径节点的计数减去时间叶子节点的计数。若计数相减后,路径节点的计数为0,则删除该节点。当所有的失效路径都被删除后,根据生命树结构特性(3)更新并调整树结构。
70.若节点活力值大于设定的最低阈值,则跳转至下一时间叶节点,直至所有净叶节点被遍历。
71.(5)根据频率阈值重构生命树,通过重构后的生命树生成关联规则;具体为:
72.首先通过生命树结构挖掘稀有项目和频繁项目,稀有项目支持度supp(x)满足式子maxrare>supp(x)≥minrare,频繁项目支持度满足supp(x)≥minfre,其中minrare为稀有项目最小阈值,maxrare为稀有项目最大阈值,minfre为频繁项目最小阈值。获得两类项目后,通过剔除生命树结构中不满足稀有或频繁阈值的树路径,获得条件模式树以及频繁/稀有模式集合,最终生成关联规则。
73.(6)基于步骤(5)得到的关联规则集和步骤(1)得到的标准需求,通过关联规则的映射,实现定制产品需求隐性需求的挖掘。
74.图2为本发明定制产品隐性需求挖掘方法的生命树结构示意图,图中左侧为项目的频率计数表,右侧为生命树结构,结构中黑色节点为时间根节点,白色节点为路径节点,灰色节点为时间叶节点,订单以树路径的形式保存在结构中,括号内为该订单的产生时间。时间根节点保存了生命树中的最大交易时间,时间叶节点保存了单个或多个相同树路径的
订单的时间。一条树路径中的项目以项目频率降序排序,节点间通过节点链接相链接。不同树路径的相同的路径部分将合并,对应的节点计数相加。频率计数表与生命树结构对应的项目节点相链接,方便节点遍历提高计算效率。当需要插入一条订单时,首先更新项目频率计数表,按照最新的项目频率降序排列订单项目并重构生命树结构,最后依次将项目节点插入树结构中,订单的时间信息保存在最后的叶节点中。
75.图3为一种基于关联规则定向优化的定制产品需求转化系统,包括:
76.(a)交互界面:用户可通过交互界面选择产品,表达需求信息。
77.(b)需求分析模块:将获取的需求信息分类并检验是否满足产品设计,输出需求分类信息。(c)需求标准化模块:将需求分析模块输出的需求分类信息(多样的个性化需求)转化为标准需求。
78.(d)生命树构建模块:将历史订单信息压缩保存为生命树结构,保存订单的交易信息和时间信息。
79.(e)树结构优化模块:计算树结构的时间叶子节点的活力值,删除树结构中无效的路径,减少无效交易对关联规则挖掘的干扰。
80.(f)模式提取模块:通过支持度阈值和最终的树结构,获得流行项目的条件模式树,并整合统计流行模式。
81.(g)规则提取模块:通过获得的流行模式集,计算并筛选得出可靠的关联规则。
82.(h)需求挖掘模块:利用需求标准化模块输出的标准需求和规则提取模块输出的隐性需求关联规则挖掘隐性需求并转化可用的显式需求。
83.与前述基于数据时效更新的定制产品隐性需求挖掘方法的实施例相对应,本发明还提供了基于数据时效更新的定制产品隐性需求挖掘装置的实施例。
84.参见图4,本发明实施例提供的一种基于数据时效更新的定制产品隐性需求挖掘装置,包括一个或多个处理器,用于实现上述实施例中的基于数据时效更新的定制产品隐性需求挖掘方法。
85.本发明基于数据时效更新的定制产品隐性需求挖掘装置的实施例可以应用在任意具备数据处理能力的设备上,该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图4所示,为本发明基于数据时效更新的定制产品隐性需求挖掘装置所在任意具备数据处理能力的设备的一种硬件结构图,除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能,还可以包括其他硬件,对此不再赘述。
86.上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
87.对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的
需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
88.本发明实施例还提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现上述实施例中的基于数据时效更新的定制产品隐性需求挖掘方法。
89.所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元,例如硬盘或内存。所述计算机可读存储介质也可以是任意具备数据处理能力的设备,例如所述设备上配备的插接式硬盘、智能存储卡(smart media card,smc)、sd卡、闪存卡(flash card)等。进一步的,所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据,还可以用于暂时地存储已经输出或者将要输出的数据。
90.以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献