一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于模型融合的来访量预测方法、装置、设备及存储介质与流程

2022-02-19 03:51:49 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,尤其涉及一种基于模型融合的来访量预测方法、装置、设备及存储介质。


背景技术:

2.楼盘来访量影响着置业顾问的业绩同时也影响着楼盘的成交量,每天的楼盘的客户来访量是一个未知数。现如今每个楼盘的来访量都不相同,就会出现这样的情况:一个楼盘有较多的置业顾问来接待客户但当天来访的客户较少;一个楼盘有少量的置业顾问来接待客户但当天来访的客户较多。这样就会出现“小材大用”或者“大材小用”的情况。
3.因此,急需一种能够预测楼盘来访量的方法。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种基于模型融合的来访量预测方法、装置、设备及存储介质。
5.一种基于模型融合的来访量预测方法,所述方法包括:获取每个楼盘的基本数据,所述基本数据包括来访数据、程序浏览数据和楼盘数据;连接服务器,获取天气数据,所述天气数据包括预测数据和历史数据;对所述基本数据和所述天气数据进行预处理,得到目标基本数据和目标天气数据;将所述目标基本数据和目标天气数据,输入所述时间序列模型中,得到第一来访量预测值;将所述目标基本数据和目标天气数据,输入所述lightgbm回归模型中,得到第二来访量预测值;融合所述时间序列模型和所述lightgbm回归模型,并基于所述第一来访量预测值和所述第二来访量预测值,根据预设算法得到目标来访量预测值。
6.在其中一个实施例中,所述天气数据分为温度字段、天气字段、风速字段和空气情况字段。
7.在其中一个实施例中,对所述基本数据和所述天气数据进行预处理,得到目标基本数据和目标天气数据,具体为:对所述来访数据进行缺失值填补;对所述天气数据进行split拆分,数据类型转化和数据标注,得到目标天气数据。
8.在其中一个实施例中,对所述天气数据进行split拆分,数据类型转化和数据标注,得到目标天气数据步骤,具体为:对所述温度字段进行split拆分,符号删除和数据类型转化,得到整型的目标温度字段;对所述天气字段进行split拆分,并根据天气情况表分别进行天气情况标注,得到目标天气字段;对所述风速字段进行split拆分,并根据风速情况表分别进行风速情况标注,得到目标风速字段;对所述空气情况字段进行split拆分,并根据空气质量表分别进行风速质量标注,得到目标空气情况字段;由所述目标温度字段、所述目标天气字段、所述目标风速字段和所述目标空气情况字段构成目标天气数据。
9.在其中一个实施例中,所述预设算法具体为:计算所述第一来访量预测值和所述第二来访量预测值的平均值。
10.一种基于模型融合的来访量预测装置,包括基本数据获取模块、天气数据获取模块、数据预处理模块、模型预测模块和模型融合模块,其中:所述基本数据获取模块用于,获取每个楼盘的基本数据,所述基本数据包括来访数据、程序浏览数据和楼盘数据;所述天气数据获取模块用于,连接服务器,获取天气数据,所述天气数据包括预测数据和历史数据;所述数据预处理模块用于,对所述基本数据和所述天气数据进行预处理,得到目标基本数据和目标天气数据;所述模型预测模块用于,将所述目标基本数据和目标天气数据,输入所述时间序列模型中,得到第一来访量预测值;所述模型预测模块还用于,将所述目标基本数据和目标天气数据,输入所述lightgbm回归模型中,得到第二来访量预测值;所述模型融合模块用于,融合所述时间序列模型和所述lightgbm回归模型,并基于所述第一来访量预测值和所述第二来访量预测值,根据预设算法得到目标来访量预测值。
11.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的基于模型融合的来访量预测方法的步骤。
12.一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述各个实施例中所述的基于模型融合的来访量预测方法的步骤。
13.上述基于模型融合的来访量预测方法、装置、设备及存储介质,通过提取各楼盘的基本数据,并且连接服务器获取天气数据,对基本数据和天气数据进行预处理后,分别输入时间序列模型和lightgbm回归模型中,得到各自的来访量预测值,最终将两个模型融合,并直接求两个来访量预测值的平均值,得到目标来访量预测值,从而实现对楼盘来访量的预测,并可以适当调整营销模式以及人员安排,进一步提高销售的工作效率以及楼盘的销售业绩。
附图说明
14.图1为一个实施例中基于模型融合的来访量预测方法的流程示意图;
15.图2为一个实施例中基于模型融合的来访量预测装置的结构框图;
16.图3是一个实施例中设备的内部结构图。
具体实施方式
17.为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
18.在一个实施例中,如图1所示,提供了一种基于模型融合的来访量预测方法,包括以下步骤:
19.s110获取每个楼盘的基本数据,基本数据包括来访数据、程序浏览数据和楼盘数据。
20.具体地,将各个楼盘的每日来访量提取出来;提取每个楼盘每日的楼书小程序浏览量;提取每个楼盘剩余户数,为后续步骤提供数据支持。
21.s120连接服务器,获取天气数据,天气数据包括预测数据和历史数据。
22.具体地,连接服务器,通过python爬虫,爬取历史天气、未来7天的天气数据。历史
数据从昨天到前365天的天气数据。
23.在一个实施例中,步骤s120中的天气数据分为温度字段、天气字段、风速字段和空气情况字段。具体地,天气数据字段包括:当日最高温、最低温、天气、风速、空气情况。
24.s130对基本数据和天气数据进行预处理,得到目标基本数据和目标天气数据。
25.在一个实施例中,步骤s130具体为:对来访数据进行缺失值填补;对天气数据进行split拆分,数据类型转化和数据标注,得到目标天气数据。具体地,对于时间序列模型输入的数据:单独提取日期、来访量字段。将数据中的缺失值进行填补,使用前一天来访量与后一天来访量的平均值。如果连续有缺失值,使用上一年的那一天来访量进行填补。对天气数据进行split拆分,数据类型转化和数据标注,得到目标天气数据。其中,split拆分即为常规的将字符串进行分割,获取需要的内容。
26.在一个实施例中,步骤对天气数据进行split拆分,数据类型转化和数据标注,得到目标天气数据步骤,具体为:对温度字段进行split拆分,符号删除和数据类型转化,得到整型的目标温度字段;对天气字段进行split拆分,并根据天气情况表分别进行天气情况标注,得到目标天气字段;对风速字段进行split拆分,并根据风速情况表分别进行风速情况标注,得到目标风速字段;对空气情况字段进行split拆分,并根据空气质量表分别进行风速质量标注,得到目标空气情况字段;由目标温度字段、目标天气字段、目标风速字段和目标空气情况字段构成目标天气数据。
27.具体地,当日最高温、最低温字段处理:爬取的温度字段例如:25
°‑
35
°
,将温度字段进行split拆分,将符号
°
删除,最后将数据类型转化为整型。
28.天气字段处理:爬取的天气字段例如:晴~多云、晴、阴~小雨,将天气字段进行split拆分,拆分为日前天气和日后天气,然后将日前天气和日后天气按照天气恶劣程度进行标号,如{'晴':0;'多云':1;'阴':2;'雾':3;'小雨':4;'雨夹雪':5;'中雨':6;'大雨':7;'阵雨':8;'雷阵雨':9;'暴雨':10}
29.处理后如下表:
30.天气(原字段)日前天气(处理后)日后天气(处理后)晴~多云0(晴)1(多云)阴2(阴)2(阴)阴~小雨2(阴)4(小雨)
31.风速字段处理:
32.风速(原字段)风速(处理后)东风1级1东北风2级2西南风3级3
33.空气情况字段处理:
34.空气质量(原字段)空气质量(处理后)优1良0
35.滑动窗口处理:通过以上步骤将数据处理好之后,将来访量字段进行7次滑动窗口
处理,每滑动一次就生成一个新字段,用来描述当天的前几天来访量。
36.s140将目标基本数据和目标天气数据,输入时间序列模型中,得到第一来访量预测值。
37.具体地,将上述步骤s130中的目标基础数据和目标天气数据,输入到时间序列模型,得到第一来访量预测值。
38.s150将目标基本数据和目标天气数据,输入lightgbm回归模型中,得到第二来访量预测值。
39.具体地,lightgbm回归模型为一种回归模型,ligthgbm是boosting集合模型中的新进成员,由微软提供,它和xgboost一样是对gbdt的高效实现,原理上它和gbdt及xgboost类似,都采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。其中,gbdt算法,全称梯度下降树,在传统机器学习算法里面是对真实分布拟合的最好的几种算法之一。使用lightgbm回归模型,输入目标基本数据和目标天气数据进行预测。lightgbm多分类模型其实是在gbdt算法框架下改进的一种基于决策树算法的快速、分布式、高性能的gbdt框架,其分别通过单边梯度采样(gradient

based one

side sampling)、互斥特征合并(exclusive feature bundling)、直方图算法(histogram)三项技术实现在更少的样本、更少的特征、更少的内存下解决高维度大数据算法的效率和可扩展性。
40.s160融合时间序列模型和lightgbm回归模型,并基于第一来访量预测值和第二来访量预测值,根据预设算法得到目标来访量预测值。
41.具体地,时间序列arma模型不支持输入多个特征进行训练,所以其预测结果与外部因素无关,结果不准确。回归模型对时间序列不敏感。因此将两个模型结果进行融合,融合后的结果更加准确。
42.在一个实施例中,步骤s160中的预设算法具体为:计算第一来访量预测值和第二来访量预测值的平均值。
43.具体地,将步骤s140和步骤s150模型预测出来的每日来访量分别平均,作为最终预测结果。
44.上述实施例中,通过提取各楼盘的基本数据,并且连接服务器获取天气数据,对基本数据和天气数据进行预处理后,分别输入时间序列模型和lightgbm回归模型中,得到各自的来访量预测值,最终将两个模型融合,并直接求两个来访量预测值的平均值,得到目标来访量预测值,从而实现对楼盘来访量的预测,并可以适当调整营销模式以及人员安排,进一步提高销售的工作效率以及楼盘的销售业绩。
45.在一个实施例中,如图2所示,提供了一种基于模型融合的来访量预测装置200,该装置包括基本数据获取模块210、天气数据获取模块220、数据预处理模块230、模型预测模块240和模型融合模块250,其中:
46.基本数据获取模块210用于,获取每个楼盘的基本数据,基本数据包括来访数据、程序浏览数据和楼盘数据;
47.天气数据获取模块220用于,连接服务器,获取天气数据,天气数据包括预测数据和历史数据;
48.数据预处理模块230用于,对基本数据和天气数据进行预处理,得到目标基本数据和目标天气数据;
49.模型预测模块240用于,将目标基本数据和目标天气数据,输入时间序列模型中,得到第一来访量预测值;
50.模型预测模块240还用于,将目标基本数据和目标天气数据,输入lightgbm回归模型中,得到第二来访量预测值;
51.模型融合模块250用于,融合时间序列模型和lightgbm回归模型,并基于第一来访量预测值和第二来访量预测值,根据预设算法得到目标来访量预测值。
52.在一个实施例中,提供了一种设备,该设备可以是服务器,其内部结构图可以如图3所示。该设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该设备的处理器用于提供计算和控制能力。该设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该设备的数据库用于存储配置模板,还可用于存储目标网页数据。该设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于模型融合的来访量预测方法。
53.本领域技术人员可以理解,图3中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
54.在一个实施例中,还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法,所述计算机可以为上述提到的基于模型融合的来访量预测装置的一部分。
55.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read

only memory,rom)或随机存储记忆体(random access memory,ram)等。
56.显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(rom/ram、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
57.以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献