基于时间序列机器学习模型的资源需求预测的制作方法

2022-05-18 14:04:16 来源：中国专利 TAG：

基于时间序列机器学习模型的资源需求预测

背景技术：

1.需求预报（forecast）可以是利用行业（例如，招聘（recruitment）部门）来预测即将到来的时段内劳动力的差距（gap）的功用（utility）。需求预报可以在许多不同的行业中使用以促进对未来需求的规划。预报可以是基于过去数据、当前数据、趋势分析和/或诸如此类进行预测的过程。例如，组织可以使用预报技术来预测供应和/或需求的改变，从而使得组织能够采取一个或多个步骤，诸如雇用雇员，以针对供应和/或需求的改变进行准备。
附图说明
2.在以下详细描述中并且参考附图来描述示例，其中：图1a是示例装置的框图，该示例装置包括使用时间序列（time-series）机器学习模型来预测雇用需求的资源需求预测引擎；图1b是图1a的示例装置的框图，描绘了附加特征；图2是用于预测雇用需求的示例过程的示意图；图3是用于基于预测的雇用需求来生成工作描述并确定与工作描述对应的合适简档（profile）的示例过程的示意图；图4是包括非暂时性机器可读存储介质的示例计算设备的框图，该非暂时性机器可读存储介质存储使用时间序列机器学习模型来预测雇用需求的指令；以及图5是示出用于检索合适的简档连同对应于与预测的雇用需求相关联的熟练度（proficiency）的差距的匹配分数示例方法的流程图。
具体实施方式
3.理解熟练度对企业的相对价值可能是成功所希望的。在没有清楚理解企业关于企业的当前业务和即将到来的项目需要什么的情况下，对于企业而言可能难以确保雇员在正确的熟练度上是合格的。大多数企业可依赖于人类知识来通知雇用和训练。例如，管理者和人力资源（hr）人员知道需要人员配备的特定项目和任务，但是这缺失了企业内所需的全局图景（picture）、雇员移动所产生的风险以及缺乏对所需技能的训练。
4.由于缺乏关于即将到来的需求的先进信息，企业的招聘部门可能面临雇用的问题。而且，人工干预和假设可能产生有偏差且不准确的预测，这可能导致不适当的需求预报。另外，管理可能必须在运行中调整劳动力的成本和利用率。然而，整个需求履行工作流可能依赖于非计划的和专门（ad-hoc）的方法和决定。
5.本文中描述的示例可以提供获得与企业相关联的历史招聘数据，将与招聘参数的集合相关联的预处理的历史招聘数据划分为训练数据集、验证数据集和测试数据集，利用训练数据集来训练时间序列机器学习模型，利用验证数据集来验证经训练的时间序列机器学习模型，利用测试数据集来测试时间序列机器学习模型，基于成功的测试使用时间序列机器学习模型来预测针对即将到来的时段的资源需求，以及通过基于资源需求访问招聘站点（job site）来检索合适的简档连同匹配分数。
6.本文中描述的示例可以使用时间序列历史招聘数据来促进机器学习过程，以便提供自动化的先进需求预报来满足企业的雇用需求。需求预报可以利用招聘部门来预测在即将到来的时段中待雇用的雇员的数量。需求预测还可以基于不同的技术、角色、经验以及诸如此类来提供试探性（tentative）位置数量。此外，预测的资源需求可以预先向招聘部门和/或企业提供试探性图景，以在成本和资源方面向跨位置的不同技能和经验的雇用雇员或入职（on-board）雇员进行供应。
7.此外，考虑到不同技术、角色和/或经验中的当前后补充（back-fill）和/或战略要求，本文中描述的示例可以预先产生对招聘和雇用机构的实际资源需求的接近（close）。企业可以预先启动计划以满足时间线，这可以帮助及时向（一个或多个）入职合适候选人交付团队，以及时交付任务。因此，企业可以具有相当多的时间来对相关团队进行计划和预算，以便以更平滑的方式使新雇员入职。
8.在以下描述中，出于解释的目的，阐述了许多具体细节以便提供对本技术的透彻理解。然而，对于本领域技术人员来说将清楚的是，没有这些具体细节也可以实践本装置、设备和系统。说明书中对“示例”或类似语言的引用意味着所描述的特定特征、结构或特性被包括在至少该一个示例中，但不一定在其他示例中。
9.现在转到附图，图1a是示例装置100的框图，示例装置100包括使用时间序列机器学习模型108来预测雇用需求的资源需求预测引擎106。如本文中所使用的，术语“装置”可以表示但不限于个人计算机（pc）、服务器、笔记本计算机、平板计算机、智能电话、个人数字助理或任何通用计算设备。
10.示例装置100可以包括处理器102和耦合到处理器102的存储器104。存储器104可以包括资源需求预测引擎106。在一些示例中，装置100的部件可以以硬件、机器可读指令或其组合来实现。在一个示例中，资源需求预测引擎106可以被实现为包括硬件和编程的任何组合的引擎或模块，以实现本文中描述的功能性。
11.在操作期间，资源需求预测引擎106可以获得一时段的与企业相关联的的历史招聘数据。如本文中所使用的，“历史招聘数据”可以是在某时间间隔期间在多个时间值处重复生成和/或捕捉的数据到序列。此外，资源需求预测引擎106可以净化（cleanse）和灌输（impute）历史招聘数据。此外，资源需求预测引擎106可以将与招聘参数的集合相关联的净化和灌输的历史招聘数据划分为训练数据集、验证数据集和测试数据集。
12.资源需求预测引擎106可以利用训练数据集来构建时间序列机器学习模型108并且利用验证数据集来验证经训练的时间序列机器学习模型108。例如，验证数据集可以是向训练/构建时间序列机器学习模型108隐瞒（hold back from）的数据的样本，其用于在调谐模型的参数时给出模型技能的估计。验证数据集可以向模型的训练隐瞒，但是代之以用于在最终模型之间进行比较或选择时给出最终调谐模型的技能的无偏差（unbiased）估计。
13.此外，资源需求预测引擎106可以利用测试数据集来测试时间序列机器学习模型108。在一个示例中，通过使用时间序列机器学习模型108预测对应于测试数据集的一时段的资源需求并且通过将针对该时段的预测资源需求与测试数据集进行比较来确定时间序列机器学习模型108的准确度，资源需求预测引擎106可以测试时间序列机器学习模型108。在该示例中，当准确度大于或等于预定义阈值时，时间序列机器学习模型108可以用于预测针对即将到来的时段的资源需求。
14.此外，资源需求预测引擎106可以基于成功测试（即，当准确度大于或等于预定义阈值时）使用时间序列机器学习模型108来预测针对即将到来的时段的资源需求。在该示例中，时间序列机器学习模型108可以利用与企业相关联的最近（latest）的可用时间序列招聘数据来预测针对即将到来的时段的资源需求。例如，资源需求预测引擎106可以管理与预测的资源需求相对应的、针对即将到来的时段（例如，接下来的3个月）待雇用的雇员的数量的财务和/或基础设施资源。资源需求预测引擎106可以将预测的资源需求作为推荐传输到用户设备以供显示。
15.在一个示例中，资源需求预测引擎106可以基于熟练度约束中的替换和战略约束中的至少一个来预测针对即将到来的时段的资源需求。熟练度约束可以从由不同技术领域、角色和经验组成的组选择。例如，资源需求预测引擎106可以预测熟练度约束的差距并且确定用于弥补该差距的推荐。此外，资源需求预测引擎106可以将推荐传输到用户设备以供显示。
16.因此，可以使用时间序列机器学习模型108考虑战略要求（例如，新雇用）和替换要求来针对即将到来的月份或季度评估雇用需求的自动化预报。利用时间序列机器学习模型108可以克服与雇用需求预测相关联的人为错误和不正确假设。此外，时间序列机器学习模型108可以使得能够有效地针对接近准确的雇用计数而提供成本和/或基础设施资源。
17.此外，时间序列机器学习模型108的输出可以存储在数据库中以用于将来的分析。而且，时间序列机器学习模型108的输出可以被提供给与雇用和供应新雇用相关联的各种工具，如图1b中所示。
18.图1b是图1a的示例装置100的框图，描绘了附加特征。例如，图1b的类似命名的元素可以在结构和/或功能上类似于参考图1a描述的元素。如图1b中所示，装置100可以经由相应的网络接口从各种数据源152获得历史招聘数据。例如，数据源152可以包括关于人员流失（attrition）、位置改变、退休、技能升级、战略投资、实习到雇用转换、承包商（contractor）到雇用转换、技术领域、经验、即将到来的项目、各种部门以及任何其他雇用/项目相关信息的数据。
19.存储器104还可以包括简档匹配引擎154，以将针对即将到来的时段的资源需求输入到基于自然语言处理（nlp）的模型156中，其可以使用工作描述数据库和资源需求来生成与所雇用劳动力的熟练度的差距相对应的工作描述，并且使用工作描述来生成搜索串。此外，简档匹配引擎154可以将搜索串输入到搜索引擎158，以通过访问招聘站点来确定与工作描述相对应的合适的简档连同匹配分数。此外，简档匹配引擎154可以将合适的简档连同匹配分数一起传输到用户设备160。在一个示例中，合适的简档可以显示在用户设备160的图形用户接口162上。在另一示例中，可以在装置100的显示器上显示合适的简档。
20.在一些示例中，装置100的部件可以以硬件、机器可读指令或其组合来实现。在一个示例中，资源需求预测引擎106和简档匹配引擎154可以被实现为包括硬件和编程的任何组合的引擎或模块，以实现本文中描述的功能性。
21.装置100可以包括计算机可读存储介质，其具有（例如，编码有）可由处理器执行以实现本文中关于图1a和1b描述的相应功能性的指令。在一些示例中，与实现装置100的部件的功能的指令和关于存储介质在本文中描述的任何附加指令有关的本文中描述的功能性可以被实现为引擎或模块，包括硬件和编程的任何组合以实现本文中描述的模块或引擎的
功能性。装置100的部件的功能也可以由相应的处理器来实现。在本文中描述的示例中，处理器可以包括例如包括在单个设备中或跨多个设备分布的一个处理器或多个处理器。
22.图2是用于预测雇用需求的示例过程200的示意图。在一个示例中，过程200可以通过图1a和1b的资源需求预测引擎106来实现。在202处，可以从（一个或多个）数据源234接收历史招聘数据，并且可以预处理历史招聘数据。在一个示例中，预处理历史招聘数据可以包括创建具有多个招聘参数的数据集（例如，在204处）、净化数据集（例如，在206处）、灌输数据集（例如，在208处）或其任何组合。
23.在一个示例中，净化数据集可以包括检测和替换历史招聘数据中的变量的离群值。在另一示例中，净化数据集可以包括对历史招聘数据中的变量的值进行归一化（normalize）。此外，可以针对任何缺失数据值、无效数据值或缩放每个数据集中的数据值灌输数据集。在该示例中，可以处理缺失或无效数据值以灌输值来替换缺失或无效数据值。换言之，数据集可以被灌输以插入对缺失值的估计，其可以对关于未缺失的值的分析方法具有最小影响。数据集可以通过不同的统计过程来灌输，例如均值、前一输入、下一输入、自动化方法（例如r中的mice）以及诸如此类。
24.此外，在210处，可以基于招聘参数的集合来过滤预处理的数据集。在一个示例中，可以从多个招聘参数选择招聘参数的集合。在一个示例中，在212处，过滤预处理的数据集可以包括通过统计相关选择显著的招聘参数的集合。此外，在214处，可以执行共线性（colinear）检查以去除共线的招聘参数。此外，在216处，招聘参数可通过肘形图（elbow graph）验证。因此，可以过滤与所选择的招聘参数相关联的预处理的数据集。
25.在218处，可以利用具有所选择的招聘参数的经净化和灌输的数据集来生成时间序列机器学习模型。在一个示例中，生成时间序列机器学习模型可以包括：-在220处，用所选择的招聘参数稳定（stationarizing）所净化和灌输的数据集。-在222处，基于自相关函数（acf）或部分自相关函数（pacf）确定时间序列机器学习模型的参数值。例如，自回归和移动平均（arma）模型可以按照arma（p，q）来表示，其中，p是自回归（ar）的阶数（order）并且q是移动平均（ma）的阶数。两个阶数“p”和“q”可以基于acf和pacf来确定。-在224处，将具有所选择的招聘参数的经净化和灌输的数据集划分成训练数据、验证数据和测试数据。例如，基于基于时间的分布，经净化和灌输的数据集可以被分成70%的训练数据、10%的验证数据和20%的测试数据。换句话说，前70%的条目可以被提供作为训练数据，接下来10%的条目可以被提供作为验证数据，并且最后20%的条目可以被提供作为测试数据。-在226处，利用训练数据来构建所述时间序列机器学习模型。-在228处，利用10%验证数据来验证时间序列机器学习模型。在一个示例中，可以基于验证来调谐时间序列机器学习模型。-在230处，利用测试数据来预测所述时间序列机器学习模型（例如，如关于图1a所解释的）。
26.在232处，可以基于成功测试使用时间序列机器学习模型来针对即将到来的时段预测雇用需求。时间序列机器学习模型的输出可以向管理、信息技术（it）支持、采购部门和账户部门提供关于技能、技术和经验方式雇用计数的自动化先进思想，从而使得能够相应
地供应成本和基础设施资源。输出可以被馈送到各种工具，用于生成工作描述和用于搜索合适的简档，如图3中所描述的。
27.图3是用于基于雇用需求生成工作描述并确定对应于工作描述的合适简档的示例过程300的示意图。在302处，由时间序列机器学习模型生成的输出（即，雇用需求）可作为输入被馈送到基于nlp的模型。针对熟练度的每个差距，可以基于雇用需求利用工作描述数据库的帮助生成包括工作职位名称、所需技能、角色和责任的列表、资格、经验、最好具备（good to have）、工作位置以及诸如此类的详细工作描述。
28.在304处，可以从工作描述选择关键词并且可以使用所选择的关键词生成搜索串。在一个示例中，基于nlp的模型可用于使用工作描述来生成搜索串。在306处，可基于详细工作描述将搜索串提供给搜索引擎。
29.在308处，使用nlp生成的“搜索串”，可以访问内部人才管理数据库，并且可以检索合适的简档。在310处，使用nlp生成的“搜索串”，可以通过feedly
™
/web爬行器来访问外部招聘站点（例如，naukri
®
、linkedin
®
以及诸如此类），并且可以检索合适的简档。合适的简档可包括数据，诸如要求（requisition）id、匹配简档百分比，其中，百分比越高表示最佳合适的候选者、实际简历（例如，以pdf格式、word格式或诸如此类）、姓名、联系信息、通知时段持续时间、每个候选者找工作的活跃程度以及诸如此类。
30.在312处，搜索引擎可以推荐合适的简档。在314处，可以将合适的简档存储在企业的数据库中。在316处，合适的简档可以例如经由电子邮件被自动发送到用户设备。在一些示例中，合适的简档可以显示在用户设备的显示器上。在履行之后，可以针对每个预测的雇用需求对选择/拒绝的候选者计数以及总体预测和搜索引擎的益处来测量成功。所测量的成功可以用于时间序列机器学习模型的进一步学习。
31.应当理解，图2和3中所描绘的过程表示一般化的图示，并且可以添加其他过程，或者可以去除、修改或重新布置现有过程，而不脱离本技术的范围和精神。另外，应当理解，过程可以表示存储在计算机可读存储介质上的指令，所述指令在执行时可使得处理器进行响应、执行动作、改变状态和/或进行决定。替代地，过程可表示功能上等效的电路执行的功能和/或动作，功能上等效的电路比如是模拟电路、数字信号处理电路、专用集成电路（asic）或与系统相关联的其他硬件部件。此外，流程图不旨在限制本技术的实现，而是流程图示出了设计/制造电路、生成机器可读指令或使用硬件和机器可读指令的组合来执行所示过程的功能信息。
32.图4是包括非暂时性机器可读存储介质404的示例计算设备400的框图，该非暂时性机器可读存储介质404存储指令以使用时间序列机器学习模型来预测雇用需求。计算设备400可以包括通过系统总线通信地耦合的处理器402和机器可读存储介质404。处理器402可以是解释并执行存储在机器可读存储介质404中的机器可读指令的任何类型的中央处理单元（cpu）、微处理器或处理逻辑。机器可读存储介质404可以是随机存取存储器（ram）或可以存储信息和可以由处理器402执行的机器可读指令的另一类型的动态存储设备。例如，机器可读存储介质404可以是同步dram（sdram）、双倍数据速率（ddr）、rambus dram（rdram）、rambus ram等，或者是诸如软盘、硬盘、cd-rom、dvd、笔驱动器以及诸如此类的存储存储器介质。在示例中，机器可读存储介质404可以是非暂时性机器可读介质。在示例中，机器可读存储介质404可以是远程的，但是可由计算设备400访问。
33.如图4中所示，机器可读存储介质404可以存储指令406-416。在示例中，指令406-416可以由处理器402执行以使用时间序列机器学习模型来预测企业的雇用需求。指令406可以由处理器402执行，以获得某时段的与企业相关联的历史招聘数据。
34.指令408可以由处理器402执行以预处理历史招聘数据。在一个示例中，预处理历史招聘数据的指令可包括净化历史招聘数据、灌输历史招聘数据或其组合的指令。在其他示例中，预处理历史招聘数据的指令可包括使用历史招聘数据生成与多个招聘参数相关联的数据集以及利用多个招聘参数预处理所生成的数据集的指令。在一个示例中，可以从多个招聘参数选择招聘参数的集合。数据集可以是时间序列数据集，其包括在时间的连续时段中测量的可观察量（observable）的一系列值。
35.指令410可以由处理器402执行以基于招聘参数的集合来过滤预处理的历史招聘数据。指令412可以由处理器402执行以利用与时段的一部分相关联的过滤的历史招聘数据来构建时间序列机器学习模型。
36.指令414可以由处理器402执行以利用与时段的剩余部分相关联的过滤的历史招聘数据来测试时间序列机器学习模型。在一个示例中，测试时间序列机器学习模型的指令可以包括指令以使用经训练的时间序列机器学习模型来针对时段的剩余部分预测资源需求，以及通过将针对时段的剩余部分的预测的资源需求与和时段的剩余部分相关联的历史招聘数据进行比较来确定经训练的时间序列机器学习模型的准确度。当准确度大于或等于预定义阈值时，时间序列机器学习模型可以用于预测针对即将到来的时段的资源需求。
37.在一些示例中，非暂时性机器可读存储介质404可以包括指令以在准确度小于预定义阈值时通过调谐模型参数来利用与修改的时段相关联的历史招聘数据重新训练经训练的时间序列机器学习模型的指令。
38.指令416可以由处理器402执行以基于成功测试使用时间序列机器学习模型来预测针对即将到来的时段的资源需求。在一个示例中，预测针对即将到来的时段的资源需求的指令可以包括指令以检索与企业相关联的实时招聘数据，以及在熟练度约束下预测针对即将到来的时段的资源需求，这是通过使用时间序列机器学习模型分析实时招聘数据。熟练度约束可以包括但不限于位置、技术领域、角色、经验和/或诸如此类。例如，时间序列机器学习模型可以预测在特定位置中、在特定项目中、在特定角色中、具有特定经验水平或其任何组合的待雇用的雇员的数量。
39.图5是示出用于检索对应于与预测的雇用需求相关联的熟练度差距的合适的简档连同匹配分数的示例方法500的流程图。应当理解，图5中所描绘的过程表示一般化图示，并且可以添加其他过程，或者可以去除、修改或重新布置现有过程，而不脱离本技术的范围和精神。另外，应当理解，所述过程可表示存储在计算机可读存储介质上的指令，所述指令在执行时可使得处理器进行响应、执行动作、改变状态和/或进行决定。替代地，过程可表示功能上等效的电路执行的功能和/或动作，功能上等效的电路比如是模拟电路、数字信号处理电路、专用集成电路（asic）或与系统相关联的其他硬件部件。此外，流程图不旨在限制本技术的实现，而是流程图示出了设计/制造电路、生成机器可读指令或使用硬件和机器可读指令的组合来执行所示过程的功能信息。
40.在502处，可以经由网络获得某时段的与企业相关联的历史招聘数据。在504处，可以预处理与企业相关联的历史招聘数据。在506处，与招聘参数的集合相关联的预处理的历
史招聘数据可以利用定义的比例以时间顺序方式被划分为训练数据集、验证数据集和测试数据集。在一个示例中，可以通过应用多个招聘参数之间的统计相关来选择招聘参数的集合。例如，招聘参数的集合可以选自如下组，所述组由人员流失、位置改变、退休、技能升级、战略投资、实习到雇用转换、承包商到雇用转换、技术领域和经验组成。在一些示例中，可以利用针对多个招聘参数中的每个招聘参数的值/相关数据点生成文件（例如，csv文件）。此外，可以每次用最近数据点来更新文件，以改进下一运行期间的资源需求预报。
41.在一个示例中，可以基于自相关函数（acf）或部分自相关函数（pacf）来确定时间序列机器学习模型的参数值，以使预处理的历史招聘数据稳定。在508处，例如，在使预处理的历史招聘数据稳定时，可以利用训练数据集来构建时间序列机器学习模型。在510处，可以用验证数据集来验证经训练的时间序列机器学习模型。在512处，可以利用测试数据集来测试时间序列机器学习模型。在514处，可以基于成功测试使用时间序列机器学习模型来预测针对即将到来的时段的资源需求。在一个示例中，可以通过基于替换和战略约束预测针对即将到来的时段的资源需求来预测针对即将到来的时段的资源需求。
42.在516处，可以通过基于资源需求访问招聘站点来检索合适的简档连同匹配分数。在一个示例中，检索合适的简档连同匹配分数可以包括：-将针对即将到来的时段的资源需求输入到基于自然语言处理（nlp）的模型中，-由基于nlp的模型使用工作描述数据库和资源需求来生成与雇用的劳动力的熟练度的差距相对应的工作描述，-通过nlp模型使用工作描述生成搜索串，-经由将搜索串输入到搜索引擎，检索对应于工作描述的合适的简档连同匹配分数，以及-经由网络将合适的简档连同匹配分数传输到用户设备。
43.可以注意到，本技术方案的上述示例仅用于说明的目的。尽管已经结合其具体实现描述了该技术方案，但是多个修改可能是可能的，而在本质上不脱离本文中所述主题的教导和优势。在不脱离本技术方案的精神的情况下，可以进行其他替换、修改和改变。本说明书（包括任何所附权利要求、摘要和附图）中公开的所有特征和/或如此公开的任何方法或过程的所有步骤可以以任何组合来组合，除了其中至少一些这样的特征和/或步骤相互排斥的组合之外。
44.如本文中所用，术语“包括”、“具有”及其变型具有与术语“包含”或其适当变型相同的含义。此外，如本文中所使用的，术语“基于”意指“至少部分地基于”。因此，被描述为基于一些刺激的特征可以基于该刺激或包括该刺激的刺激的组合。
45.已经参照前述示例示出和描述了本说明书。然而，应当理解，在不脱离所附权利要求书中限定的本主题的精神和范围的情况下，可以做出其他形式、细节和示例。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于区块链的多节点融合监控和监管方法与流程

基于时间序列机器学习模型的资源需求预测的制作方法

相关文献

最热文献