一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种回归算法的分布式概率型服务端实时电价预测方法与流程

2022-10-26 13:40:13 来源:中国专利 TAG:

1.本发明属于it与软件开发技术领域,具体为一种回归算法的分布式概率型服务端实时电价预测方法。


背景技术:

2.电价预测指的是在考虑市场供求关系,市场参与者的市场力,电力成本,以及电力市场体制结构、社会经济形势等重要因素影响的条件下,通过利用数学工具对历史数据进行分析和研究,探索事物之间的内在联系和发展变化规律,在满足一定精度和速度的情况下,对未来电力市场中的电力交易价格进行预测。
3.目前为止的电价预测,需要将电价相关属性因子数据,以及电价标签因子导出标注后,采用机器学习算法学习模型后实现预测,这样,无论实时交易电价对模型的影响、以及模型的获取、发布及使用方便性,都严重影响了电价预测与相关业务的质效;现有的传统数据库功能,也只能实现精确的“=”式查询,而当用于查询的属性列符合线性、二次或者某种阶次的拟合规律时,如果要查询不在属性集合内的值(例如属性列c1的值有2、3对应的另一列c2的数值,现在要查询c1列=2.5的c2列值),同样需要将数据从数据库中导出到文本文件,用机器学习算法进行人工拟合模型,然后再代入参数进行计算;而传统数据库,在产生实时电价交易数据的服务端,也不适合进行分析型智能预测计算;同时,将数据量特别大时,硬文件可能无法有效管理这些数据,对机器学习算法的执行也带来影响,使得工作无法开展。


技术实现要素:

4.针对现有技术的不足,本发明提供了一种回归算法的分布式概率型服务端实时电价预测方法,具有提高了效率与方便性的优点。
5.为实现上述目的,本发明提供如下技术方案:一种回归算法的分布式概率型服务端实时电价预测方法,包括如下步骤:s1、首先,通过电价预测查询sql解析后;s2、接着采用集成回归算法;s3、集成回归算法的每一颗集成子树所需要的数据集,在实现bagging时,采用分布式newsql数据库的region相邻选取的策略来实现;s4、利用分布式newsql数据库的分布计算节点,分布执行集成回归算法,迭代选举得到模型;s5、利用模型,代用sql语句中“=”后的域外值,得到回归拟合结果,同时,将集成回归模型的precision返回当成该结果的possibility输出;s6、在分布式newsql数据库htap的分析域进行,交易域的电价交易数据实时一致地向分析域同步,动态支持预测结果的实时性与准确性。
6.优选的,所述步骤s2中的集成回归算法的目的是对“=”号前谓词代表的列值c1与
select后面的列值c2、c3......进行学习拟合。
7.优选的,所述集成回归算法包括但不局限于:随机森林算法、gbdt回归算法。
8.优选的,所述步骤s3中采用分布式newsql数据库的region相邻选取的策略指的是,列如有region 1,2,3,4,5,6......,集成子树的数据集分别选(1、2), (2,3), (3,4), ......。
9.优选的,所述步骤s5中的sql语句对不处于属性列值集合中的电价值域,也可以进行查询,并且赋予查询结果概率(possibility)。
10.与现有技术相比,本发明的有益效果如下:本发明利用分布式newsql数据库的计算/数据自然分布能力,将机器学习算法嵌入到sql执行计划中,以及利用htap交易分析混合负载特性将业务交易即时产生的电价数据与在分型域实时一致自动同步的方案,实现了一种概率型sql,可以使sql语句对不处于属性列值集合中的电价值域,也可以进行查询,并且赋予查询结果概率(possibility),从而实现数据库服务端实时电价预测的功能;应对该方法,给电价查询sql语句赋予了回归拟合的能力,从而使得数据库表中具有某种相关关系的表列之间的“=”值查询,可以查询任意值,避免了导出单独重新计算的过程;交易分析混合负载特征的利用赋予电价预测结果由即时业务数据实时动态驱动;同时,对海量数据,采用分布式数据库计算/存储分布的优点,实现了在文件中无法实现的能力;从而该方法不仅提供了一种sql的新能力,同时提高了效率与方便性,对解决现实中此类问题带来了极大的优势。
具体实施方式
11.基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
12.本发明提供一种技术方案:一种回归算法的分布式概率型服务端实时电价预测方法,包括如下步骤:s1、首先,通过电价预测查询sql解析后;s2、接着采用集成回归算法;s3、集成回归算法的每一颗集成子树所需要的数据集,在实现bagging时,采用分布式newsql数据库的region相邻选取的策略来实现;s4、利用分布式newsql数据库的分布计算节点,分布执行集成回归算法,迭代选举得到模型;s5、利用模型,代用sql语句中“=”后的域外值,得到回归拟合结果,同时,将集成回归模型的precision返回当成该结果的possibility输出;s6、在分布式newsql数据库htap的分析域进行,交易域的电价交易数据实时一致地向分析域同步,动态支持预测结果的实时性与准确性;本发明基于分布式newsql数据库,实现了一种回归算法的分布式设计及基于此的概率型sql服务端实时电价预测方法的设计,从而可以在分布式数据库服务端,直接使现有sql语句对连续型数值型属性的电价特征,通过“=”式查询,以电价影响属性做为“=”左因子或者组合因子,并基于htap数据库业务交易域与预测分析域的实时数据一致特性,具有对不在电价已有属性值集合内值域的查询能力,从而实现实时电价预测,并且赋予结果以概
率(possibility),同时适用于海量的数据集及其扩展。
13.步骤s2中的集成回归算法的目的是对“=”号前谓词代表的列值c1与select后面的列值c2、c3......进行学习拟合;该方法,给电价查询sql语句赋予了回归拟合的能力,从而使得数据库表中具有某种相关关系的表列之间的“=”值查询,可以查询任意值,避免了导出单独重新计算的过程,提高了效率和方便性。
14.集成回归算法包括但不局限于:随机森林算法、gbdt回归算法;利用随机森林算法、gbdt回归算法二者的结合使用,交易分析混合负载特征的利用赋予电价预测结果由即时业务数据实时动态驱动。
15.步骤s3中采用分布式newsql数据库的region相邻选取的策略指的是,列如有region 1,2,3,4,5,6......,集成子树的数据集分别选(1、2), (2,3), (3,4), ......;采用该策略可对海量数据,采用分布式数据库计算/存储分布的优点,实现了在文件中无法实现的能力。
16.步骤s5中的sql语句对不处于属性列值集合中的电价值域,也可以进行查询,并且赋予查询结果概率(possibility);将机器学习算法嵌入到sql执行计划中,以及利用htap交易分析混合负载特性将业务交易即时产生的电价数据与在分型域实时一致自动同步的方案,实现了一种概率型sql,从而实现数据库服务端实时电价预测的功能。
17.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
18.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献