一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于数据孪生的自动化场景信息生成方法与流程

2021-11-05 20:06:00 来源:中国专利 TAG:


1.本发明涉及场景生成领域,尤其涉及一种基于数据孪生的自动化场景信息生成方法。


背景技术:

2.现有计量系统仿真实验室中场景信息,都是通过手动方式对现有的场景电力、多表、风力、窃电等场景情况进行整理,结合各场景实际可配置参数项和电力知识经验进行人工判断分析得到相应的场景信息。在这种方式的过程中数据收集、数据整理、实际场景调研、分析都需要人工操作处理,耗费人力和时间,并且人工的整理难免存在失误,而且面对电力的多样化趋势、复杂环境,当前这种手动处理方式更显劣势。


技术实现要素:

3.本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于数据孪生的自动化场景信息生成方法,以达到快捷、高效自动化场景信息生成目的。为此,本发明采取以下技术方案。
4.一种基于数据孪生的自动化场景信息生成方法,其特征在于包括以下步骤:
5.1)从场景样本库中获取场景样本数据;
6.场景样本库中的场景样本数据为已知场景样本数据,其包括用户电力数据、档案数据、场景项数据;
7.2)获取新场景数据并处理;
8.新场景数据为未知场景数据,其包括用户电力数据和档案数据,新场景数据经过数据转化、清洗处理后录入系统数据库,以供分析处理,生成新场景数据对应的新场景信息;
9.3)差异分析
10.对场景样本数据和新场景数据进行差异分析,得到差异因素;
11.4)扰动分析;
12.将场景样本数据加入到对应关系模型函数中得到差异波动值,加入差异因素波动值对场景样本数据进行扰动处理;其中,关系模型函数为:对场景样本数据、新场景数据、差异因素进行逻辑回归训练操作得到当前差异因素下用户数据属性和差异波动值的对应关系模型函数;
13.5)扰动处理后的场景样本数据与新场景数据进行对比分析;判断两者数据或者趋势的相似度;
14.6)若相似度超过设定阈值时,表示实现模拟从而得到新的场景信息,保存新场景信息到场景样本库;若否,则认为模拟失败。
15.本技术方案依数字孪生技术体系为核心,通过自动化处理分析实现场景信息的自动生成。实现快捷、高效自动化场景信息生成。
16.作为优选技术手段:在步骤3)中,采用方差分析法进行差异分析,通过分析不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小,得到差异因素。
17.作为优选技术手段:在步骤4),进行扰动分析时,通过正态分布、均匀分布2种规则和差异因素生成算法模拟出新样本数据;
18.对于满足正态分布规则的计量数据,按正态分布规则结合差异因素模拟数据;根据中心极限定理,从正态总体n(μ,σ2)中,随机抽取例数为n的样本,样本均数也服从正态分布,即使是从偏态总体中抽样,当n足够大时,样本均数的分布仍然服从正态分布
19.1)首先获取样本数据x1,x2,...x
n
,计算样本均值:
[0020][0021]
则样本标准差为:
[0022][0023]
2)估算整体均值为
[0024][0025]
估算整体标准差为:
[0026][0027]
3)根据数据服从正态总体n(μ,μ2)分布,生成模拟数据样本x

(x
’1,x
’2......x’y
),其中y为需要模拟的数据总数;
[0028]
4)利用李德伯格

莱维中心极限定理,如果随机变量序列x1,x2...x
n
独立同分布,并具有有限的数学期望和方式,则对一切x∈r有
[0029][0030]
则对服从均匀分布的随机变量x
i
,只要n足够大,则随机变量服务n(0,1);
[0031]
5)首先根据随机函数生成n个[0,1]区间的随机数x
i
,按要标生成y个,s
y
服从n(nμ,nσ2),其中n=200,μ=0.5,可得出:
[0032]
[0033]
根据线性转换x
i
~n(0,1),可得:
[0034]
y
i
=σx
i
μ~n(μ,σ2)
[0035]
6)根据样本统计规则中生成的数据对照模拟数据样本x’再结合均匀分布算法的根据随机数函数生成n个[0,1]区间对应的x
i
的原理,生成正态化的场景样本数据。
[0036]
作为优选技术手段:关系模型函数的约束条件为:两个变量间有线性关系;变量是连续变量;变量均符合正态分布;且二元分布也符合正态分布;两变量独立。
[0037]
作为优选技术手段:在步骤6)中,当相似度超过0.8时,输出新场景数据对应的新场景信息自动录入样本数据库,否则结束自动化衍生操作无结果输出。作为对上述技术方案的进一步完善和补充,本发明还包括以下附加技术特征。
[0038]
作为优选技术手段:在步骤3)差异分析时,场景样本数据和新场景数据进行皮尔森相关系数分析计算表现出两者的差异,得到差异因素
[0039]
有益效果:本技术方案依数字孪生技术体系为核心,通过自动化处理分析实现场景信息的自动生成。实现快捷、高效自动化场景信息生成。解决现有模拟仿真系统的规模化应用效果差异较大、缺少大规模、系统级、复杂环境、多信道融合的仿真环境的问题。本技术方案满足各类能源计量新方法、新系统、新设备的推广可行性验证需求,各类能源计量故障的实验室研究分析需求,各类能源计量标准指标体系验证需求,实现对各种场景的真实还原,有效支撑各类能源计量新技术的探索研究及推广实施。
附图说明
[0040]
图1是本发明的流程图。
[0041]
图2是本发明的分析处理流程图。
具体实施方式
[0042]
以下结合说明书附图对本发明的技术方案做进一步的详细说明。
[0043]
如图1所示,本发明包括以下步骤:
[0044]
1)从场景样本库中获取场景样本数据;
[0045]
场景样本库中的场景样本数据为已知场景样本数据,其包括用户电力数据、档案数据、场景项数据;
[0046]
2)获取新场景数据并处理;
[0047]
新场景数据为未知场景数据,其包括用户电力数据和档案数据,新场景数据经过数据转化、清洗处理后录入系统数据库,以供分析处理,生成新场景数据对应的新场景信息;
[0048]
3)差异分析
[0049]
对场景样本数据和新场景数据进行差异分析,得到差异因素;
[0050]
4)扰动分析;
[0051]
将场景样本数据加入到对应关系模型函数中得到差异波动值,加入差异因素波动值对场景样本数据进行扰动处理;其中,关系模型函数为:对场景样本数据、新场景数据、差异因素进行逻辑回归训练操作得到当前差异因素下用户数据属性和差异波动值的对应关系模型函数;
[0052]
5)扰动处理后的场景样本数据与新场景数据进行对比分析;判断两者数据或者趋势的相似度;
[0053]
6)若相似度超过设定阈值时,表示实现模拟从而得到新的场景信息,保存新场景信息到场景样本库;若否,则认为模拟失败。
[0054]
以下结合具体的实施例对本发明作进一步的说明:
[0055]
(一)应用数据情况
[0056]
本案例是低压三相用户窃电场景类型,依据真实场景样本库中低压三相用户的场景信息、用户连续10日的电力数据信息和新输入的同类型用户连续10日电力数据信息,进行了如下实例应用。
[0057]
1.场景样本数据信息
[0058]
负荷数据:
[0059][0060][0061]
电量数据:
[0062]
cons_nocons_namesj_datedl_valxsl_val用户编号用户名称时间用电量线损率
62201***0176余*站8/1111.20037.562201***0176余*站8/129.78399.862201***0176余*站8/1310.081510.162201***0176余*站8/1410.82969.962201***0176余*站8/1510.371410.362201***0176余*站8/1610.577510.162201***0176余*站8/1711.46649.762201***0176余*站8/1812.140610.262201***0176余*站8/1910.99379.862201***0176余*站8/2011.12279.9
[0063]
场景信息数据项:
[0064]
a相电压异常,电能表失压。
[0065]
2.新场景数据:
[0066]
负荷数据:
[0067][0068][0069]
电量数据:
[0070]
cons_nocons_namesj_datedl_valxsl_val
用户编号用户名称时间电量线损率21091***6059宁*司8/1121.0477.521091***6059宁*司8/1220.51559.821091***6059宁*司8/1320.602510.121091***6059宁*司8/1420.61689.921091***6059宁*司8/1519.997410.321091***6059宁*司8/1620.84310.121091***6059宁*司8/1720.74489.721091***6059宁*司8/1820.801410.221091***6059宁*司8/1921.42019.821091***6059宁*司8/2020.78459.9
[0071]
(二)分析处理
[0072]
分析处理如图2所示。
[0073]
(a)差异分析:通过方差分析算法检测样本数据和新场景数据差异的显著性。方差是用来表示随机变量与期望值之间的离散程度的一个数值。方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:实验条件和随机误差。
[0074]
实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示,记作ssb,组间自由度dfb。
[0075]
随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作ssw,组内自由度dfw。总偏差平方和sst=ssb ssw。组内ssw、组间ssb除以各自的自由度(组内dfw=n

m,组间dfb=m

1,其中n为样本总数,m为组数),得到其均方msw和msb,一种情况是处理没有作用,即各组样本均来自同一总体,msb/msw≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,msb>>msw(远远大于)。msb/msw比值构成f分布。用f值与其临界值比较,推断各样本是否来自相同的总体。最终通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小,得到差异因素。
[0076]
(b)扰动:通过正态分布、均匀分布2种规则和差异因素生成算法模拟出新样本数据。
[0077]
对于满足正态分布规则的计量数据,按正态分布规则结合差异因素模拟数据。根据中心极限定理,从正态总体n(μ,σ2)中,随机抽取例数为n的样本,样本均数也服从正态分布,即使是从偏态总体中抽样,当n足够大时,样本均数的分布仍然服从正态分布
[0078]
1)首先获取样本数据x1,x2,...x
n
,计算样本均值:
[0079]
其中x1,x2,...x
n
表示负荷、电量数据的各个数据项,例如电流、电压、负荷等。
[0080]
其中n表示各个数据项有多少个数据值。
[0081]
结果表示各项平均值。
[0082][0083]
则样本标准差为:
[0084][0085]
2)估算整体均值为
[0086]
μ0表示估算整体均值
[0087]
σ0表示估算整体标准差值
[0088][0089]
估算整体标准差为:
[0090][0091]
3)根据数据服从正态总体n(μ,μ2)分布,生成模拟数据样本x

(x
’1,x
’2......x’y
),其中y为需要模拟的数据总数。
[0092]
4)利用李德伯格

莱维中心极限定理,如果随机变量序列x1,x2...x
n
独立同分布,并具有有限的数学期望和方式,则对一切x∈r有
[0093][0094]
则对服从均匀分布的随机变量x
i
,只要n足够大,则随机变量服务n(0,1)。
[0095]
5)首先根据随机函数生成n个[0,1]区间的随机数x
i
,按要标生成y个,s
y
服从n(nμ,nσ2),其中n=200,μ=0.5,可得出:
[0096][0097]
根据线性转换x
i
~n(0,1),可得:
[0098]
y
i
=σxi μ~n(μ,σ2)
[0099]
6)根据样本统计规则中生成的数据对照模拟数据样本x’再结合均匀分布算法的根据随机数函数生成n个[0,1]区间对应的x
i
的原理,生成正态化模拟数据c。
[0100]
(c)对比分析:把新场景数据和新生成的数据c进行对比分析,根据皮尔森相关系数计算相似度ρ,当趋势达到一定相似度,表示实现模拟,这时新的场景信息就是样本用户场景信息加上差异因素场景信息。
[0101]
皮尔逊相关系数(pearson correlation coefficient),又称皮尔逊积矩相关系
数(pearson product

moment correlation coefficient,简称ppmcc或pccs),是用于度量两个变量x【x:代表新场景数据】和y【y:代表新生成的数据c】之间的相关(线性相关),其值介于

1与1之间。
[0102]
两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商:
[0103][0104]
上式定义了总体相关系数,常用希腊小写字母ρ作为代表符号。估算样本的协方差和标准差,可得到皮尔逊相关系数,常用英文小写字母r代表:
[0105][0106]
r亦可由样本点的标准分数均值估计,得到与上式等价的表达式:
[0107][0108]
其中及σ
x
分别是对样本的标准分数、样本平均值和样本标准差。
[0109]
约束条件:
[0110]
1)两个变量间有线性关系
[0111]
2)变量是连续变量
[0112]
3)变量均符合正态分布,且二元分布也符合正态分布
[0113]
4)两变量独立
[0114]
相关强度范围定义:
[0115]
1)0.8

1.0 极强相关
[0116]
2)0.6

0.8 强相关
[0117]
3)0.4

0.6 中等程度相关
[0118]
4)0.2

0.4 弱相关
[0119]
5)0.0

0.2 极弱相关或无相关
[0120]
(d)新的场景信息
[0121]
经过上述处理差异分析、扰动处理、对比分析最终得到新的场景信息数据项:a相电压异常,电能表失压,负载下降。
[0122]
以上图1、2所示的一种基于数据孪生的自动化场景信息生成方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献