一种基于大数据的新能源汽车车型参数预测估计方法

2022-07-10 04:22:47 来源：中国专利 TAG：

1.本发明涉及车联网大数据分析领域，尤其涉及一种基于大数据的新能源汽车车型参数预测估计方法。

背景技术：

2.目前，在全世界范围内，为了应对全球气候问题，响应国家制定的碳中和战略，纯电动汽车领域基础科研与产业化研究呈现出热火朝天的景象。同时，随着传感器技术、物联网技术、大数据技术及人工智能技术的不断发展，高新技术在纯电动汽车领域的应用也越来越多。纯电动汽车逐渐呈现电动化与智能化的特征，人们也开始逐渐接受并越来越多地使用电动汽车，然而选购纯电动汽车过程中往往有几个核心参数指标消费者关注，其中主要就包括：电动汽车实际续航里程d
mi
、电动汽车实际百公里能耗e
i-100
和电动汽车充电时长t
i-real
等指标。
3.消费者购车时往往会考虑车型的续航、能耗和充电时长等指标。一般会采用nedc标准工况测试的方法，来获取车型续航d
nedc
指标，车型百公里能耗e
test
相关指标主要来源于测试平台对该车型的测试。同样地，车型充电时长指标t
test
主要来源于测试平台对该车型的测试。然而这些指标都是在标准工况下获得的，没有考虑到地区差异、温度差异、使用时长与行驶距离等工况因素。而现有可供参考的指标，主要来源于实验室的理论测试，车型设计者和消费者往往无法得知各个车型在不同城市，不同温度环境下的实际表现，因而对车型的了解会比较失真。
4.因而需要提供一种准确、高效且可靠的方法，为消费者选购能够提供较为准确的数据参考依据。

技术实现要素：

5.本发明提供的一种基于大数据的新能源汽车车型参数预测估计方法，主要解决的技术问题是：提供一种准确、高效且可靠的方法，以预测相关新能源车型重要性能参数指标，为消费者选购能够提供较为准确的数据参考依据。
6.为解决上述技术问题，本发明提供一种基于大数据的新能源汽车车型参数预测估计方法，包括：
7.从车联网大数据平台获取各新能源汽车的数据样本，包括每辆新能源汽车的静态参数信息和动态参数信息；其中，静态参数信息包括汽车质量w、最大功率p
max
、车辆理论续航d
nedc
、最大允许充电功率p
max-p
、动力电池容量v；动态参数信息包括历史运行时长ti、历史行驶距离di、慢充次数n
i-sc
、快充次数n
i-fc
、每次慢充充电电量e
i-sc
、每次快充充电电量e
i-fc
；
8.对所述数据样本采用数据清洗方法，清洗掉异常数据，然后按照如下维度对清洗后的数据样本进行分组：各个车型、各个城市、各种温度条件、各个历史使用时长、各个历史行驶里程；
9.基于分组情况以及数据样本，生成特征向量，然后将特征向量作为机器学习模型
的输入特征参数，以该车辆的平均满电续航d
mi
、平均百公里能耗e
i-100
以及平均充电充满时长t
ci
作为训练标签，以进行模型训练；
10.采用预设指标评估模型的精度，选择最优模型参数，得到目标预测模型；
11.获取待测车型的静态参数信息和动态参数信息，输入所述目标预测模型，输出得到所述待测车型的满电续航预测值、百公里能耗预测值以及充电充满时长预测值。
12.可选的，所述将特征向量作为机器学习模型的输入特征参数，以该车辆的平均满电续航d
mi
、平均百公里能耗e
i-100
以及平均充电充满时长t
ci
作为训练标签，以进行模型训练包括：
13.针对训练标签为平均满电续航d
mi
和平均百公里能耗e
i-100
，采用多标签梯度提升机算法模型，将所述特征向量作为输入进行模型训练；
14.针对训练标签为平均充电充满时长t
ci
，则采用单标签随机森林算法模型，将所述特征向量作为输入进行模型训练。
15.可选的，所述预设指标包括rmse平方根误差、mae平均绝对误差、mse平均平方误差、r2_score决定系数。
16.可选的，所述选择最优模型参数包括：采用网格搜索算法和三折交叉验证方法搜索模型的最优参数。
17.可选的，所述模型参数包括决策子树个数，树最大深度，最大特征数，叶子节点最少样本数，叶子树的最大样本数，叶子节点所需要的最小权值。
18.可选的，在针对训练标签为平均充电充满时长t
ci
，采用单标签随机森林算法模型进行模型训练时，所述特征向量还包括最大充电功率p
i-max
。
19.可选的，所述获取待测车型的静态参数信息和动态参数信息，输入所述目标预测模型，输出得到所述待测车型的满电续航预测值、百公里能耗预测值以及充电充满时长预测值包括：
20.获取待测车型的静态参数信息和动态参数信息，输入多标签梯度提升机目标预测模型，输出得到所述待测车型的满电续航预测值和百公里能耗预测值；
21.获取所述待测车型的静态参数信息、动态参数信息以及最大充电功率p
i-max
，输入单标签随机森林目标预测模型，输出得到所述待测车型的充电充满时长预测值。
22.可选的，还包括将特征向量的75％作为训练集，25％作为测试集。
23.本发明的有益效果是：
24.根据本发明提供的一种基于大数据的新能源汽车车型参数预测估计方法，主要预测的指标有车型的续航里程、百公里能耗、充电充满时长；本发明采用了车联网平台计算得到的海量车型运行的动态数据，通过数据切分、清洗及特征工程等方法，获得车型参数的特征向量，将车型特征向量作为机器学习模型训练数据，通过大规模数据集与机器学习模型训练使模型学习到车型参数的固有特征，并对未知车型、未知工况提供预测估计；本发明的目的在于为纯电动汽车设计研发/消费者选购/二手车评估等场景，提供一种分析预测工具。具体的，对于车型设计师，在关键指标设计时通过该工具可以提前预估该车型设计续航、能耗与充电时长参数是否满足预期指标；对于消费者，提供一种车型性能参数预测方法，消费者在选购纯电动汽车时，通过该预测分析工具可以获取到该车型的实际续航、能耗与充电时长等关键参数，更具体地，该模型可以预测关注车型在不同城市不同工况不同环
境下的关键运行参数；对于二手评估师，可基于本发明获取车辆当前残值，为二手车评估提供了数据支撑。
附图说明
25.图1为本发明实施例一的一种基于大数据的新能源汽车车型参数预测估计方法流程示意图；
26.图2为本发明实施例一的数据样本分组示意图；
27.图3为本发明实施例一的满电续航、百公里能耗预测模型架构示意图；
28.图4为本发明实施例一的充电时长耗预测模型架构示意图。
具体实施方式
29.为了使本发明的目的、技术方案及优点更加清楚明白，下面通过具体实施方式结合附图对本发明作进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
30.实施例一：
31.本实施例提供一种基于大数据的新能源汽车车型参数预测估计方法，请参见图1，主要包括：
32.s101、从车联网大数据平台获取各新能源汽车的数据样本。
33.车联网大数据平台按照gb/t32960采集获取各个企业上报的新能源汽车在线运行数据，对各个企业上传的报文数据进行解析切分并存储至数据仓库。从该数据仓库中即可获取得到所有汽车的数据样本。
34.其中，数据样本包括每辆新能源汽车的静态参数信息和动态参数信息；其中，静态参数信息包括但不限于汽车质量w、最大功率p
max
、车辆理论续航d
nedc
(也可能是其他续航测试标准，例如wltp、epa、cltc等)、最大允许充电功率p
max-p
、动力电池容量v。
35.表1车型静态参数信息
[0036][0037][0038]
动态参数信息包括但不限于历史运行时长ti、历史行驶距离di、慢充次数n
i-sc
、快充次数n
i-fc
、每次慢充充电电量e
i-sc
、每次快充充电电量e
i-fc
。
[0039]
表2车型动态参数信息
[0040]
名称符号历史运行时长ti(h)历史行驶距离di(km)慢充次数n
i-sc
快充次数n
i-fc
每次慢充充电电量e
i-sc
(kw
·
h)每次快充充电电量e
i-fc
(kw
·
h)
[0041]
s102、对数据样本采用数据清洗方法，清洗掉异常数据。
[0042]
数据清洗方法可采用现有任意方式，包括但不限于分布情况检验、稳定性检验、异常值检验与白噪声检验，本实施例对此不做限制。
[0043]
s103、按照如下维度对清洗后的数据样本进行分组：各个车型、各个城市、各种温度条件、各个历史使用时长、各个历史行驶里程。
[0044]
请参见图2所示，温度条件可以灵活划分，例如零下20摄氏度以下，-20～-10摄氏度、-10～0摄氏度之间、0～10摄氏度、10～20摄氏度之间、20摄氏度以上。
[0045]
历史使用时长可以灵活划分，例如3个月内、1年以内、3年以内、5年以内、10年以内、超过10年等。需要说明的是，历史使用时长指的是距离车辆生产下线时间/首次上户时间计算，历史运行时长ti指的是车辆处于启动状态的累计时长。
[0046]
历史行驶里程可以灵活划分，例如1000公里以内、1万公里以内、5万公里以内、10万公里以内、10万公里以上等。
[0047]
s104、基于分组情况以及数据样本，生成特征向量。
[0048]
继续参见图2，针对某分组内的车辆a0101，假设其属于车型a(对应词向量编码为1)，城市为“重庆”(对应词向量编码为4)，温度条件为10～20摄氏度(对应词向量编码为5)，历史使用时长为1年以内(对应词向量编码为2)、历史行驶里程为1万公里以内(对应词向量编码为2)；则可对应得到该车辆的分组向量为{1，4，5，2，2}；
[0049]
然后继续基于该车辆的静态参数和动态参数，确定其数据向量：
[0050]
假设其汽车质量w＝1870kg、最大功率p
max
＝180kw、车辆理论续航d
nedc
＝520km、最大允许充电功率p
max-p
＝50kw、动力电池容量v＝75kwh；
[0051]
假设其历史运行时长ti＝123h、历史行驶距离di＝3500km、慢充次数n
i-sc
＝9次、快充次数n
i-fc
＝2次、慢充充电电量e
i-sc
＝450kwh、快充充电电量e
i-fc
＝150kwh；
[0052]
基于上述静态参数和动态参数，即可确定该车辆的数据向量为{1870，180，520，50，75，123，3500，9，2，450，150}；
[0053]
综合该车辆的分组向量和数据向量，即可得到该车辆的特征向量{1，4，5，2，2，1870，180，520，50，75，123，3500，9，2，450，150}。
[0054]
本实施例中，对特征中的文本字段可采用词向量编码的方式处理。
[0055]
根据计算得到的特征向量，还可以采用不同的特征工程方法，构建出新的特征向量，来适应不同的算法模型，包括并不限于归一化、标准化等方法。
[0056]
s105、然后将特征向量作为机器学习模型的输入特征参数，以该车型的平均满电续航d
mi
、平均百公里能耗e
i-100
以及平均充电充满时长t
ci
作为训练标签，以进行模型训练。
[0057]
可选的，将特征向量的75％作为训练集，25％作为测试集。基于检验后的数据，对
各个车型分组内的数据采用去噪方法、聚类算法、求均值众数等计算方法进行计算求得该车型在某城市、某温度条件、某个使用时长条件以及行驶里程条件下的满电续航值、能耗值以及充电时长。
[0058]
需要说明的是，满电续航可基于车联网平台的车辆自身上报数据得到，不同厂家车型其满电续航计算策略不同，可直接从车联网提取其车端计算后的上报数据。
[0059]
该车型的百公里能耗为车联网车端计算后上报的数据。
[0060]
充电充满时长采用其起始soc小于20％且结束soc大于80％的充电区间来标记其充电充满时长，并计算了各个车型在各种分组条件下的均值。在预测车型满电续航与百公里能耗时，由于两个预测指标其关联因子具有一定的相关性，采用了一致的特征向量作为模型训练的输入，故而采用多标签梯度提升机(mt-gbm)机器学习模型来同时训练获取该车型的满电续航d
mi
和百公里能耗e
i-100
指标。请参见图3，针对训练标签为满电续航d
mi
和百公里能耗e
i-100
，采用多标签梯度提升机算法模型，将特征向量作为输入进行模型训练；
[0061]
在预测车型实际充电充满时长时，由于车型实际充电充满时长与充电过程中充电实际功率有较大关联，车辆实际充电时，由于电网调控等原因，实际充电功率不能达到最大额定功率，故而需要添加片段最大充电功率p
i-max
作为输入特征。请参见图4，针对训练标签为充电充满时长t
ci
，则采用单标签随机森林算法模型，将特征向量作为输入进行模型训练。
[0062]
s106、采用预设指标评估模型的精度，选择最优模型参数，得到目标预测模型。
[0063]
其中预设指标可采用rmse平方根误差、mae平均绝对误差、mse平均平方误差、r2_score决定系数等至少之一。
[0064]
本实施中，可采用网格搜索算法和三折交叉验证方法搜索模型的最优参数。模型参数包括但不限于决策子树个数，树最大深度，最大特征数，叶子节点最少样本数，叶子树的最大样本数，叶子节点所需要的最小权值。
[0065]
s107、获取待测车型的静态参数信息和动态参数信息，输入目标预测模型，输出得到待测车型的满电续航预测值、百公里能耗预测值以及充电充满时长预测值。
[0066]
获取待测车型的静态参数信息和动态参数信息，输入多标签梯度提升机目标预测模型，输出得到待测车型的满电续航预测值和百公里能耗预测值；
[0067]
获取待测车型的静态参数信息、动态参数信息以及最大充电功率p
i-max
，输入单标签随机森林目标预测模型，输出得到待测车型的充电充满时长预测值。
[0068]
根据本实施例提供的一种基于大数据的新能源汽车车型参数预测估计方法，主要预测的指标有车型的续航里程、百公里能耗、充电充满时长；本发明采用了车联网平台计算得到的海量车型运行的动态数据，通过数据切分、清洗及特征工程等方法，获得车型参数的特征向量，将车型特征向量作为机器学习模型训练数据，通过大规模数据集与机器学习模型训练使模型学习到车型参数的固有特征，并对未知车型、未知工况提供预测估计；本发明的目的在于为纯电动汽车设计研发/消费者选购/二手车评估等场景，提供一种分析预测工具。具体的，对于车型设计师，在关键指标设计时通过该工具可以提前预估该车型设计续航、能耗与充电时长参数是否满足预期指标；对于消费者，提供一种车型性能参数预测方法，消费者在选购纯电动汽车时，通过该预测分析工具可以获取到该车型的实际续航、能耗与充电时长等关键参数，更具体地，该模型可以预测关注车型在不同城市不同工况不同环境下的关键运行参数；对于二手评估师，可基于本发明获取车辆当前残值，为二手车评估提
供了数据支撑。
[0069]
显然，本领域的技术人员应该明白，上述本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在计算机存储介质(rom/ram、磁碟、光盘)中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以，本发明不限制于任何特定的硬件和软件结合。
[0070]
以上内容是结合具体的实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于计算机模型的年径流总量控制率优化方法与流程

一种基于大数据的新能源汽车车型参数预测估计方法

相关文献

最热文献