一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用于量子数字签名协议选择及参数配置的方法与流程

2022-08-28 01:22:27 来源:中国专利 TAG:


1.本发明属于量子信息技术领域,具体涉及一种用于量子数字签名协议选择及参数配置的方法。


背景技术:

2.验证消息的真实性和完整性是所有数字签名方案的共同目标。传统签名方法依赖于计算安全。然而,随着计算技术的发展以及量子计算机的出现,传统方法面临着前所未有的威胁。幸运的是,2001年gottesman提出了第一个量子数字签名(qds)协议,这给当前严峻的安全形势提供了全新的解决思路。2012年,clarke等人完成了第一个qds实验,其实验系统较为复杂。之后,wallden等人于2016年提出了利用量子密钥分发(quantum key distribution,qkd)实现qds的思想,这使实际qds更易实现。2018年,amiri等人提出并实现了测量设备无关量子数字签名(mdi-qds)协议,该协议可以有效抵抗所有针对探测器端的侧信道攻击,这大幅度地提高了qds系统的安全性。此外,这些早期的qds研究,其协议参数并没有被优化,研究应用中大多使用固定的参数集(如信号光强、基选择概率等)。2019年,chen等人首次提出了在qds上实现全参数优化的方法,随后一系列采用参数优化的理论和实验研究相继展开。到目前为止,已有的qds协议大多采用局部搜索算法(lsa)对协议参数进行优化。然而,其优化过程往往会消耗大量的时间资源,尤其是在使用mdi-qds和双场量子数字签名(tf-qds)协议进行签名分发时,其优化往往需要几小时甚至一天的时间。


技术实现要素:

3.本发明的目的在于提供一种用于量子数字签名协议选择及参数配置的方法,该方法有利于在不提高系统复杂度的前提下提高量子数字签名的效率。
4.为实现上述目的,本发明采用的技术方案是:一种用于量子数字签名协议选择及参数配置的方法,包括以下步骤:
5.s1、构建机器学习所需的特征数据格式;
6.s2、构建机器学习所需的标签数据格式;
7.s3、获取通用数据集;
8.s4、构建随机森林回归模型并利用通用数据集进行训练和测试,得到达到最佳预测效果的随机森林回归模型;
9.s5、采用训练完成的随机森林回归模型,预测最优的量子数字签名协议以及该协议对应的配置参数。
10.进一步地,步骤s1中,选取对签名率影响较大的几个系统参数作为特征,包括:暗计数率y0、本底误码率ed、单光子探测器的探测效率η、通信双方所发送的光脉冲总数n以及通信双方的传输距离l;将选取的5个特征组合为5维的特征向量,作为机器学习所需的特征数据格式:x=[y0,ed,η,n,l]。
[0011]
进一步地,步骤s2中,对于量子数字签名,其密钥生成协议基于三强度诱骗态
bb84,为了优化发送方alice到第一接收方bob或第二接收方charlie的kgp过程所产生的密钥比特,对如下的协议参数进行优化:信号态强度μ、诱骗态强度ν、信号态强度的选择概率p
μ
以及诱骗态强度的选择概率p
ν
;采用p
xa
和p
xb
分别表示发送方选择x基的概率和接收方选择x基的概率;将协议的标签数据格式记为:y
bb84
=[μ,ν,p
μ
,p
ν
,p
xa
,p
xb
];
[0012]
进一步地,步骤s2中,对于量子数字签名,其密钥生成协议基于三强度诱骗态bb84,为了优化发送方alice到第一接收方bob或第二接收方charlie的kgp过程所产生的密钥比特,对如下的协议参数进行优化:信号态强度μ、诱骗态强度v、信号态强度的选择概率p
μ
以及诱骗态强度的选择概率pv;采用p
xa
和p
xb
分别表示发送方选择x基的概率和接收方选择x基的概率;将协议的标签数据格式记为:y
bb84
=[μ,v,p
μ
,pv,p
xa
,p
xb
];
[0013]
对于测量设备无关、双场量子数字签名过程,同样采用y
bb84
的构建过程,分别从四强度诱骗态测量设备无关协议和四强度诱骗态双场协议中提取各协议所需优化的参数,并将其构建为对应的标签数据格式:y
mdi
=[μ,v,w,p
μ
,pv,pw],y
tf
=[μ,v,w,p
μ
,pv,pw,ε];其中,μ为信号态强度,v和w均为弱诱骗态强度,对应选择概率分别为p
μ
,pv,pw,ε为发双场协议下的发送概率;
[0014]
考虑到不同协议的标签数据格式存在差异,采用占位法来消除不同协议在维度上的不同,主要是给y
bb84
添加新维度使其与y
md1
和y
tf
在维度上保持一致;此外,额外引入一个维度,并标记为1、2、3来分别表征bb84、测量设备无关、双场协议;
[0015]
则机器学习模型所用标签数据格式表示为如下的8维向量:
[0016]
y=[protocol,para1,para2,para3,para4,para5,para6,para7]
[0017]
其中,protocol为待选择协议对应的协议标号,para1,para2,...,para7为待选择协议中所需优化的协议参数。
[0018]
进一步地,步骤s3中,将特征数据格式中的5个系统参数限制到设定的特征范围中;在5个系统参数的特征范围内进行等间隔的取值,取间隔为n,则生成n5特征数据;再利用不同qkd协议的密钥生成公式,并结合lsa算法优化不同协议的配置参数,以获取3份数据量大小为n5的标签数据;然后通过比较不同协议的密钥率大小,将三个协议关联起来,即直接根据密钥率r将无效数据剔除后的y
bb84
,y
mdi
和y
tf
这三份标签数据合并为一份标签数据y。
[0019]
进一步地,步骤s4中,将通用数据集中数据进行归一化处理,以消除不同数据间的量纲差异;然后将处理后的通用数据集中数据划分出80%的训练集和20%的测试集,并使随机森林回归模型在训练集上进行拟合学习;在学习过程中,采用网格搜索和交叉验证方法来优化随机森林回归模型的参数,使随机森林回归模型达到最佳的预测效果。
[0020]
进一步地,采用randomforestregressor学习算法来拟合随机森林回归模型,并在学习时结合网格搜索和交叉验证方法来加以优化。
[0021]
进一步地,步骤s5中,将特征数据格式x的情景数据供给所述随机森林回归模型,获取y格式的标签数据;对所述标签数据的第一维度进行取整操作,以使回归预测变为分类输出,即获取所需预测的最优协议;而所述标签数据的其他维度即为所需预测协议对应的最佳参数配置。
[0022]
与现有技术相比,本发明具有以下有益效果:本发明根据所需选择的qds协议以及相应的协议优化参数进行合适的数据集格式设计以及通用数据的获取,再构建并获取具有最佳预测效果的随机森林回归器模型,然后再利用该模型根据指定的使用场景选择出最佳
的数字签名协议以及该协议对应的最佳参数配置。相比传统的lsa 遍历比较来选择数字签名协议并优化协议配置,本发明方案采用基于机器学习的随机森林回归模型预测方法,构建完成的机器学习模型可以直接使用在数字签名的分发阶段,加速了qds的kgp过程。因此,本发明可以根据用户诉求准确地选择出最优qds协议以及参数配置,降低时间资源损耗,从而在不提高系统复杂度的前提下极大的提高了量子数字签名的效率。
附图说明
[0023]
图1是本发明实施例的方法实现流程图。
[0024]
图2是本发明实施例中量子数字签名过程示意图。
[0025]
图3是本发明实施例中测量设备无关、双场量子数字签名过程示意图。
[0026]
图4是本发明实施例中随机森林回归模型的训练示意图。
[0027]
图5是本发明实施例中随机森林回归模型各参数重要性的示意图。
[0028]
图6是本发明实施例中随机森林回归模型的残差分布图。
[0029]
图7是本发明实施例中随机森林回归模型的混淆矩阵图。
具体实施方式
[0030]
下面结合附图及实施例对本发明做进一步说明。
[0031]
应该指出,以下详细说明都是示例性的,旨在对本技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常理解的相同含义。
[0032]
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0033]
量子数字签名主要包括分发阶段和消息阶段,且涉及到三方通信,主要是接收方alice和两个发送方bob、charlie。在分发阶段,alice-bob和alice-charlie各自独立的通过kgp过程来产生用于签名的密钥串。本发明主要关注分发阶段kgp过程的协议选择和参数配置,这里将bb84、测量设备无关、双场量子数字签名作为问题背景,为不同场景下的量子数字签名选择出最优的签名协议以及参数配置。
[0034]
如图1所示,本实施例提供了一种用于量子数字签名协议选择及参数配置的方法,包括以下步骤:
[0035]
s1、构建机器学习所需的特征数据格式。
[0036]
具体地,选取对签名率影响较大的几个系统参数作为特征,包括:暗计数率y0、本底误码率ed、单光子探测器的探测效率η、通信双方所发送的光脉冲总数n以及通信双方的传输距离l;将选取的5个特征组合为5维的特征向量,作为机器学习所需的特征数据格式:x=[y0,ed,η,n,l]。
[0037]
s2、构建机器学习所需的标签数据格式。
[0038]
针对如图2所示的量子数字签名,其密钥生成协议基于三强度诱骗态bb84,为了优化发送方alice到第一接收方bob或第二接收方charlie的kgp过程所产生的密钥比特,对如
下的协议参数进行优化:信号态强度μ、诱骗态强度v、信号态强度的选择概率p
μ
以及诱骗态强度的选择概率pv。此外,发送方alice选基进行态制备和接收方bob选基进行测量的概率可能有所不同。以x基为例,采用p
xa
和p
xb
分别表示发送方选择x基的概率和接收方选择x基的概率(alice-charlie-kgp过程的优化与此相同)。将协议的标签数据格式记为:y
bb84
=[μ,v,p
μ
,pv,p
xa
,p
xb
]。
[0039]
针对如图3所示的测量设备无关、双场量子数字签名过程,同样采用y
bb84
的构建过程,分别从四强度诱骗态测量设备无关协议和四强度诱骗态双场协议中提取各协议所需优化的参数,并将其构建为对应的标签数据格式:y
mdi
=[μ,v,w,p
μ
,pv,pw],y
tf
=[μ,v,w,p
μ
,pv,pw,ε]。其中,μ为信号态强度,ν和w均为弱诱骗态强度,对应选择概率分别为p
μ
,p
ν
,pw,ε为发双场协议下的发送概率。
[0040]
考虑到不同协议的标签数据格式存在差异,本实施例采用占位法来消除不同协议在维度上的不同,主要是给y
bb84
添加新维度使其与y
mdi
和y
tf
在维度上保持一致。此外,由于本方案还可以对协议进行预测,因此额外引入一个维度,并标记为1、2、3来分别表征bb84、测量设备无关、双场协议。
[0041]
综上,机器学习模型所用标签数据格式表示为如下的8维向量:
[0042]
y=[protocol,para1,para2,para3,para4,para5,para6,para7]
[0043]
其中,protocol为待选择协议对应的协议标号,para1,para2,...,para7为待选择协议中所需优化的协议参数。
[0044]
s3、获取通用数据集。
[0045]
本实施例将特征数据格式中的5个系统参数限制到设定的特征范围中;在5个系统参数的特征范围内进行等间隔的取值,以间隔n为例,则生成n5特征数据;再利用不同qkd协议的密钥生成公式,并结合lsa算法优化不同协议的配置参数,以获取3份数据量大小为n5的标签数据;然后通过比较不同协议的密钥率大小,将三个协议关联起来,即直接根据密钥率r将无效数据剔除后的y
bb84
,y
mdi
和y
tf
这三份标签数据合并为一份标签数据y。
[0046]
在步骤s3中,建立的通用数据集是无效密钥筛除后的数据。因为在根据特征范围进行不同协议的密钥分发时,不同协议的协议参数存在不同,所以就存在协议无法成码的情况,这时候就需要过滤掉这些无效数据。
[0047]
s4、构建随机森林回归模型并利用通用数据集进行训练和测试,得到达到最佳预测效果的随机森林回归模型。
[0048]
具体地,将通用数据集中数据进行归一化处理,以消除不同数据间的量纲差异;然后将处理后的通用数据集中数据划分出80%的训练集和20%的测试集,并使随机森林回归模型在训练集上进行拟合学习;在学习过程中,采用网格搜索和交叉验证方法来优化随机森林回归模型的参数,使随机森林回归模型达到最佳的预测效果。
[0049]
在本实施例中,采用randomforestregressor学习算法来拟合随机森林回归模型,并在学习时结合网格搜索和交叉验证方法来加以优化。
[0050]
s5、采用训练完成的随机森林回归模型,预测最优的量子数字签名协议以及该协议对应的配置参数。
[0051]
具体地,将特征数据格式x的情景数据供给所述随机森林回归模型,获取y格式的标签数据;对所述标签数据的第一维度进行取整操作,以使回归预测变为分类输出,即获取
所需预测的最优协议;而所述标签数据的其他维度即为所需预测协议对应的最佳参数配置。
[0052]
本发明提供的用于量子数字签名协议选择及参数配置的方法,其包括独立的模型训练和模型预测。模型训练完全基于满足需求设计的通用数据集,而训练好的回归器模型则可以保存下来,在量子数字签名分发阶段直接进行模型预测的使用。此外,本方法利用随机森林回归器模型,但不仅仅限于使用单项机器学习回归算法,算法的具体参数可以根据实际qds过程并结合网格搜索和交叉验证方法来进行优化调整。
[0053]
下面对本发明做进一步的详细说明。
[0054]
本发明方法将机器学习模型应用于量子数字签名应用中,以配置bb84-qds、mdi-qds、tf-qds为问题背景,将训练好的机器学习模型应用于量子数字签名的分发阶段。qds系统主要包括三个用户端alice端、bob端和charlie端,kgp过程则是alice-bob,alice-charlie各自独立地选择qkd协议进行签名密钥的分发,这里我们主要是根据用户诉求利用机器学习算法在短时间内获取最佳的qkd协议以及该协议相应的参数配置,从而提高kgp分发密钥量的同时,大幅度提高qds系统的效率。本方法具体包括如下步骤:
[0055]
步骤1、2、3,获取通用数据集:
[0056]
由于签名率主要受暗计数率y0、本底误码率ed、单光子探测器的探测效率η、通信双方所发光脉冲总数n、传输距离l等5个系统参数的影响,这里我们将特征数据格式设计为x=[y0,ed,η,n,l]。此外,对于标签数据格式的设计,鉴于问题背景中待选择协议拥有不同数量的协议参数,本方法采用占位法抹平其在维度上的差异,而后创建一个新维度并用标号来表示不同的待选择协议,这里记为:
[0057]
y=[protocol,para1,para2,para3,para4,para5,para6,para7]
[0058]
这里y中的protocol为待选择协议对应的协议标号,para1、para2、...para7为待选择协议中所需优化的协议参数。
[0059]
为了获取供给机器学习使用的通用数据集,本方法根据常见的用户需求将上述特征数据格式中的5个系统参数限制到表1所示的范围中。本方法在5个系统参数的特征范围内进行等间隔的取值,以间隔n为例,则可以生成n5特征数据。后续利用不同待选择qkd协议的密钥生成公式以及lsa优化,则可以获取n5种用户需求下的bb84-、mdi-、tf-qkd的最佳密钥生成率以及优化后的协议参数。对于每一种用户需求,本方法通过比较不同协议的密钥量大小,来确定该需求下的最佳协议以及该协议优化后的参数。这里还需要注意一点,n5种用户需求并不是每一种需求下协议都能够有效成码,因此,本方法需要剔除掉成码率不大于0的无用数据,随后才能正确地构建出包含特征数据和标签数据的通用数据集。
[0060]
表1系统参数的特征范围
[0061][0062]
步骤4,随机森林回归模型的构建:
[0063]
获取通用数据集后,按照8:2的比例将其划分为训练集和测试集,并在训练集上进行模型的学习,具体过程如图4所示。randomforestregressor随机有放回的从训练集s中抽取取样本数据sn,这是以rf为代表的bagging类集成算法的主要表现。此外,算法学习过程还会结合随机特征抽取来构建不同的决策树,众多决策树集成随机森林回归模型。对于模
型的预测输出,则取决于每棵决策树回归预测输出的均值。下面重点介绍随机森林模型构建过程中的决策树生成以及模型参数的调优。
[0064]
不管是分类决策树还是回归决策树,其都存在两个核心问题:如何选择决策树的划分点;如何决定决策树叶子节点的输出值。解决思路大多是遍历所有特征的特征值,然后选择效果最好的来作为分割点:分类树通过信息增益、信息增益比、gini系数来判断效果好坏;回归树则通过看孩子节点的残差平方和之和。之后再在各个孩子节点中继续选择分割点,直到层次达到了指定或者孩子节点只有一个样本,进而完成决策树的构建。总的来说,回归树对应着训练集数据所在输入空间的划分以及在划分单元上的输出值,具体的二叉决策树构建过程如下:
[0065]
(1)遍历全部特征的所有取值,对输入空间进行划分,直到取到特征j的取值s使得下述损失函数达到最小值,这样便得到了一个划分点。其中,输入空间划分为m个单元:r1,r2,

,rm每个区域的输出值就是:cm是该区域内所有点y值的平均数。
[0066][0067]
(2)用选定的对(j,s)划分区域并决定相应的输出值:
[0068]
r1(j,s)=x|x
(j)
≤s,r2(j,s)=x|x
(j)
》s
[0069][0070]
(3)继续对两个子区域调用步骤(1)和(2),直至满足停止条件:
[0071]
(4)将输入空间划分为m个区域r,r,

,r,生成决策树:
[0072][0073]
随机森林训练过程有必要对其进行参数调优,这里我们采用网格搜索和交叉验证的方法。对randomforestregressor算法中的n_estimators、max_depth、min_samples_split等参数进行优化。其中n_estimators用于指定原始训练集有放回随机抽取样本数据所生成的子数据集个数,即随机森林中决策树的个数;max_depth用于指定生成决策树的最大深度;min_samples_split用于指定决策树节点可分的最小样本数,主要用于控制策树的剪枝操作。网格搜索:在指定参数范围内按照一定步长将候选参数所有可能的取值进行排列组合,之后穷举遍历所有可能的参数组合以获取ml模型表现最好时的参数。但是一次网格搜索的结果可能存在一定的偶然性,所以网格搜索一般结合交叉验证共同使用。所谓的交叉验证就是将训练集进一步切分,以常见的k折交叉验证法为例:训练集中的k-1份仍作为training set用于遍历参数组合进行训练,而训练集中剩余的1份则作为validation set用于训练模型的评估,重复k次并选出k次ml模型平均效果最好时的参数组合。通过上述过程,我们获得优化后的参数分别为:90、82、1。
[0074]
至此,获取了能够根据用户需求进行协议选择和参数配置的随机森林回归模型,从上述决策树的构建过程中可以知道特征对决策树的构建起到了很重要的作用。为此,本方法研究了各个特征对随机森林的重要程度,具体如图5所示:可知传输距离在5个用户需
求特征中的重要程度最高。
[0075]
步骤5,获取最佳签名协议以及相应配置参数:
[0076]
使用训练完成的随机森林回归模型,预测指定用户需求下的最优量子数字签名协议以及该协议对应的配置参数。主要是将特征数据格式x的情景数据供给训练好的回归模型,获取y格式的预测数据。数据向量中包含了本方法所要预测的最优协议(第一维度)以及该协议的最优配置参数(其余维度)。此外,这里还需注意最优协议的选择属于分类任务,而利用回归模型预测出来的数据则是回归任务,为此我们需要对第一维度表征待选协议的标号进行取整操作,以实现回归任务到分类任务的转化。
[0077]
关于随机森林回归模型的性能评估,我们主要借助测试集对其进行分析。首先我们采用了下述几种常见的回归指标,具体评估数值以及预测准确率记录于表2:
[0078]
平均绝对误差(meanabsolute error,mae),用于评估回归模型预测结果和真实结果差异的平均值,其值越小说明ml模型对数据的拟合效果就越好,可以表示为:果差异的平均值,其值越小说明ml模型对数据的拟合效果就越好,可以表示为:均方误差(mean squared error,mse),用于计算预测结果和真实结果对应样本点误差平方和的均值,其值越小说明ml模型在数据预测方面的性能就越好,可以表示为:决定系数(r squared,coefficient ofdetermination r squared),一般被认为是衡量线性回归相对较好的指标,其取值范围在0到1之间,越靠近1说明ml模型对数据的拟合效果就越好,可以表示为:说明ml模型对数据的拟合效果就越好,可以表示为:上述表达式中的n为测试集数据量、yi为测试集中的真实结果、为ml模型使用测试集预测出来的结果、从表2的评估结果可以知道,本模型能够在qds应用中准确预测出满足用户需求的协议以及该协议对应的配置参数。
[0079]
表2随机森林回归模型的性能评估
[0080][0081]
图6为回归模型预测输出的残差分析图,即预测输出y第二维度上数据的残差。图中绿点为测试集上真值预测值间的残差情况,蓝色点为训练集上真值与预测值间的残差情况。从中我们可以发现,不管是在训练集还是测试集上,残差值大多小于0.02,这也就直观地表明了回归模型的预测准确性,以及不同用户需求下准确预测的鲁棒性。
[0082]
图7是随机森林回归模型用于不同用户需求下协议分类任务的混淆矩阵。首先我们知道,混淆矩阵常用于直观地展示分类器的好坏,这里我们用于展示本方法中采用取整操作实现回归到分类转换的效果。从图中可以看出,我们整体构建的机器学习模型能够准确的根据用户需求分类出最优的待选择协议,这也说明我们的取整操作让我们实现了回归合分类的统一,即在分类出最优协议的同时回归出该协议相应的最优参数配置。
[0083]
本发明的一种适用于最佳量子数字签名协议选择及参数配置的机器学习方法,为展示本方法相较于传统lsa 遍历比较方法的优越性,我们在相同配置的个人电脑上进行了耗时统计。这里注意一点,传统方案包括lsa参数优化和遍历比较两阶段,由于遍历比较的耗时相较于lsa优化过程基本可以忽略不计,本方法仅以lsa参数优化的时长作为传统方案
的时间损耗。最终结果表明传统方法需要数十个小时才能完成用户需求下最优协议选择和配置的任务,而我们的机器学习方案,在已获取回归模型的前提下仅需0.003s即可完成,这展示了机器学习在提高实际量子数字签名效率方面的巨大优势。
[0084]
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献