一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种新冠疫情背景下的广域健康知识获取方法及系统

2022-05-27 01:10:40 来源:中国专利 TAG:


1.本发明属于数字信息传输技术领域,尤其涉及一种新冠疫情背景下的广域健康知识获取方法及系统。


背景技术:

2.目前,在新冠疫情期间收集健康数据对人们生命安全和国家稳定有重大意义。自疫情爆发以来,可穿戴设备被广泛用来收集公民健康数据(心跳、步数等)。例如,whoop strap 3.0是一款可穿戴腕带,可以实时收集并监督心肺数据的变化,并通过蓝牙将其发送到公民手机中。穿戴了estimote公司研发的可穿戴设备,公民就能够实时更新其健康状态,并将数据与一个中央实体共享。patch 1ax生物传感器能够测量体温、呼吸频率、心电图和心率,并通过蓝牙将健康数据传输到公民手机。所有这些传感器和其他可穿戴设备可都被用于应对covid-19疫情。然而,人们在提供其健康数据方面总是表现的犹豫不决,缺少动力。因此,应设计一种复杂详尽的激励机制。
3.市场经济模型(market economy models)已经被广泛用来设计激励机制。现有工作大多集中于数据交易和数据共享中,使用的方法包括博弈论、拍卖、行为经济学、技术经济学、算法博弈论、多臂老虎机等。然而,由于网络资源有限,大量传输数据是不现实的。近年来兴起的“知识即服务(knowledge-as-a-service)”能够很好的解决这一问题,即,将数据提炼成知识再进行交易。有关知识交易的机制设计大多使用非合作博弈理论,这假定博弈参与人具有完全信息,这在现实中几乎是不可能的。此外,现存有关知识交易的研究没有考虑到知识生成的过程。因此,亟需设计一种新冠疫情背景下的广域健康知识获取方法及系统,以弥补现有技术的缺陷。
4.通过上述分析,现有技术存在的问题及缺陷为:现有技术没有同时考虑知识生成过程和知识交易过程,没有考虑不完全信息的情况,且现有工作大多集中于数据交易和数据共享中,由于网络资源有限,大量传输数据是不现实的。
5.解决以上问题及缺陷的难度为:需要设计一套集合知识生成和知识交易的多层、多实体、多目标框架,要准确分析各层各实体之间的经济互动;不完全信息意味着参与者要在不完全了解对手信息的情况下制定自己的最优决策,这是博弈研究的一个难点。
6.解决以上问题及缺陷的意义为:让本发明提出的框架更贴合实际情况,能够为现实生活中类似的系统或架构提供理论指导。


技术实现要素:

7.针对现有技术存在的问题,本发明提供了一种新冠疫情背景下的广域健康知识获取方法及系统,尤其涉及一种新冠疫情背景下基于区块链的广域健康知识获取方法及系统。
8.本发明是这样实现的,一种新冠疫情背景下的广域健康知识获取方法,其特征在于,所述新冠疫情背景下的广域健康知识获取方法包括:
9.假定hco需要宏观的公民健康知识,ldm能够在微观层面收集公民数据并将其训练为知识,公民是原始数据的提供者,所述新冠疫情背景下的广域健康知识获取方法包括知识生成阶段和知识交易阶段;
10.在知识生成阶段,hco向多个ldm发布一系列知识获取任务,在ldm选择接受某个任务后,将向感知区域内的公民发布数据收集需求,收集到数据后,ldm通过边缘ai算法将数据训练为知识;在知识交易阶段,ldms将知识有偿的卖给hco;所述边缘ai算法包括深度强化学习drl和支持向量机svm。
11.进一步,所述新冠疫情背景下的广域健康知识获取方法还包括:
12.利用交易链和数据链两种类型的区块链进行系统建模;交易链使用押金及退款机制保护知识交易阶段,使得参与人hco和n个ldm能够公平可信的进行交易;每个ldm均是一条数据链的基础设施提供者,ldms通过建立数据链来收集和管理来自公民可穿戴设备的数据;
13.其中,所述交易链包括:
14.设计智能知识交易合约sktc,sktc的函数中,“on receiving message from hco or ldms”表示该函数从hco或ldms接收一条消息;“upon receiving()from hco”表示该函数受到来自hco的无参数调用;msg.sender是交易发送方的以太坊地址,msg.value是附加到当前交易的以太币ether;
15.(1)系统初始化:在交易链中,hco和ldms在系统中注册后即成为一个合法实体;使用椭圆曲线数字签名算法ecdsa获得唯一身份、公钥和私钥以及数字签名,用task={task1,task2,...,taskn}和price={price1,price2,...,pricen}分别表示hco的知识需求向量和支付向量;令addrlist
ldm
和addr
hco
分别表示ldms的以太坊地址向量和hco的以太坊地址;md
hco
和md
ldm
分别表示hco和ldm的押金数额;islock是一个布尔状态变量,url,key,selladdr是用来存储参数的字符串型变量;hco使用initenv函数初始化以上变量;
16.(2)部署智能合约:hco使用creacon函数来部署n个sktc合约;当部署sktc i时,hco设置taski并向合约地址发送pricei md
hco
个以太币,msg.value=pricei md
hco

17.(3)选择最优合约:ldm向合约地址支付押金md
ldm
选择最大化自己效用的合约;合约在接收一笔转账后自动调用fallback函数,冻结此时合约内所有资产:pricei md
hco
md
ldm
,并将此ldm的地址保存到selladdr变量中;
18.(4)提交知识消息:在完成hco的任务taski后,ldm使用密钥ek加密知识并将知识上传至称为星际文件系统ipfs的分布式安全文件系统,ldm将密钥ek和知识在ipfs的链接url
kno
通过senmess函数提交给智能合约;
19.(5)获取知识消息:hco调用getmess函数获取ek和url
kno
后,从url
kno
下载知识并解密;
20.(6)确认交易:hco调用conftra函数确认交易已经成功完成;conftra函数将分别向addr
hco
和selladdr退还押金md
hco
和md
ldm

21.进一步,所述数据链包括:
22.数据链是由装备可穿戴设备的公民共同维护的分布式数据共享账本,采用名为贡献证明poc的共识机制;所述poc共识机制能够表征和量化公民的数据共享行为,贡献值最高的公民将获得下一个区块的记账权;在数据链中,装备可穿戴设备的公民通过收集数据参与poc共识机制,并竞争ldm提供的区块奖励,贡献最大的公民将获得区块奖励。
23.进一步,所述新冠疫情背景下的广域健康知识获取方法还包括:
24.将hco、ldms和公民之间复杂的相互作用构建为两阶段层次博弈;在第一阶段,使用契约理论计算最优task和price;在第二阶段,将ldm和数据收集区域内的公民之间的关系建模为斯塔伯格博弈,其中公民之间为非合作博弈;
25.在基于区块链的新冠疫情背景下广域健康知识获取方法中,ldm充当卖方,提供由边缘ai训练的知识;将执行效率定义为并将θi按升序排列:
[0026][0027]
其中,θi是hco不知道的隐私信息,hco为ldms提供差异化合约;
[0028]
(1)数据集价值:ldm将公民的数据聚合为原始数据集后,利用边缘ai将原始数据集训练成知识,知识的质量与原始数据集中有效信息量密切相关,则数据集的值表示为:
[0029][0030]
其中,σ(mi)表示原始数据集中包含的有效信息量占比,用sigmod函数表示,是公民m提供的个人健康数据量;ηm是公民位置系数;
[0031]
(2)知识价值:通过估计知识和原始数据集之间的差距评估知识值,根据“边际收益递减”的一般经济规律,定义知识价值函数为:
[0032][0033]
其中,α和ω是正曲线参数,所述知识价值函数表示高价值的原始数据集可以产生高质量的知识。
[0034]
进一步,效用函数设计包括:
[0035]
hco需要为不同类型的lbps设置不同的契约{ti,pi},其中ti表示数据集价值,pi表示价格系数;hco通过设定数据集价值来指定知识价值,在接受契约{ti,pi}后,ldm i在数据链上向公民提供奖励ri激励公民贡献自身数据,公民通过设置自己的贡献数据量最大化自身收益;
[0036]
设计hco的效用函数,hco从单个契约{ti,pi}中得到的收益表示为:
[0037][0038]
其中,μ是正参数,0《β《1是hco对θi的满意度;当θi较大时,hco满意度增加,边际满意度降低,是正且增的严格凹函数;
[0039]
hco能够根据历史统计信息得到ldms类型θi的分布,令λi表示ldm是类型i的先验概率,且则hco的目标是最大化其效用:
[0040][0041]
hco将在ir和ic约束条件下设计契约{ti,pi},使得每个ldm接受契约是最优选择,对于ldm有vi≥ti,表示ldm完成契约的约束条件;
[0042]
知识是一种具有可复制性的虚拟商品,ldm的利润分为两部分:从hco得到的支付
θipi和向市场出售知识副本得到的利润其中p
kno
≥0表示单位知识利润;对于成本,ldm向公民提供激励ri,并将数据训练成知识也会产生成本τvi,τ>0,故ldm的效用函数为:
[0043][0044]
设计公民的效用函数,由数据链定义,每个公民基于贡献数据量竞争ri;当两个公民数据量相同时,公民位置ηm越重要,公民贡献越大,则公民效用函数表示为:
[0045][0046]
其中,c>0表示收集单位数据量消耗的成本。
[0047]
进一步,所述层次博弈求解包括:
[0048]
应用逆向归纳法求解层次博弈,上层契约博弈的解已经给定,将其代入求解下层stackelberg博弈;将下层的解代入上层,得到上层最优解;
[0049]
(1)斯塔伯格博弈求解
[0050]
在stackelberg博弈阶段,契约{ti,pi}已经给定,通过逆向归纳法求解stackelberg博弈,先求解公民之间非合作博弈,后求解ldm效用最大化问题;
[0051]
1)非合作博弈
[0052]
用表示公民非合作博弈,其中xs和分别是公民集合,策略集合和效用函数,存在且唯一的纳什均衡为:
[0053][0054]
其中,
[0055][0056]
2)ldm效用最大化
[0057]
ldm最优解为:
[0058][0059]
其中,是契约完成条件,是全局最优解;
[0060]
经过分析,hco将始终设置ti≥vi(r
ig
),并且ldm最优策略始终为:
[0061][0062]
(2)最优契约求解
[0063]
ldm在策略为时的效用为:
[0064][0065]
其中,
[0066]
给出个体理性约束ir和激励相容约束ic;个体理性约束ir表示ldm参加契约的效用大于不参加契约的效用:
[0067][0068]
其中,表示ldm不选择契约的效用;
[0069]
激励相容约束ic表示类型i的ldm只有选择契约{ti,pi}时,效用才最大化:
[0070]
θip
i-h
i,i
≥θip
j-h
i,j

[0071]
构建hco的效用最大化问题为:
[0072][0073][0074]
通过以下引理将问题转化为易处理的形式:
[0075]

对任何契约{ti,pi}和{tj,pj},i≠j,i,在条件(θ
i-θj)(γ
i-γj)≤0下,当且仅当θi≥θj时,有pi≥pj和ti≥tj;
[0076]

在条件γ1≥γi,下,只要类型1的ldm满足ir,其他所有类型都满足ir;
[0077]

在条件γi≥γ
i 1
,下,ic约束可以简化为局部下激励兼容ldic和局部上激励兼容luic;
[0078]
将三个引理中的条件总结为:
[0079]
γ1≥γ2≥...≥γn;
[0080]
hco效用最大化问题转化为:
[0081]
[0082][0083]
将所有ic条件求和,得到:
[0084][0085]
得到:
[0086][0087]
相应的,p
i*
也可得到。
[0088]
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
[0089]
假定hco需要宏观的公民健康知识,ldm能够在微观层面收集公民数据并将其训练为知识,公民是原始数据的提供者,所述新冠疫情背景下的广域健康知识获取方法包括知识生成阶段和知识交易阶段;
[0090]
在知识生成阶段,hco向多个ldm发布一系列知识获取任务,在ldm选择接受某个任务后,将向感知区域内的公民发布数据收集需求,收集到数据后,ldm通过边缘ai算法将数据训练为知识;在知识交易阶段,ldms将知识有偿的卖给hco;所述边缘ai算法包括深度强化学习drl和支持向量机svm。
[0091]
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
[0092]
假定hco需要宏观的公民健康知识,ldm能够在微观层面收集公民数据并将其训练为知识,公民是原始数据的提供者,所述新冠疫情背景下的广域健康知识获取方法包括知识生成阶段和知识交易阶段;
[0093]
在知识生成阶段,hco向多个ldm发布一系列知识获取任务,在ldm选择接受某个任务后,将向感知区域内的公民发布数据收集需求,收集到数据后,ldm通过边缘ai算法将数据训练为知识;在知识交易阶段,ldms将知识有偿的卖给hco;所述边缘ai算法包括深度强化学习drl和支持向量机svm。
[0094]
本发明的另一目的在于提供一种实施所述新冠疫情背景下的广域健康知识获取方法的新冠疫情背景下的广域健康知识获取系统,所述新冠疫情背景下的广域健康知识获取系统由1个医疗管理机构hco和n个数据收集区域组成;每个数据收集区域由一个集成边缘ai的局部数据管理者ldm和多个穿戴可穿戴设备的公民组成的公民组成;所述可穿戴设备包括手表、腕带、头盔以及眼镜在内的生物信息传感器;
[0095]
其中,令表示ldms的集合,ldm i管理mi个装备可穿戴设备的公民,其
中表示公民集合。
[0096]
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的新冠疫情背景下的广域健康知识获取系统。
[0097]
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的新冠疫情背景下的广域健康知识获取方法,同时考虑了知识生成过程和知识交易过程,并在不完全信息情况下推导出了各实体最优策略的闭合表达式。
[0098]
本发明通过使用博弈论与契约理论,为新冠疫情背景下广域知识获取方法设计了一种激励机制。本发明考虑的系统包括一个医疗管理机构、多个局部数据管理者以及多个装备可穿戴设备的公民。本发明的激励机制深刻分析了各实体之间的经济互动,并显式给出了每个实体的最优策略。此外,本发明通过大量的数值仿真结果验证了理论结果的正确性。
附图说明
[0099]
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
[0100]
图1是本发明实施例提供的基于区块链的广域知识获取框架图。
[0101]
图2是本发明实施例提供的知识交易过程示意图。
[0102]
图3是本发明实施例提供的sktc合约函数示意图。
[0103]
图4是本发明实施例提供的层次博弈模型图。
[0104]
图5是本发明实施例提供的当ldm选择最优契约时的效用对比示意图。
[0105]
图6是本发明实施例提供的不同类型ldm下hco的效用示意图。
[0106]
图7是本发明实施例提供的ldm选择不同契约时的效用示意图。
[0107]
图8是本发明实施例提供的类型-2ldm与其感知区域内公民的效用示意图。
具体实施方式
[0108]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0109]
针对现有技术存在的问题,本发明提供了一种新冠疫情背景下的广域健康知识获取方法及系统,下面结合附图对本发明作详细的描述。
[0110]
针对现有技术存在的问题,本发明提供了一种基于区块链和层次博弈的可信的知识获取机制。仿真结果验证了理论推导的正确性。此外,仿真结果验证了本发明的模型优于线性定价方案,如图6所示。
[0111]
本发明通过使用博弈论与契约理论,为新冠疫情背景下广域知识获取方法设计了一种激励机制。考虑的系统包括一个医疗管理机构、多个局部数据管理者以及多个装备可穿戴设备的公民。本发明的激励机制深刻分析了各实体之间的经济互动,并显式给出了每
个实体的最优策略。此外,本发明通过大量的数值仿真结果验证了理论结果的正确性。
[0112]
由于在线市场环境(online market environment)的开放和匿名性,可能出现许多恶意行为(例如,欺诈),因此本发明设计的机制应考虑安全性。
[0113]
比特币在最近几年引起了学界和工业界的广泛关注。作为比特币的底层技术,区块链是一个存储所有历史交易记录公共分布式账本,区块之间使用哈希指针链接。这种独特的存储和检索数据的数据结构使区块链实现了去中心化、可追溯性、防篡改和透明性。此外,带智能合约的区块链(如以太坊)的出现极大地加速了区块链技术的广泛使用。与传统合约不同,智能合约是一种能够自动执行的计算机程序。由于智能合约的这一特性,许多复杂的应用程序已经通过使用智能合约改善了其业务流程。
[0114]
在本发明的方案中,区块链与智能合约被用来防止恶意行为。
[0115]
本发明提出了一种基于区块链的新冠疫情背景下广域健康知识获取模型及方法。如图1所示,系统由1个医疗管理机构(healthcare operator,hco)和n个数据收集区域组成。每个数据收集区域由一个集成了边缘ai的局部数据管理者(local datamanager,ldm)和多个穿戴了可穿戴设备(手表,腕带,头盔,眼镜等生物信息传感器)的公民组成。其中,假定hco需要宏观的公民健康知识,ldm能够在微观层面收集公民数据并将其训练为知识,公民是原始数据的提供者。整个知识获取流程可以分为两个阶段:1)知识生成阶段;2)知识交易阶段。在知识生成阶段,hco首先向多个ldm发布一系列知识获取任务,在ldm选择接受某个任务后,它将向其感知区域内的公民发布数据收集需求,收集到数据后,ldm通过其边缘ai算法(深度强化学习(drl),支持向量机(svm)等)将数据训练为知识。在知识交易阶段,ldms将知识有偿的卖给hco。
[0116]
然而,在知识获取阶段中应该考虑不诚实的数据提供者(公民),因为当收集的数据是不诚实或欺诈的数据时,可能会导致严重的社会问题。在本发明中,本发明利用交易链和数据链两种类型的区块链对本系统进行建模。交易链使用押金及退款机制(deposit-and-refundmechanism)来保护知识交易阶段,使得参与人(hco和n个ldm)能够公平可信的进行交易。每个ldm都是一条数据链的基础设施提供者(infrastructure provider),ldms通过建立数据链来收集和管理来自公民可穿戴设备的数据。
[0117]
a.交易链
[0118]
为了使知识交易过程更加可靠、高效,本发明设计了智能知识交易合约(smart knowledge trade contract,sktc)。图2给出了基于sktc的知识交易过程的详细步骤。图3详细说明了sktc中的函数。其中,“on receiving message from hco or ldms”表示该函数从hco或ldms接收一条消息。同样的,“upon receiving()from hco”表示该函数受到来自hco的无参数调用。更进一步的,msg.sender是交易发送方的以太坊地址,msg.value是附加到当前交易的以太币(ether)。
[0119]
1)系统初始化:在交易链中,hco和ldms在系统中注册后即成为一个合法实体。然后使用椭圆曲线数字签名算法(elliptic curve digital signature algorithm,ecdsa)获得唯一身份、公钥和私钥以及数字签名。本发明用task={task1,task2,...,taskn}和price={price1,price2,...,pricen}分别表示hco的知识需求向量和支付向量。令addrlist
ldm
和addr
hco
分别表示ldms的以太坊地址向量和hco的以太坊地址。md
hco
和md
ldm
分别表示hco和ldm的押金数额。此外,islock是一个布尔状态变量,url,key,selladdr是用来
存储参数的字符串型变量。hco使用initenv函数初始化以上变量。
[0120]
2)部署智能合约:hco使用creacon函数来部署n个sktc合约(合约细节见工作原理部分)。当部署sktc i时,hco设置taski并向合约地址发送pricei md
hco
个以太币,即,msg.value=pricei md
hco

[0121]
3)选择最优合约:ldm向合约地址支付押金md
ldm
来选择最大化自己效用的合约。合约在接收一笔转账后会自动调用fallback函数,冻结此时合约内所有资产:pricei md
hco
md
ldm
,并且将此ldm的地址保存到selladdr变量中。
[0122]
4)提交知识消息:在完成了hco的任务taski之后,ldm使用密钥ek加密知识并将知识上传至称为星际文件系统(interplanetary file system,ipfs)的分布式安全文件系统,此后,ldm将密钥ek和知识在ipfs的链接url
kno
通过senmess函数提交给智能合约。
[0123]
5)获取知识消息:hco调用getmess函数获取ek和url
kno
,然后从url
kno
下载知识并解密。
[0124]
6)确认交易:hco调用conftra函数来确认交易已经成功完成。conftra函数将分别向addr
hco
和selladdr退还押金md
hco
和md
ldm

[0125]
b.数据链
[0126]
数据链是一个由装备了可穿戴设备的公民共同维护的分布式数据共享账本。实际上,由于公民可穿戴设备的计算能力有限,它们很难达成工作量证明(pow)共识。本发明采用了一种名为贡献证明(proofofcontribution,poc)的共识机制。poc共识机制能够表征和量化公民的数据共享行为。贡献值最高的公民将获得下一个区块的记账权。例如,在共享资源的区块链应用程序中,每个参与者的利润可以根据其贡献价值计算,并与其共享资源量成比例。在数据链中,装备了可穿戴设备的公民通过收集数据参与poc共识机制,并竞争ldm提供的区块奖励。贡献最大的公民将获得区块奖励。
[0127]
一、系统模型
[0128]
a.模型描述
[0129]
考虑一个包含hco和n个ldm的系统。令表示ldms的集合,ldm i管理mi个装备可穿戴设备的公民,其中表示公民集合。如图4所示,本发明将hco、ldms和公民之间复杂的相互作用构建为两阶段层次博弈。在第一阶段,本发明使用契约理论计算最优task和price。在第二阶段,本发明将ldm和其数据收集区域内的公民之间的关系建模为斯塔伯格博弈,其中公民之间为非合作博弈。
[0130]
在提出的基于区块链的新冠疫情背景下广域健康知识获取模型及方法中,ldm充当卖方,提供由其边缘ai训练的知识。由于每个ldm的ai算法、训练数据和计算能力不同,它们的执行效率也有所不同。为了区分ldms,本发明将执行效率定义为不失一般性的,本发明将θi按升序排列:
[0131][0132]
在本发明中,本发明认为θi是hco不知道的隐私信息(private information)。因此,ksp应该为ldms提供差异化合约,以节省激励成本。为了便于展示,本发明定义以下两个概念。
[0133]
1)数据集价值:ldm将公民的数据聚合为原始数据集,然后利用边缘ai将原始数据集训练成知识。知识的质量与原始数据集中有效信息量密切相关。因此,本发明将数据集的值表示为:
[0134][0135]
其中σ(mi)表示原始数据集中包含的有效信息量占比,它可以用sigmod函数表示,即,是公民m提供的个人健康数据量,ηm是公民位置系数。
[0136]
2)知识价值:本发明通过估计知识和原始数据集之间的差距来评估知识值。根据“边际收益递减”的一般经济规律,本发明定义知识价值函数为:
[0137][0138]
其中α和ω是正曲线参数。上式表示高价值的原始数据集可以产生高质量的知识。
[0139]
b.效用函数设计
[0140]
由前所述,hco需要为不同类型的lbps设置不同的契约{ti,pi},其中ti表示数据集价值,pi表示价格系数。hco通过设定数据集价值来指定知识价值。在接受契约{ti,pi}后,ldm i在其数据链上向公民提供奖励ri激励公民贡献自身数据,公民通过设置自己的贡献数据量最大化自身收益。
[0141]
本发明首先设计hco的效用函数。hco从单个契约{ti,pi}中得到的收益可表示为:
[0142][0143]
其中,μ是正参数,0《β《1是hco对θi的满意度。当θi较大时,hco满意度增加,边际满意度降低。显然,是一个正且增的严格凹函数。
[0144]
本发明假定hco能够根据历史统计信息得到ldms类型θi的分布。令λi表示ldm是类型i的先验概率,且hco的目标是最大化其效用:
[0145][0146]
hco将在ir和ic约束条件(稍后给出)下设计契约{ti,pi},使得每个ldm接受契约是最优选择,因此对于ldm有vi≥ti,这表示ldm完成契约的约束条件。
[0147]
本发明认为知识是一种具有可复制性的虚拟商品。因此,ldm的利润分为两部分:从hco得到的支付θipi和向市场出售知识副本得到的利润其中p
kno
≥0表示单位知识利润。至于成本,ldm需要向公民提供激励ri,并且将数据训练成知识也会产生成本τvi,τ>0。因此,ldm的效用函数为:
[0148][0149]
本发明接下来设计公民的效用函数。由数据链定义,每个公民基于贡献数据量来竞争ri。此外,当两个公民数据量相同时,公民位置ηm越重要,公民贡献越大,因此公民效用函数表示为:
[0150][0151]
其中c>0表示收集单位数据量消耗的成本(电力等)。
[0152]
二、层次博弈求解
[0153]
在这一节中,本发明应用逆向归纳法求解层次博弈。这意味着本发明首先假设上层契约博弈的解已经给定,将其代入求解下层stackelberg博弈。然后将下层的解代入上层,得到上层最优解。
[0154]
a.斯塔伯格博弈求解
[0155]
在stackelberg博弈阶段,本发明假设契约{ti,pi}已经给定。本发明通过逆向归纳法求解stackelberg博弈,即,先求解公民之间非合作博弈,后求解ldm效用最大化问题。
[0156]
1)非合作博弈
[0157]
本发明用表示公民非合作博弈,其中xs和分别是公民集合,策略集合和效用函数。这里省略求解过程,直接给出存在且唯一的纳什均衡为:
[0158][0159]
其中,
[0160][0161]
2)ldm效用最大化
[0162]
省略求解过程,直接写出ldm最优解为:
[0163][0164]
其中是契约完成条件,是全局最优解。
[0165]
经过分析,hco将始终设置ti≥vi(r
ig
),并且ldm最优策略始终为:
[0166][0167]
b.最优契约求解
[0168]
ldm在策略为时的效用为:
[0169]
[0170]
其中接下来给出个体理性约束ir和激励相容约束ic。
[0171]
个体理性约束ir表示ldm参加契约的效用大于不参加契约的效用,即:
[0172][0173]
表示ldm不选择契约的效用。激励相容约束ic表示类型i的ldm只有选择契约{ti,pi}时,效用才能最大化,即:
[0174]
θip
i-h
i,i
≥θip
j-h
i,j
[0175]
因此,构建hco的效用最大化问题为:
[0176][0177][0178]
这是一个复杂的非凸问题,本发明通过以下引理将问题转化为易处理的形式。
[0179]
引理一:(单调性)对任何契约{ti,pi}和{tj,pj},i≠j,i,在条件(θ
i-θj)(γ
i-γj)≤0下,当且仅当θi≥θj时,有pi≥pj和ti≥tj。
[0180]
引理二:在条件γ1≥γi,下,只要类型1的ldm满足ir,其他所有类型都满足ir。
[0181]
引理三:在条件γi≥γ
i 1
,下,ic约束可以简化为局部下激励兼容(ldic)和局部上激励兼容(luic)。
[0182]
以上三个引理的证明省略。本发明将上述三个引理中的条件总结为:
[0183]
γ1≥γ2≥...≥γn[0184]
因此,hco效用最大化问题转化为:
[0185][0186][0187]
将所有ic条件求和,可以得到:
[0188]
[0189]
进一步可以得到:
[0190][0191]
相应的,p
i*
也可以得到。
[0192]
将本发明提出的框架应用于物联网背景,其中,公民对应传感器,局部数据管理者ldm对应局部区块链提供者(local blockchain provider,lbp),医疗健康机构对应知识即服务平台(knowledge-as-a-service platform,ksp)。可以设想,ksp需要获取大范围的信息(例如西安市的空气质量情况,西安市的交通拥堵情况等),当ksp需求为空气质量情况时,lbp就是区级部门(雁塔区、高新区),传感器为部署在区内的空气质量传感器;当ksp需求为交通拥堵情况时,lbp就是道路或区域(例如小寨区域,钟楼区域),传感器为部署在区域内的道路压力传感器,或视频监控等。
[0193]
三、仿真分析
[0194]
本发明考虑的场景由1个hco和10个ldm,每个ldm管辖3个或4个公民。每个参数的赋值如表1所示。
[0195]
表1场景参数
[0196][0197]
本发明将本发明提出的方法信息不对称方案(information asymmetry scheme),并与两种现存的方案进行对比:
[0198]
(1)完全信息方案(complete information scheme):在信息完全的情况下,hco准确地知道每个ldm的类型,并将ldm的效用减少到与不选契约相同的水平。
[0199]
(2)线性定价方案(linear pricing scheme):在线性定价中,hco设定一个知识价格系数p
lin
=32rmb/s。ldm实际获得的支付与其类型有关。
[0200]
图5显示了不同类型ldm的最优效用。结果表明,在信息不对称方案和线性定价方案下,ldm的效用随其类型的增加而增加。然而,在完全信息方案下,hco确切知道所有ldm的类型,因此它可以利用信息优势压榨ldms的效用。因此,在完全信息情况下,ldm的效用最低。
[0201]
图6为不同方案下hco的效用。本发明可以看到,随着ldm类型的增加,hco的效用增加。与信息不对称方案和线性定价方案相比,hco在完全信息方案下实现了效用最大化。这
与图5的趋势一致,因为hco的效用与lbp的效用负相关。此外,本发明的数值结果表明,所提出的信息不对称方案优于线性定价方案。
[0202]
图7表示类型-2、类型-4、类型-6、类型-8的ldm在不同契约下的效用。从图7可以看出,ldm只有选择为自己类型设计的契约,才能获得最大且非负效用。结果表明,所提出的信息不对称方案满足ic和ir。
[0203]
在图8中,为了展现ldm与其感知区域内的公民的互动,不是一般性的,本发明选择类型-2ldm为例子。从图中可以看出,类型-2ldm的效用函数是一个关于奖励r2的凹函数,公民的效用随着奖励r2的增加而线性增加。此外,公民η越大,效用增加越快。需要注意的是,在图8中,η=1的公民效用恒为0,这是因为该公民通过设置自己的策略而不参加博弈。
[0204]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
[0205]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献