一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于区块链和联邦学习的金融征信数据共享方法及装置与流程

2021-10-30 01:36:00 来源:中国专利 TAG:区块 联邦 征信 装置 方法


1.本发明涉及区块链技术领域,尤其涉及一种基于区块链和联邦学习的金融征信数据共享方法及装置。


背景技术:

2.当前,随着中国市场经济的进一步发展,我国已处于互联网消费金融时代,新的社会消费观念推动企业和个人的金融征信业务不断扩大,信用将成为一类重要的资产。面对多种需要授信的企业实体或者个人类型,如何全面的刻画和评价其信用特征,以及如何做到合理的风险识别与评价成为金融机构的一个核心研究问题。在这一背景下,互联网大数据成为金融授信的重要补充,以中国人民银行为代表的传统征信机构,以百度、阿里、腾讯为代表的互联网公司和经授权的第三方征信机构之间的数据共享与流通、数据保护与使用成为金融征信过程中的核心问题。
3.现有征信机构获得的信用数据局限于自有的交易数据,信用记录仅反映了个人和企业的某些特定方面的状况。较为综合的企业和个人信用数据往往分散在多个机构当中,例如银行、法院、电信公司、即时通讯工具运营商、互联网金融公司等,机构之间征信数据不共享,形成“信息孤岛”局面,难以构建全方位的个人信用画像。此外,现有的征信数据收集方式会导致某些个人征信记录空白,这对建设诚信社会带来了阻力。
4.信用数据作为个人和企业特有的数字化资产,不同于其他行业数据,具有私密性、指向性的特点。信用数据与具体真实身份绑定,直接关系到企业和个人利益,因而安全要求更为严格,传统方式进行的共享流通成本较高,且存在数据修改和信息泄露的风险。第三方征信机构的参与,增加了用户征信数据的泄露和恶意利用风险,且对于数据的泄露无法监控和溯源。
5.现有的征信信息修改机制不够严谨,行为人提出征信异议后,经过商业银行审核便能修改记录,存在征信数据篡改的风险。同时,征信机构核实征信记录的真实性能力有限,导致信用数据和信息存在错漏的潜在状况。由于我国尚未建成覆盖全社会的个人征信体系,且缺乏数据保护机制,第三方征信机构一般不愿意共享数据,征信数据共享成本高、征信信息提取困难,单一信用数据的质量存在缺陷可能,数据之间的交易无法记录和保障。
6.采用单纯区块链进行信用数据存证和交易的方式,面临计算节点劫持、女巫攻击、重放攻击等潜在风险。同时,信用数据具有数据资产的特性,在金融交易中需要政府或持牌机构进行强监管。区块链的分布式记账优势是保证信用数据无法篡改存证的优势,但去中心化的特点难以满足现有金融资产交易强监管的要求,在金融征信过程中,个人和企业的信用等级是一个动态变化的过程,需要持续的数据共享和交互。在这个持续交互的过程中,往往只需要对用户新的增量信息进行评价,汇总结果。分布式的计算需要引入金融征信当中,但分布式计算存在数据泄露的风险。
7.因此,有必要提供一种新型的基于区块链和联邦学习的金融征信数据共享方法及装置,以克服上述缺陷。


技术实现要素:

8.本发明的目的在于提供一种新型的基于区块链和联邦学习的金融征信数据共享方法及装置,其实现金融征信数据的确权存证和交易存证,达到持续动态的个人和企业信用分析评价与更新。
9.为了达到上述目的,本发明提供一种基于区块链和联邦学习的金融征信数据共享方法,包括:
10.对信用数据进行采集和特征分析,并进行联邦学习,以训练出评价模型;
11.选取多个时刻进行数据截断,通过评价模型对截断的数据进行迭代训练和比对,核验信用数据增量,生成增量数据集;
12.利用增量数据集融合在线学习和联邦学习,更新信用特征,实现监管背景下的用户信用画像动态更新。
13.本发明还提供一种基于区块链和联邦学习的金融征信数据共享装置,该装置包括征信服务用户终端、征信数据采集模块和中心监管服务端;
14.征信服务用户终端主要面向用户提供征信服务,建立自主的征信评价模型,以及与征信数据的采集层开展数据的流通和共享;
15.征信数据采集模块主要将信用数字资产进行数据流化,提供在线学习机制,融合联邦学习计算方法,实现持续的用户信用特征更新;
16.中心监管服务端包括基础数据服务器、信用数字资产链和交易存证链,其中基础数据服务器结合数字资产链,对信用数据采集层的数据进行内容对比和资产确权,发放用于激励的通证;以及提供智能合约的访问和更新,能够对持续更新的信用特征核验、存证并上链记录交易过程。
17.本发明的一方面还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于区块链和联邦学习的金融征信数据共享方法的步骤。
18.本发明的另一方面还提供一种计算机终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于区块链和联邦学习的金融征信数据共享方法的步骤。
19.与相关技术相比较,本发明将信用数据作为需要被强监管的数字资产,面向信用数据交互共享场景,利用区块链技术,以智能合约和通证为主,构建用于信用数字资产监管的半中心化机制,实现信用数据的共享存证与交易监管双重目标;针对用户征信动态和持续评价的要求,依据互联网大数据的采集特点,提出采用在线学习和联邦学习结合的方法,对信用数据进行持续的增量分析提取,以动态刻画用户的信用行为特征,降低征信后的借贷风险,持续监测、分析和评价用户信用程度。
附图说明
20.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
21.图1为本发明的基于区块链和联邦学习的金融征信数据共享方法的流程图;
22.图2为本发明的基于区块链和联邦学习的金融征信数据共享方法的时序图;
23.图3为本发明的基于区块链和联邦学习的金融征信数据共享装置的架构图。
具体实施方式
24.下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
25.请参阅图1和图2,本发明提供一种基于区块链和联邦学习的金融征信数据共享方法,包括信用数据的特征提取、特征筛选、真实性验证、通证发放、信用数字资产确权、联邦学习、在线学习机制、用户特征更新与交易过程存证等主要环节。
26.下面将对图1中内容进行具体实施步骤的详细描述,如下:
27.对信用数据进行采集和特征分析,并进行联邦学习,以训练出评价模型。
28.步骤1:对信用数据进行采集和特征分析,持牌的征信服务中心对数据进行筛选和特征分析。
29.信用数据通过数据采集端进行汇总和采集,并进行初步的特征统计,加盖时间戳和采集机构的哈希id。持牌的征信服务中心做(增值)服务时,将对接入的信用数据进行数据和特征筛选,这一过程将提出异常数据,并对数据的特征根据其建立的分析模型进行特征降维,存储对应的特征信息。
30.步骤2:持牌征信机构和信用数据采集机构的数字资产存证。
31.持牌征信(增值)机构进行数据筛选和特征筛选的同时由智能合约进行对比核验,智能合约同步向征信监管中心上传数据特征描述信息,征信监管中心通过数据真实性验证,根据数据量和特征状况分发token。此外,持牌机构的哈希id、各数据提供机构的哈希id、数据特征和token将被打包存证到信用数据资产链上。
32.步骤3:进行联邦学习,初始化交易存证链。
33.在征信业务体系中,(增值)服务商建立用于评价个人或企业信用特征的评价模型。对经过步骤2存证的信用数据开展联邦学习,以训练特征模型。首先,模型将分发于信用数据采集层上,参与训练的各个设备终端。其次,采用加密方法(如:同态加密),对经由训练的特征参数进行加密后进行权重、梯度和损失的调整,将调整后的参数返回到终端设备。继续训练与交互,直至模型收敛或训练结束。训练结束后获得的联邦模型即为评价用户的初始模型,将该模型连同参与训练信用数据资产token一同上链存储,以对交易存证。由此联邦模型分析和预测的用户信用特征与使用的token一一对应,该区块采用智能合约对原有交易链上或征信监督机构的存底进行内容对比,对比后的交易信息上链存证。
34.选取多个时刻进行数据截断,通过评价模型对截断的数据进行迭代训练和比对,核验信用数据增量,生成增量数据集。
35.步骤4:t时刻数据截断,核验信用数据增量,更新信用数字资产确权信息。
36.经过初始化的数字资产链确立了数据采集层内各个机构数据的权属信息;初始化后的交易链则形成了(增值)服务公司针对用户最初的信用评价,所有初始化的链内信息均
固定在某一时刻的信息截断处,即:在时刻t前的数据形成机构的资产权证,以及针对个人或企业的征信内容。经过一段时间后,采用t时刻截断方法,固定信用采集层内的数据,提取新增数据特征,同前一时刻特征进行对比,当新增数据特征和前一时刻特征存在差异时,(增值)服务中心才对其进行增量数据集的提取描述的生成,经过智能合约的验证,核实数据的真实性,发放新的token,对新增的信用数字资产上链存证。
37.步骤5:增量数据的联邦学习,持续的用户特征信息更新和上链。
38.在步骤4验证后,将增量的数据特征进行上一次获得的联邦模型的参数初始化,在线学习为算法提供了预训练。持牌的征信(增值)服务中心将初始化参数共享到数据层的设备中,信用数据采集层开始实施联邦学习,对经步骤3获得的联邦模型进行训练和交互,直至达到参数收敛。该步骤获得了更新的联邦模型,经监管中心的特征比对后,进行交易过程的上链存证,实现持续的用户特征信息更新和上链。
39.步骤6:对某一时刻的数据进行截断,对采集层的数据进行增量核验,并生成增量数据集。
40.采用在线学习机制,将数据采集端的信用数据视为流数据。在某一时刻t后,进行数据截断,将截断获得的数据集与原有t时刻前的数据进行特征比较,并利用资产链进行资产的一致性判断。当判断增量数据存在时,打包为用于联邦学习训练的增量数据集特征。数据的增量特征计算如下:
41.x∈r{f1,f2,
……
,f
n
}
42.其中,x是每个截断时刻t内的变量数据,r为特征空间集。
43.那么,数据增量为:
44.x
t1
∈r
t1
,x
t0
∈r
t0
,且存在x
t1
≠x
t0
,r
t0
≠r
t1
45.其中,t0,t1,
……
,t
n
为顺序的时间序列,x
t0
,x
t1
,
……
,x
tn
为按照时间顺序产生的截断时刻范围内的数据。增量验证即通过智能合约进行数据特征的验证,包括:特征分布的相似度对比、数据范围分布对比和数据量对比。在增量数据集提取的过程中一般保留特征具有一定重合的数据为特征数据,以提高数据的泛化程度。同时,按照增量数据在初始数据中的比例,进行特征权重的求解,计算的梯度内加入权重:中的比例,进行特征权重的求解,计算的梯度内加入权重:σ
t0
为t0训练时的学习率,w
t1
为修正后的权重,为t0时刻的梯度,w为t0时刻的权重。
46.利用增量数据集融合在线学习和联邦学习,更新信用特征,实现监管背景下的用户信用画像动态更新。
47.步骤7:利用信用的增量数据集,融合在线学习和联邦学习,更新信用特征。
48.增量数据集的数据特征经过智能合约上传到监管中心,监管中心进行真实性验证后,分发token,并且在资产链中进行存证和更新。融合在线学习和联邦学习算法,对由步骤6获得的增量数据集进行联邦学习,训练模型采用前一t时刻所获得的联邦模型,训练的过程以同态加密传输模型的参数、梯度和损失,最终实现模型的率定和特征参数的更新。
49.在线学习的训练过程一般采用forward

backward splitting(fobos)和follow

the

regularized

leader(ftrl)方法进行训练。其中,ftrl综合考虑了fobos和rda的优点,兼具fobos的精确性和rda优良的稀疏性,是本发明采用的与训练方法。
50.其中,模型权重的更新方法为:
[0051][0052]
其中,σ
s
为学习率,w引用w
t
,w
t
是对应于增量的权重修正值。
[0053]
当w∈r
d
时,设连续的梯度向量g1:t∈r
d
,权重的更新可重写为:
[0054][0055]
因此,在t轮时更新
[0056][0057]
那么w
t 1
则可写为:
[0058][0059]
采用在线学习通常将增量数据集进行切片后,逐次训练求解最佳权重。获得的权重将作为联邦学习的初始化参数引入模型。
[0060]
步骤8:金融征信数据共享框架的持续学习,实现监管背景下的用户信用画像动态更新。
[0061]
数据共享框架中包含两条链:用于资产确权的信用数字资产链、用于描述信用特征的交易存证链,两条链相互交替的进行信息区块的更新,并由受监管的智能合约进行控制。整个算法框架在初始化训练完成后,将持续进入到增量的在线学习环节,在步骤7之后,迭代循环执行步骤5到步骤7,以实现用户信用画像的动态更新。
[0062]
与相关技术相比,首先将信用数据定义为数字资产,建立针对这种数字资产共享和交易的半中心化监督机制,以智能合约和token为主,结合区块链实现存证与溯源。融合在线学习和联邦学习方法,实现信用数据的增量学习,持续和动态的更新征信用户的征信评价。
[0063]
本方案的有益效果包括:
[0064]
(1)本发明面向征信过程中信用数据的共享和流转问题,设计了一系列完整的交互步骤,在信用数据资产确权、交易过程存证两个方面采用在线学习和联邦学习,持续动态的更新联邦模型和用户信用特征,满足金融征信的动态要求。
[0065]
(2)采用半中心化机制用于征信过程,该过程通过智能合约和分发通证token的模式,提供了征信监管中心针对各个信用数据采集机构,数据确权和存证的新方法。利用区块链进行有条件的存证,而将存证的条件判断交予征信监管中心的智能合约实现,有效避免了数据权属混乱、多方数据不一致、上链存证无监管的问题;同时,中心提供了token的分发,这为数字资产的定价提供了基础证明;该半中心化的模式,使得分布式记账和资产属性被同步确立,提升了信用数据的共享效率。
[0066]
(3)提出了面向互联网大数据征信的数据交互方法,融合在线学习和联邦学习机制,实现流数据的增量学习,并持续动态的更新了用于信用评价的联邦模型,实现了用户信用的动态评价。在线学习的优点是小批量、持续训练、增量学习。联邦学习的特点是利用终端用户实现“数据不出域”、“数据可用不可见”的模型训练。本发明专利结合两者各自的特点,设计实现了联邦模型的动态持续更新,这种方法可以有效避免信用数据来源单一、信用评价更新不及时、信用描述样本不全面的缺陷,达到信用动态评价的要求。
[0067]
请参阅图3,本发明还提供一种基于区块链和联邦学习的金融征信数据共享装置,该装置包括征信服务用户终端、征信数据采集模块和中心监管服务端;用于实现金融征信数据的确权存证和交易存证,达到持续动态的个人和企业信用分析评价与更新。
[0068]
征信服务用户终端,主要功能是面向用户提供征信服务,建立自主的征信评价模型,与征信数据的采集层开展数据的流通和共享,同时,受监管层的监督,对自身的数字资产进行确权存证。
[0069]
征信数据采集模块,主要由多个涉及用户信用数据的机构组成,在数据共享和流通阶段,首先,进行数字资产的确权,受监管层的监管,通过监管层的核验后获得资产通证。其次,用于资源调度,具有多设备终端接入的特点。采用互联网大数据的分析思路,将信用数字资产进行数据流化,提供在线学习机制,融合联邦学习计算方法,实现持续的用户信用特征更新。
[0070]
中心监管服务端,包括基础数据服务器、信用数字资产链和交易存证链,主要由征信监管中心负责,包含基础数据服务器的构建,其中基础数据服务器结合数字资产链,对信用数据采集层的数据进行内容对比和资产确权,发放用于激励的通证(token);此外,还提供智能合约的访问和更新,能够对持续更新的信用特征核验、存证并上链记录交易过程。该中心监管服务端监管了两条区块链:信用数字资产链、交易存证链,信用数字资产链上存证了参与信用体系搭建的各方所辖信用数据的资产状况,提供了数据资产的归属确权。
[0071]
本发明另一方面还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于区块链和联邦学习的金融征信数据共享方法的步骤。
[0072]
作为本发明另一方面的延伸还提供一种计算机终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于区块链和联邦学习的金融征信数据共享方法的步骤。
[0073]
所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能。示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在终端设备中的执行过程。
[0074]
所述计算机终端可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。可包括但不仅限于,处理器、存储器。可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备、总线等。
[0075]
所述处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路
(application specific integrated circuit,asic)、现成可编程门阵列(field

programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0076]
所述存储器可以是内部存储单元,例如硬盘或内存。所述存储器也可以是外部存储设备,例如插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器还可以既包括内部存储单元也包括外部存储设备。所述存储器用于存储所述计算机程序以及其他程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
[0077]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0078]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0079]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0080]
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0081]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0082]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0083]
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施
例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0084]
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜