一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种大型仪器共享实验执行可信度判别方法与流程

2022-03-09 06:53:15 来源:中国专利 TAG:


1.本发明属于智能监管领域,提供一种大型仪器共享实验执行可信度判别方法。具体涉及到物联网的数据传输、区块链中的联盟链的数据记录方法及基于simhash算法的相似度检测技术。


背景技术:

2.为推进高校及研究院的大型仪器设备在保障教学科研需求的前提下,更好地服务教学科研、人才培养和社会发展,有必要对大型仪器开放共享工作进行归纳和分析。基于大型仪器能够共享的特性,实验人员可以通过预约使用大型仪器,完成实验,更好地利用仪器资源,并能根据所完成的实验结果可进行发放补助(共享券)。因此,获取大型仪器设备共享的使用数据情况能更好的判断仪器设备是否真实使用。
3.当前基于物联网技术已经有一些得到实际应用的方法。例如基于监测仪器设备的电流、电压状况,能够初步监测仪器设备的是否处于正常运行的状态。但是仅通过电流、电压无法准确判断使用者是否使用大型仪器完成预定的实验内容。目前尚缺乏有效手段来直接证明共享仪器的预定实验是真实发生的,缺乏直接的数据来证明仪器的使用。
4.通常的,人工进行数据记录很容易出现数据记错、漏记等错误,而通过获取大型仪器设备产生的数据文件,则会大大减少这种现象,并且能够减少人工的精力和时间,更加方便快捷。将数据传输到云端进行预处理,例如将样本数据文件的格式信息、实验时间、数据大小等基本信息进行记录,方便区块链的第一摘要进行信息录入。
5.区块链的本质是一个去中心化的分布式存储数据库,它通过数据协议、加密算法、共识机制,点对点地传输到这个区块中的所有其他节点,从而构建一种去中心化、不可篡改、安全可验证的数据库,建立一种新的信任体系。
6.区块链数据记录节点采用联盟链方式建链,对接收和发送的数据分别执行解密和加密操作,按照共识机制进行数据交换;联盟链仅限于联盟成员拥有对区块链的读写权限,整个区块链网络由联盟成员共同维护,由于参与节点相对于公有链比较少,所以它具有更好的效率,每秒能处理更多的交易数量,适用于对实时性要求比较高的领域,而大型仪器所产生的数据量大且实时传输,适合这种方式。
7.simhash算法是一种将高维度特征向量转化为低维度特征向量,通过两个向量的海明距离从而可以判断数据文件是否相似,具有判断速度快,对比数据量大等优点。
8.综上所述,针对上述情况出现的一些问题,获取大型仪器设备共享的使用数据情况是当务之急,我们需要获取大型共享仪器的数据才能更好的判断仪器设备是否真实使用。基于物联网处理并上传共享仪器的信息,利用区块链中的联盟链数据记录特点进行大型仪器设备的使用数据记录,通过当前仪器使用记录情况,利用模式识别中的simhash算法对实验室据文件进行对比判断。


技术实现要素:

9.本发明发目的是针对现有技术的不足,提供一种大型仪器共享实验执行可信度判别方法。
10.本发明解决其技术问题所采用的技术方案如下:
11.步骤(1)采集当前所有大型仪器所能做的实验及相关样本数据文件,建立数据样本集,且该数据样本集中的数据为准确数据;通过互联网发送到服务器端进行存储;
12.步骤(2)将与大型仪器直接连接获得的数据记录文件上传输至实验室信息管理系统,通过mec进行预处理;
13.步骤(3)将步骤(2)预处理完的数据记录文件传输至区块链中,并创建数据切片:即将预处理后实验仪器所进行的实验所产生的数据记录文件进行加密处理,将经加密的数据记录文件上载到区块链,在区块链上对数据记录文件进行复制分发切片,将交易记录到分类帐(即区块链)中;
14.步骤(4)工作人员通过密钥从区块链中获取数据记录文件,利用模式识别中的simhash算法将所提取的数据记录文件与数据样本集中的样本数据文件进行比对,判断实验数据的真实性。
15.本发明有益效果如下:
16.本发明基于物联网处理并上传共享仪器的信息,利用区块链中的联盟链数据记录特点进行大型仪器设备的使用数据记录,通过当前仪器使用记录情况,利用模式识别中的simhash算法对实验室据文件进行对比判断。
17.实验室信息管理系统对大型仪器所产生的数据记录文件进行采集和处理,区块链有着独特的时间戳特性,数据的使用链表能够直观的反映出设备的使用情况,通过区块链的记录,可以使得数据更加的透明化。
18.本发明将交易记录到分类帐,由于分类帐基于区块链技术,因此它具有透明性、可验证性、可追溯性以及防篡改性。
19.本发明能够获取大型仪器设备共享的使用数据情况,从而能更好的判断仪器设备是否真实使用。直接证明共享仪器的预定实验是真实发生的。
20.人工进行数据记录很容易出现数据记错、漏记等错误,而本发明通过获取大型仪器设备产生的数据文件,则会大大减少这种现象,并且能够减少人工的精力和时间,更加方便快捷。
附图说明
21.图1为实验数据文件传输图;
22.图2为simhash指纹值计算流程图。
具体实施方式
23.下面集合附图和实施例对本发明作进一步的说明。
24.一种大型仪器共享实验执行可信度判别方法,具体实现步骤如下:
25.步骤(1)采集当前所有大型仪器所能做的实验及相关样本数据文件,建立数据样本集,且该数据样本集中的数据为准确数据;通过互联网发送到服务器端进行存储。
26.步骤(2)将与大型仪器直接连接获得的数据记录文件上传输至实验室信息管理系统,通过mec(边缘服务器)进行预处理。
27.步骤(3)将步骤(2)预处理完的数据记录文件传输至区块链中,并创建数据切片:即将预处理后实验仪器所进行的实验所产生的数据记录文件进行加密处理,将经加密的数据记录文件上载到区块链,在区块链上对数据记录文件进行复制分发切片,将交易记录到分类帐(即区块链)中。
28.步骤(4)工作人员通过密钥从区块链中获取数据记录文件,利用模式识别中的simhash算法将所提取的数据记录文件与数据样本集中的样本数据文件进行比对,判断实验数据的真实性。
29.优选的,步骤(1)具体如下:
30.利用二维码将每一台仪器的基本信息录入实验室操作系统,例如该仪器的购买时间、具体型号、所生成的厂商信息、维护记录以及仪器产生的数据文件格式等,方便工作人员读取仪器设备的具体信息。
31.本次的样本数据文件均来自于每一台大型仪器所能共享的实验所产出的样本数据文件,基于多组样本数据文件的比较分析,人工挑选特征明显的样本数据文件作为样本文件,建立数据样本集。
32.优选的,步骤(2)具体如下:
33.每一台仪器都在稳定的实验环境进行工作,并且都有着数据存储模块,基于此特点,能够从实验室信息管理系统中获取仪器所产生的数据记录文件。但由于不同设备所产出的数据记录文件的格式不同、文件大小不同,因此不能简单的将实验室信息管理系统的数据上传至区块链中。将实验室信息管理系统所采集到的数据记录文件传输到mec(边缘服务器)进行预处理再传送到区块链中,例如文件过大则进行数据分割、提取数据文件格式等操作,具体实时流程如图1所示。
34.所述的mec(边缘服务器)进行预处理有:若数据记录文件过大则进行数据分割,同时提取数据文件格式、标注实验名称和记录实验时间等。
35.实验人员在进行大型共享仪器的使用之前,首先需要登录实验室信息管理系统,在系统中手动选择自己需要使用仪器型号,在使用结束后也需要选择完成使用仪器,以此来统计实验人员的使用情况记录。
36.在使用完仪器后,需自行保留数据记录文件。实验室信息管理系统会在实验人员进行数据录入的时候同时自动加入时间的录入,自动记录实验人员操作大型仪器的时间。
37.优选的,步骤(3)具体如下:
38.实验室信息管理系统对大型仪器所产生的数据记录文件进行采集和处理,区块链有着独特的时间戳特性,数据的使用链表能够直观的反映出设备的使用情况,通过区块链的记录,可以使得数据更加的透明化。
39.基于区块链的存储系统,将区块链的数据存储分成以下几个步骤:
40.(1)创建数据切片。区块链中的每个切片(即区块链中的每个区块)都包括初始节点,在切片记录个人信息更新数据时,在切片中先生成新增数据节点,之后利用新增数据节点记录个人信息更新数据。将采集到并处理好的数据记录文件通过mec服务器上传至区块链中。
41.(2)本次基于非对称加密技术(实验人员传输数据记录文件到切片上后会产生私钥和公钥,私钥由实验人员自己保存,公钥可以分发给工作人员)来加密每个切片,通过区块链的存储系统加密本地系统上的每一个数据切片,以此来保证数据的存在性、完整性、所有权和时效性。每一次数据记录文件上传后会自动创建时间戳,保存好每一个切片的创建时间。
42.(3)为每个切片生成哈希。哈希值通过散列算法对切片进行二次哈希计算得到的数字摘要信息,用于保证切片的信息安全以及整条区块链的有效性。因此我们采用sha-256算法来计算区块hash值。
43.将获取到的数据记录文件基于sha-256算法进行二次哈希计算,生成第一摘要;工作人员通过由实验人员所获得的公钥对切片发送的数字签名进行解密,得到第二摘要,比对两次摘要是否相同;如果相同则验证通过,可以得到大型仪器所产生的数据记录文件。如果不同,则无法获取加密之前的大型仪器所产生的数据记录文件,从而保护数据安全。
44.(4)复制每一个切片,将每一个切片复制出足够的冗余副本,确保其可用性,防止数据丢失。建立起区块链后,在区块链中新增切片时需要验证新切片的有效性。
45.(5)分发复制的切片。通过peer-to-peer网络实现多个节点间的相互通信,p2p网络将复制的切片分发到分散的节点,无论是区域还是全局。一个节点获得新的数据记录文件生成新的切片后,自动广播给区块链中其他所有节点。每个节点在接收到其他节点发送的区块内容(即数据记录文件)后,进行验证,验证通过则添加到本地区块链上。只有实验人员才能完全访问指定切片的所有数据,无论这些节点位于何处。
46.(6)将交易记录到分类帐。存储系统记录区块链分类帐中的所有事务,并在所有节点之间同步该信息。分类帐存储与事务相关的详细信息,例如分片位置、分片哈希和租赁成本等等。由于分类帐基于区块链技术,因此它具有透明性、可验证性、可追溯性以及防篡改性。
47.优选的,步骤(4)具体如下:
48.实验人员在进行数据比对之前,利用区块链中时间戳的特性通过密钥找到所需对比的区块链数据记录文件。此外,在样本集中找到该实验项目的样本数据文件。通过模式识别技术中的simhash算法的相似度(如图2所示)对两组实验数据进行对比。
49.simhash算法详细步骤如下:
50.(1)初始化区块链获取的数据记录文件,输出simhash指纹值s并将其初始化为0,生成f位的向量v并初始化为0。
51.(2)对初始化后的数据记录文件进行分词,获得数据记录文件的分词集合。并按照权重计算每一个数据记录文件的关键词的特征值。
52.(3)生成hash值,对每个特征值使用相同的hash函数计算出一个f位的指纹值a,此时的关键词转化为一系列的数字。
53.(4)如果指纹值a的第i位为1(i介于1~f之间),则v的第i位加上该特征值的权重;若指纹值a的第i位为0(i介于1~f之间),则v的第i位减去该特征值的权重,以此操作所有特征值;最终对加权后的指纹值进行叠加产生一组序列串。如图2的操作,关键词101101赋予权重w1后变成w1-w1w1w1-w1w1。
54.(5)将步骤(4)输出序列串赋值给s。查看序列串s,若第i位上的元素大于0,则序列
串s的第i位为1,若第i位上的元素小于0,则序列串s的第i位为0,从而得到的数据记录文件的simhash指纹值。如图2最终对策元素显示:96,-24,52,-6,-58,76,可得到最终的simhash指纹值。
55.(6)用样本数据文件替代数据记录文件,进行步骤(1)-(5)的操作,得到样本数据文件的simhash指纹值;
56.(7)通过计算两份数据文件所产生的simhash指纹值的海明距离,即可判断两份数据文件的相似度,海明距离越近,则数据文件越相似,即可判定完成实验。
57.若待比较的文件数据量较大,则可手动挑选出较为重要的部分进行相似度对比,若相似度到达所设定的阈值,则可以判断大型共享仪器正常进行工作。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献