一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于交易对手匹配的以太坊交易所名称识别方法和装置与流程

2022-03-26 04:27:15 来源:中国专利 TAG:


1.本发明属于区块链应用安全技术领域,具体涉及基于交易对手匹配的以太坊交易所名称识别方法和装置。


背景技术:

2.面对区块链行业中不断扩大的虚拟货币市场,其监管难度仍然很大,对应区块链的技术特点主要体现在以下几个方面:
3.(1)全球性。虚拟货币普遍在全球范围内流通,各个不同国家对待虚拟货币的态度也大相径庭,这就使得虚拟货币市场具有极强的“游击性”。即使在某个国家遭到了法律禁令,组织交易的项目方换个“山头”依然能有市场支撑。
4.(2)匿名性。虚拟货币普遍具有匿名性的特征,链上交易被多次混淆、转移之后,追溯查证起来就会非常困难。这让资产追踪具有了一定的技术门槛和时间窗口,比如是否具有大量的链上地址标签、能否在目标资产发生异动后及时预警等。
5.(3)复杂性。虚拟货币链上交易环境错综复杂,在链上可以进行币币、混币、跨链、dex、defi借贷等多种交易形式混搭,极大地增加了资产追踪的复杂性。
6.综上,虽然多国已表明了监管态度,但复杂的虚拟货币市场现状,使得相关机构对虚拟货币的监管存在不确定性
7.与传统金融对比,虚拟货币作为网络空间流通的虚拟货币,其与传统现实的金融体系有着某相似共通之处。比如,“交易所”平台发挥着类似银行的作用,持有人可以在交易所储蓄及兑换各种虚拟货币;虚拟货币的“钱包地址”相当于个人银行账号,通过钱包地址可追查其归属的交易所(冷钱包除外)。
8.现有为了解决钱包地址可追查其归属的交易所的问题,大部分解决方案的原理是通过不同的开源渠道收集交易所钱包地址,然而在区块链上很多未知交易所的信息无法获知,此类方法导致我们只能从已知交易所钱包进行违法资金调证,由于开源渠道收集交易所标签地址有限,因此过于局限。


技术实现要素:

9.为了解决现有通过不同的开源渠道收集交易所标签地址存在局限性的问题,本发明提供了一种基于交易对手匹配的以太坊交易所名称识别方法。本发明能够对以太坊场景下的以太坊交易所钱包地址进行识别。
10.本发明通过下述技术方案实现:
11.基于交易对手匹配的以太坊交易所名称识别方法,包括:
12.通过以太坊全节点获取并处理以太坊历史交易详细数据,得到以太坊交易明细数据;
13.获取交易所标签类别,并采用中心化交易充币提币业务逻辑识别交易所热钱包地址;
14.根据所述以太坊交易明细数据进行交易行为特征数据提取,并基于提取的特征数据进行标签类别识别模型训练,得到监督式多分类标签识别模型;
15.采用所述监督式多分类标签识别模型和预设的标签阈值预测疑似交易所类别地址;
16.根据交易所热钱包地址,聚合得到已知交易所平台的用户充币地址集合;
17.提取疑似交易所类别地址的入向交易对手集合,即得到疑似交易所用户充币地址集合;
18.根据疑似交易所用户充币地址集合和已知交易所平台的用户充币地址集合,进行该疑似交易所地址名称识别。
19.优选的,本发明的获取交易所标签类别,并采用中心化交易充币提币业务逻辑识别交易所热钱包地址步骤具体包括:
20.获取以太坊交易相关网站的所有标签,获得各个标签地址的小标签;
21.对获取的小标签进行分类并标签化处理,得到各交易所标签类别;
22.针对各交易所标签类别,基于中心化交易所的充币提币业务逻辑识别各交易所热钱包地址。
23.优选的,本发明的根据所述以太坊交易明细数据进行交易行为特征数据提取,并基于提取的特征数据进行标签类别识别模型训练,得到监督式多分类标签识别模型步骤具体包括:
24.根据所述以太坊交易明细数据,获取标签地址的交易行为特征数据;
25.将获取的交易行为特征数据输入到预设监督式多分类算法进行标签类别识别模型的训练,得到监督式多分类标签识别模型;
26.在训练过程中,将模型输出类别得分概率超过类别标签阈值的以太坊钱包地址判定为当前类别标签,反之则判定为其他未知类别标签。
27.优选的,本发明的类别标签阈值可设置为90%或95%。
28.优选的,本发明的采用所述监督式多分类标签识别模型和预设的标签阈值预测疑似交易所地址步骤具体包括:
29.采用训练得到的监督式多分类标签识别模型对未知标签且交易次数超过阈值的以太坊钱包地址进行交易所类别预测;
30.将得分概率超过交易所类别对应的标签阈值,作为疑似交易所类别地址。
31.优选的,本发明的根据交易所热钱包地址,聚合得到已知交易所平台的用户充币地址集合步骤具体包括:
32.获取各交易所类别的热钱包地址的入向交易对手,即用户充币地址集合;
33.按照交易所名称进行用户充币地址聚合,从而得到已知交易所平台的用户充币地址集合。
34.优选的,本发明的根据疑似交易所用户充币地址集合和已知交易所平台的用户充币地址集合,进行该疑似交易所地址名称识别步骤具体包括:
35.将获得的疑似交易所用户充币地址集合与已知交易所平台的用户充币地址集合求交集;
36.计算交集占比得分;
37.比较交集占比得分是否大于占比得分阈值,如果是则返回当前已知交易所平台的小标签,即为该疑似交易所地址标签;否则进行下一疑似交易所地址标签的识别。
38.第二方面,本发明提出了基于交易对手匹配的以太坊交易所名称识别装置,包括数据处理单元、标签化单元、模型训练单元、类别预测单元、聚合单元、提取单元和识别单元;
39.其中,所述数据处理单元通过以太坊全节点获取并处理以太坊历史交易详细数据,得到以太坊交易明细数据;
40.所述标签化单元用于获取交易所标签类别,并采用中心化交易充币提币业务逻辑识别交易所热钱包地址;
41.所述模型训练单元根据所述以太坊交易明细数据进行交易行为特征数据提取,并基于提取的特征数据进行标签类别识别模型训练,得到监督式多分类标签识别模型;
42.所述类别预测单元采用所述监督式多分类标签识别模型和预设的标签阈值预测疑似交易所类别地址;
43.所述聚合单元用于获取已知交易所平台的用户充币地址集合;
44.所述提取单元提取疑似交易所类别地址的入向交易对手集合,即得到疑似交易所用户充币地址集合;
45.所述识别单元根据疑似交易所用户充币地址集合和已知交易所平台的用户充币地址集合,进行该疑似交易所地址名称识别。
46.第三方面,本发明提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现本发明所述方法的步骤。
47.第四方面,本发明提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现本发明所述方法的步骤。
48.本发明具有如下的优点和有益效果:
49.1、本发明能够基于现有交易所标签库,快速扩充交易所普通钱包地址,能够提高人工扩充交易所标签地址时效,为相关机构对区块链监管提供更加准确可靠的技术和数据支撑。
50.2、本发明基于开源渠道收集并整理的普通地址类别标签,通过监督式多分类模型训练,并通过对模型的输出进行调整,达到宁可漏判不可误判的目的。
51.3、本发明基于监督式多分类模型识别出各个类别普通地址的特定交易行为,识别出更多的疑似交易所标签地址,再结合业务规则扩充交易所类别标签地址,业务规则与机器学习相结合的模式大大提高了交易所标签地址的准确性。
52.4、本发明基于业务规则与机器学习相结合,可定期进行迭代,从而能对交易所标签地址进行持续扩充,形成数据使用闭环。
附图说明
53.此处所说明的附图用来提供对本发明实施例的进一步理解,构成本技术的一部分,并不构成对本发明实施例的限定。在附图中:
54.图1为本发明的识别方法流程示意图。
55.图2为中心化交易所的充币提币流程示意图。
56.图3为本发明的计算机设备结构示意图。
57.图4为本发明的识别装置原理框图。
具体实施方式
58.为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
59.实施例1
60.本实施例提出了一种基于交易对手匹配的以太坊交易所名称识别方法,解决了通过开源渠道收集以太坊交易所钱包地址的信息过于局限的问题。
61.如图1所示,本实施例的识别方法包括以下步骤:
62.步骤101,通过以太坊全节点获取并处理以太坊历史交易详细数据,得到以太坊交易明细数据。
63.本实施例的步骤101得到的以太坊交易明细数据包括交易hash、交易输入地址、交易输出地址、交易金额等数据。
64.步骤102,获取交易所标签类别,并采用中心化交易充币提币业务逻辑识别交易所热钱包地址。
65.本实施例的步骤102具体包括以下子步骤:
66.步骤201,获取现有以太坊交易相关网站(例如,etherscan官网)标签云中的所有标签,获取各个标签地址的小标签,例如火币交易所、币安交易所、 imtoken钱包等小标签;
67.步骤202,对获取的小标签进行分类并标签化处理,最终得到交易所、服务商、钱包、黑名单等大类类别;
68.步骤203,针对各交易所大类的标签地址,基于中心化交易所的充币提币业务逻辑识别各交易所热钱包地址。
69.具体如图2所示,该中心化交易所的充币提币业务逻辑具体为:
70.中心化交易离线主机批量生成多个钱包地址,公钥私钥分开存放,且不同的币种生成不同的钱包;
71.当用户注册时,交易所给用户静态分配一个私钥由交易所管控的钱包地址,此地址也作为用户充值的地址;
72.当用户充值完成后,后台程序自动扫描钱包交易记录,扫描到即进行充币,此地址的币在一定时间内定期由交易所转出到交易所热钱包;
73.热钱包中的钱定期充至冷钱包保存,并留存足够用于提币的转出交易虚拟货币;
74.用户触发提币,需要用户填入提币地址、提币数量,并生成一个订单,交易所会通过热钱包转出指定数量的虚拟货币到提币地址。
75.步骤103,根据以太坊交易明细数据进行交易行为特征数据提取,并基于提取的特征数据进行标签类别识别模型训练,得到监督式多分类标签识别模型。
76.本实施例的步骤103具体包括以下子步骤:
77.步骤301,根据步骤103获取的以太坊交易明细数据,获取标签地址的交易行为特
征数据,本实施例具体从以太坊交易节点以及以太坊交易网络结构两个方面从以太坊交易明细数据中获取特征数据;
78.步骤302,将获取的特征数据输入到预设监督式多分类算法进行标签类别识别模型的训练,得到监督式多分类标签识别模型;
79.本实施例通过对步骤302中的监督式多分类标签识别模型的输出,进行各交易所类别标签的阈值设定,使准确率达到预设阈值,从而使标签识别效果达到宁可漏判不可误判的目的,其中,如得分概率(模型对应类别的准确率)超过预设的类别标签阈值,则判定该以太坊钱包地址为当前类别标签,反正则为其他未知类别标签。
80.本实施例设定的各类标签(大类标签)阈值可设为90%、95%等。
81.本实施例首先对以太坊钱包地址所属大类类别进行初步确定,之后通过设置以太坊钱包地址属于该类别的可能性(准确性)达到预设阈值时,才判定其属于该类别,以进一步提高分类准确性和可靠性。
82.本实施例首先对交易所地址所属类别进行初步的标签确定,之后通过设定阈值最终确定交易所地址的已知标签类别以提高识别效果,即通过降低已知标签数据识别数量来保证识别精度。
83.步骤104,采用监督式多分类标签识别模型和预设的标签阈值预测疑似交易所类别地址。
84.本实施例的步骤104具体包括以下子步骤:
85.步骤401,采用步骤302训练得到的监督式多分类标签识别模型对未知标签且交易次数超过的预设次数阈值的以太坊钱包地址进行交易所类别预测;
86.步骤402,将得分概率超过步骤303交易所类别对应的标签阈值,作为疑似交易所类别地址
87.步骤105,聚合得到每一个区块链的已知交易所平台的用户充币地址集合。
88.本实施例的步骤105具体包括以下子步骤:
89.获取步骤202中交易所类别(大类类别)的热钱包地址的入向交易对手,即用户充币地址集合;
90.按照交易所名称(小标签)进行用户充币地址聚合,从而得到每一个区块链已知交易所平台的用户充币地址集合a。
91.步骤106,提取疑似交易所地址的入向交易对手集合,即得到疑似交易所用户充币地址集合b。
92.步骤107,根据疑似交易所用户充币地址集合和已知交易所平台的用户充币地址集合,进行该疑似交易所地址名称识别。
93.本实施例的步骤107具体包括以下子步骤:
94.步骤501,将步骤106获得的疑似交易所用户充币地址集合b与步骤105 获得的已知交易所平台的用户充币地址集合a求交集c;
95.步骤502,计算交集占比得分,具体计算公式如下式:
96.score=length(c)/min(length(a),length(b))
97.其中,length(c)表示交集c的长度,length(a)表示已知交易所平台的用户充币地址集合a的长度,length(b)表示疑似交易所用户充币地址集合b的长度, min()表示取最
小值。
98.步骤503,比较计算得到的交集占比得分是否大于占比得分阈值,如果是则返回当前已知交易所平台的小标签,即火币交易所、币安交易所等名称;如果否则进行下一疑似交易所地址名称的识别。
99.本实施例的占比得分阈值可设为0.2、0.5、0.7等值。
100.本实施例还提出了一种计算机设备,用于执行本实施例的上述方法。
101.具体如图3所示,计算机设备包括处理器、内存储器和系统总线;内存储器和处理器在内的各种设备组件连接到系统总线上。处理器是一个用来通过计算机系统中基本的算术和逻辑运算来执行计算机程序指令的硬件。内存储器是一个用于临时或永久性存储计算程序或数据(例如,程序状态信息)的物理设备。系统总线可以为以下几种类型的总线结构中的任意一种,包括存储器总线或存储控制器、外设总线和局部总线。处理器和内存储器可以通过系统总线进行数据通信。其中内存储器包括只读存储器(rom)或闪存(图中未示出),以及随机存取存储器(ram),ram通常是指加载了操作系统和计算机程序的主存储器。
102.计算机设备一般包括一个外存储设备。外存储设备可以从多种计算机可读介质中选择,计算机可读介质是指可以通过计算机设备访问的任何可利用的介质,包括移动的和固定的两种介质。例如,计算机可读介质包括但不限于,闪速存储器(微型sd卡),cd-rom,数字通用光盘(dvd)或其它光盘存储、磁带盒、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并可由计算机设备访问的任何其它介质。
103.计算机设备可在网络环境中与一个或者多个网络终端进行逻辑连接。网络终端可以是个人电脑、服务器、路由器、智能电话、平板电脑或者其它公共网络节点。计算机设备通过网络接口(局域网lan接口)与网络终端相连接。局域网(lan)是指在有限区域内,例如家庭、学校、计算机实验室、或者使用网络媒体的办公楼,互联组成的计算机网络。wifi和双绞线布线以太网是最常用的构建局域网的两种技术。
104.应当指出的是,其它包括比计算机设备更多或更少的子系统的计算机系统也能适用于发明。
105.如上面详细描述的,适用于本实施例的计算机设备能执行以太坊交易所名称识别方法的指定操作。计算机设备通过处理器运行在计算机可读介质中的软件指令的形式来执行这些操作。这些软件指令可以从存储设备或者通过局域网接口从另一设备读入到存储器中。存储在存储器中的软件指令使得处理器执行上述的群成员信息的处理方法。此外,通过硬件电路或者硬件电路结合软件指令也能同样实现本发明。因此,实现本实施例并不限于任何特定硬件电路和软件的组合。
106.实施例2
107.本实施例提出了一种基于交易对手匹配的以太坊交易所名称识别装置,如图4所示,本实施例的装置包括数据处理单元、标签化单元、模型训练单元、类别预测单元、聚合单元、提取单元和识别单元。
108.其中,数据处理单元通过以太坊全节点获取并处理以太坊历史交易详细数据,得到以太坊交易明细数据。
109.标签化单元用于获取交易所标签类别,并采用中心化交易充币提币业务逻辑识别交易所热钱包地址。
110.模型训练单元根据以太坊交易明细数据进行交易行为特征数据提取,并基于提取的特征数据进行标签类别识别模型训练,得到监督式多分类标签识别模型。
111.类别预测单元采用监督式多分类标签识别模型和预设的标签阈值预测疑似交易所类别地址。
112.聚合单元用于获取每一个区块链的已知交易所平台的用户充币地址集合。
113.提取单元提取疑似交易所类别地址的入向交易对手集合,即得到疑似交易所用户充币地址集合。
114.识别单元根据疑似交易所用户充币地址集合和已知交易所平台的用户充币地址集合,进行该疑似交易所地址名称识别。
115.以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献