训练数据确定方法、装置、设备及计算机可读存储介质与流程

2022-12-07 00:37:55 来源：中国专利 TAG：

1.本技术涉及计算机技术领域，尤其涉及一种训练数据确定方法、装置、设备及计算机可读存储介质。

背景技术：

2.利用有效的训练数据训练商户分类模型，可以提高商户分类模型的训练效率、分类效率和分类能力。目前，训练数据的确定主要依赖于数据建模技术人员的人工经验，无法实现训练数据的自动确定，大大降低了训练数据的确定效率。此外，人工确定的训练数据具有局限性，且容易忽略训练数据之间的交叉效应和客观性。由此，利用人工确定的训练数据训练商户分类模型，会影响商户分类模型的训练效率、分类效率和分类能力。

技术实现要素：

3.本技术提供了一种训练数据确定方法、装置、设备及计算机可读存储介质，至少可以实现训练数据的自动确定，提高训练数据的准确性和客观性。
4.第一方面，本技术提供了一种训练数据确定方法，所述方法包括：
5.获取多个样本商户各自对应的商户类别标签；其中，所述商户类别标签表征所述多个样本商户对应的交易活跃程度；
6.确定每个样本商户对应的多个交易活跃特征信息；
7.根据所述多个交易活跃特征信息和所述商户类别标签，确定第一条件熵；其中，所述第一条件熵表征在所述多个样本商户对应的商户类别标签为目标商户类别标签的条件下，每个交易活跃特征信息的不确定性；所述目标商户类别标签为所述多个样本商户对应的商户类别标签中的任一商户类别标签；
8.根据所述第一条件熵，从所述多个交易活跃特征信息中确定训练数据；其中，所述训练数据用于训练商户分类模型。
9.根据第一方面，所述根据所述多个交易活跃特征信息和所述商户类别标签，确定第一条件熵包括：
10.在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，确定所述多个样本商户的样本商户标识信息在样本商户标识信息集合中的比重信息；
11.根据所述多个交易活跃特征信息、所述商户类别标签和所述比重信息，确定所述第一条件熵。
12.根据第一方面，所述根据所述多个交易活跃特征信息、所述商户类别标签和所述比重信息，确定所述第一条件熵包括：
13.获取所述多个交易活跃特征信息对应的交易活跃特征值集合；
14.根据所述交易活跃特征值集合和所述商户类别标签，确定第一信息熵；其中，所述第一信息熵表征在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，所述每个交易活跃特征信息的信息量的不确定性；
15.根据所述比重信息和所述第一信息熵，确定所述第一条件熵。
16.根据第一方面，所述确定每个样本商户对应的多个交易活跃特征信息包括：
17.获取所述每个样本商户对应的多个原始特征信息；
18.根据所述多个原始特征信息对应的特征类型，对所述多个原始特征信息进行特征构建，得到所述每个样本商户对应的多个交易活跃特征信息。
19.根据第一方面，所述根据所述多个原始特征信息对应的特征类型，对所述多个原始特征信息进行特征构建，得到所述每个样本商户对应的多个交易活跃特征信息包括：
20.在所述多个原始特征信息的特征类型为连续特征的情况下，对所述多个原始特征信息进行离散化，得到每个原始特征信息对应的多个离散化特征信息；
21.根据所述多个离散化特征信息和所述商户类别标签，确定第二条件熵；其中，所述第二条件熵表征在所述多个样本商户对应的商户类别标签为目标商户类别标签的条件下，每个离散化特征信息的不确定性；
22.根据所述第二条件熵，对所述多个原始特征信息进行特征分割，得到所述多个交易活跃特征信息。
23.根据第一方面，所述根据所述多个离散化特征信息和所述商户类别标签，确定第二条件熵包括：
24.获取每个离散化特征信息对应的离散化特征值集合；
25.根据所述离散化特征值集合和所述商户类别标签，确定第二信息熵；其中，所述第二信息熵表征在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，所述每个离散化特征信息的信息量的不确定性；
26.根据所述比重信息和所述第二信息熵，确定所述第二条件熵。
27.根据第一方面，所述根据所述多个原始特征信息对应的特征类型，对所述多个原始特征信息进行特征构建，得到所述每个样本商户对应的多个交易活跃特征信息包括：
28.在所述多个原始特征信息的特征类型为离散特征的情况下，对所述多个原始特征信息进行优化，得到所述多个交易活跃特征信息。
29.根据第一方面，所述方法还包括：
30.将所述训练数据输入所述商户分类模型进行分类识别，得到所述训练数据对应的预测类别标签；
31.获取所述训练数据对应的商户类别标签；
32.根据所述训练数据对应的预测类别标签和商户类别标签，计算所述商户分类模型对应的目标损失；
33.在所述目标损失不满足预设条件的情况下，根据所述目标损失调整所述商户分类模型的模型参数，基于调整后的商户分类模型更新所述目标损失，确定所述目标损失满足所述预设条件时，对应的商户分类模型为目标商户分类模型。
34.第二方面，本技术提供了一种训练数据确定装置，所述装置包括：
35.第一获取模块，用于获取多个样本商户各自对应的商户类别标签；其中，所述商户类别标签表征所述多个样本商户对应的交易活跃程度；
36.第一确定模块，用于确定每个样本商户对应的多个交易活跃特征信息；
37.第二确定模块，用于根据所述多个交易活跃特征信息和所述商户类别标签，确定
第一条件熵；其中，所述第一条件熵表征在所述多个样本商户对应的商户类别标签为目标商户类别标签的条件下，每个交易活跃特征信息的不确定性；所述目标商户类别标签为所述多个样本商户对应的商户类别标签中的任一商户类别标签；
38.第三确定模块，用于根据所述第一条件熵，从所述多个交易活跃特征信息中确定训练数据；其中，所述训练数据用于训练商户分类模型。
39.根据第二方面，所述第二确定模块包括：
40.第一确定单元，用于在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，确定所述多个样本商户的样本商户标识信息在样本商户标识信息集合中的比重信息；
41.第二确定单元，用于根据所述多个交易活跃特征信息、所述商户类别标签和所述比重信息，确定所述第一条件熵。
42.根据第二方面，所述第二确定单元包括：
43.获取子单元，用于获取所述多个交易活跃特征信息对应的交易活跃特征值集合；
44.第一确定子单元，用于根据所述交易活跃特征值集合和所述商户类别标签，确定第一信息熵；其中，所述第一信息熵表征在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，所述每个交易活跃特征信息的信息量的不确定性；
45.第二确定子单元，用于根据所述比重信息和所述第一信息熵，确定所述第一条件熵。
46.根据第二方面，所述第一确定模块包括：
47.获取单元，用于获取所述每个样本商户对应的多个原始特征信息；
48.特征构建单元，用于根据所述多个原始特征信息对应的特征类型，对所述多个原始特征信息进行特征构建，得到所述每个样本商户对应的多个交易活跃特征信息。
49.根据第二方面，所述特征构建单元包括：
50.离散化子单元，用于在所述多个原始特征信息的特征类型为连续特征的情况下，对所述多个原始特征信息进行离散化，得到每个原始特征信息对应的多个离散化特征信息；
51.确定子单元，用于根据所述多个离散化特征信息和所述商户类别标签，确定第二条件熵；其中，所述第二条件熵表征在所述多个样本商户对应的商户类别标签为目标商户类别标签的条件下，每个离散化特征信息的不确定性；
52.特征分割子单元，用于根据所述第二条件熵，对所述多个原始特征信息进行特征分割，得到所述多个交易活跃特征信息。
53.根据第二方面，所述特征构建单元的确定子单元包括：
54.获取子子单元，用于获取每个离散化特征信息对应的离散化特征值集合；
55.第一确定子子单元，用于根据所述离散化特征值集合和所述商户类别标签，确定第二信息熵；其中，所述第二信息熵表征在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，所述每个离散化特征信息的信息量的不确定性；
56.第二确定子子单元，用于根据所述比重信息和所述第二信息熵，确定所述第二条件熵。
57.根据第二方面，特征构建单元包括：
58.优化子单元，用于在所述多个原始特征信息的特征类型为离散特征的情况下，对所述多个原始特征信息进行优化，得到所述多个交易活跃特征信息。
59.根据第二方面，上述装置还包括：
60.分类识别模块，用于将所述训练数据输入所述商户分类模型进行分类识别，得到所述训练数据对应的预测类别标签；
61.第二获取模块，用于获取所述训练数据对应的商户类别标签；
62.计算模块，用于根据所述训练数据对应的预测类别标签和商户类别标签，计算所述商户分类模型对应的目标损失；
63.第四确定模块，用于在所述目标损失不满足预设条件的情况下，根据所述目标损失调整所述商户分类模型的模型参数，基于调整后的商户分类模型更新所述目标损失，确定所述目标损失满足所述预设条件时，对应的商户分类模型为目标商户分类模型。
64.第三方面，本技术提供了一种训练数据确定设备，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序、所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上所述的训练数据确定方法。
65.第四方面，本技术提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述的训练数据确定方法。
66.本技术提供的训练数据确定方法、装置、设备及计算机可读存储介质，具有如下技术效果：
67.本技术通过获取多个样本商户各自对应的商户类别标签，可以迅速确定每个样本商户对应的多个交易活跃特征信息，提高训练数据的确定效率。通过确定第一条件熵，可以根据第一条件熵所表征的多个样本商户对应的商户类别标签为目标商户类别标签的条件下、每个交易活跃特征信息的不确定性，从多个交易活跃特征信息中确定训练数据，可以提高训练数据的准确性和客观性，进而在利用训练数据训练商户分类模型的情况下，提高商户分类模型的训练效果和训练效率。
68.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术。
附图说明
69.为了更清楚地说明本技术实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。
70.图1是本技术实施例提供的一种数据共享系统的示意图；
71.图2是本技术实施例提供的一种训练数据确定方法的流程示意图；
72.图3是本技术实施例提供的一种第一条件熵确定过程的流程示意图；
73.图4是本技术实施例提供的一种多个交易活跃特征信息确定过程的流程示意图；
74.图5是本技术实施例提供的一种结构树的示意图；
75.图6是本技术实施例提供的一种第二条件熵确定过程的流程示意图；
76.图7是本技术实施例提供的一种商户分类模型训练过程的流程示意图；
77.图8是本技术实施例提供的一种训练数据确定装置的结构示意图；
78.图9是本技术实施例提供的一种训练数据确定服务器的示意图。
具体实施方式
79.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本技术保护的范围。
80.需要说明的是，本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
81.本技术实施例涉及一种商户分类系统，该商户分类系统包括服务器和终端，可以通过服务器实现商户分类模型的训练，通过终端实现商户分类模型的应用。
82.本技术实施例涉及的商户分类系统可以是由客户端、多个节点(接入网络中的任意形式的计算设备，如服务器、用户终端)通过网络通信的形式连接形成的分布式系统。其中，客户端可以部署于终端。
83.以分布式系统为区块链系统为例，参见图1，图1是本发明实施例提供的分布式系统100应用于区块链系统的一个可选的结构示意图，由多个节点(接入网络中的任意形式的计算设备，如服务器、用户终端)和客户端形成，节点之间形成组成的点对点(p2p，peer to peer)网络，p2p协议是一个运行在传输控制协议(tcp，transmission control protocol)协议之上的应用层协议。在分布式系统中，任何机器如服务器、终端都可以加入而成为节点，节点包括硬件层、中间层、操作系统层和应用层。
84.参见图1示出的区块链系统中各节点的功能，涉及的功能包括：
85.1)路由，节点具有的基本功能，用于支持节点之间的通信。
86.节点除具有路由功能外，还可以具有以下功能：
87.2)应用，用于部署在区块链中，根据实际业务需求而实现特定业务，记录实现功能相关的数据形成记录数据，在记录数据中携带数字签名以表示任务数据的来源，将记录数据发送到区块链系统中的其他节点，供其他节点在验证记录数据来源以及完整性成功时，将记录数据添加到临时区块中。
88.例如，应用实现的业务包括：
89.2.1)钱包，用于提供进行电子货币的交易的功能，包括发起交易(即，将当前交易的交易记录发送给区块链系统中的其他节点，其他节点验证成功后，作为承认交易有效的响应，将交易的记录数据存入区块链的临时区块中；当然，钱包还支持查询电子货币地址中剩余的电子货币；
90.2.2)共享账本，用于提供账目数据的存储、查询和修改等操作的功能，将对账目数据的操作的记录数据发送到区块链系统中的其他节点，其他节点验证有效后，作为承认账目数据有效的响应，将记录数据存入临时区块中，还可以向发起操作的节点发送确认。
91.2.3)智能合约，计算机化的协议，可以执行某个合约的条款，通过部署在共享账本上的用于在满足一定条件时而执行的代码实现，根据实际的业务需求代码用于完成自动化的交易，例如查询买家所购买商品的物流状态，在买家签收货物后将买家的电子货币转移到商户的地址；当然，智能合约不仅限于执行用于交易的合约，还可以执行对接收的信息进行处理的合约。
92.3)区块链，包括一系列按照产生的先后时间顺序相互接续的区块(block)，新区块一旦加入到区块链中就不会再被移除，区块中记录了区块链系统中节点提交的记录数据。
93.本技术实施例中，商户分类模型的训练和应用涉及人工智能技术，具体是涉及人工智能技术的机器学习方向。
94.人工智能(artificial intelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
95.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
96.机器学习(machine learning，ml)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
97.具体的，在商户分类模型的训练阶段，本技术需要确定准确性满足要求的训练数据，以在利用训练数据训练商户分类模型的情况下，提高训练效率和训练效果。
98.以下介绍本技术的训练数据确定方法，本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或服务器产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
99.在一个具体的实施例中，如图2所示，本技术提供了一种训练数据确定方法，方法包括：
100.s201：获取多个样本商户各自对应的商户类别标签；其中，所述商户类别标签表征所述多个样本商户对应的交易活跃程度。
101.本技术实施例中，多个样本商户可以为至少两个样本商户，至少两个样本商户各
自对应的商户类别标签可以表征上述至少两个样本商户的类别。
102.在数据建模的应用场景中，为了建立商户分类模型，服务器需要获得合适的训练数据。通过获取多个样本商户标识信息，服务器可以确定每个样本商户标识信息对应的多个交易活跃特征信息，从而获取多个样本商户各自对应的多个交易活跃特征信息。根据多个交易活跃特征信息和商户类别标签，确定与商户类别标签关联程度高的多个交易活跃特征信息为训练数据。利用训练数据训练商户分类模型，可以提高商户分类模型的训练效果和训练效率。
103.在一个具体的实施例中，上述样本商户标识信息可以包括但不限于样本商户id(identity document)和样本商户名称。
104.在一个具体的实施例中，商户分类模型的分类模式可以为二分类模式，还可以为多分类模式。
105.在一个具体的实施例中，可以根据实际应用需求，预先确定多个样本商户各自对应的商户类别标签。可以理解，商户类别标签应与商户分类模型的分类功能一致，所述商户类别标签表征多个样本商户对应的交易活跃程度，则商户分类模型的分类功能为对交易活跃程度不同的商户进行分类。按照二分类的分类方式将至少两个样本商户分类为交易活跃的商户和交易不活跃的商户。还可以按照三分类的方式将至少两个样本商户分类为交易活跃程度高等的商户、交易活跃程度中等的商户和交易活跃程度低等的商户。
106.在一个具体的实施例中，获取多个样本商户标识信息各自对应的商户类别标签包括：
107.服务器根据映射信息，确定多个样本商户标识信息各自对应的商户类别标签；其中，所述映射信息表征至少两个样本商户标识信息与对应的商户类别标签的映射关系。
108.具体的，可以人工标注至少两个样本商户对应的商户类别标签，服务器根据至少两个样本商户对应的商户类别标签和样本商户标识信息，建立映射信息。
109.本技术实施例中，服务器预先建立映射信息，根据映射信息确定多个样本商户标识信息各自对应的商户类别标签，从而确定多个样本商户各自对应的商户类别标签，可以减少服务器的处理时间，提高训练数据的确定效率。
110.s203：确定每个样本商户对应的多个交易活跃特征信息。
111.本技术实施例中，所述每个样本商户对应的多个交易活跃特征信息可以表征每个样本商户的多个交易活跃特征。具体的，所述多个交易活跃特征信息与商户类别标签的关联程度存在差异。与商户类别标签的关联程度高的交易活跃特征信息有利于提高商户分类的准确性和效率。
112.在一个具体的实施例中，所述多个交易活跃特征信息可以包括但不限于交易天数、至少两个交易金额区间、交易笔数和交易时间。具体的，上述交易时间指的是历史周期内最近一次交易的交易时间。其中，上述历史周期可以根据实际应用需求而定，例如1个月。
113.在一个具体的实施例中，可以从每个样本商户对应的历史交易记录中提取多个交易活跃度特征信息。该历史交易记录包括历史周期内每个样本商户完成的每个交易的记录。
114.可以理解，交易天数多、交易金额大、交易笔数多以及交易时间近，说明样本商户的交易活跃程度越高。
115.为了识别上述多个交易活跃特征信息中哪个交易活跃特征信息与商户交易活跃程度的关联程度更大，本技术实施例结合多个交易活跃特征信息对应的条件熵来确定。
116.在一个可选的实施例中，上述多个交易活跃特征信息还可以包括与多个样本商户交易的每个用户对应的用户特征信息。上述用户特征信息可以表征对应用户的质量。具体的，用户的质量越高，说明样本商户的交易活跃程度越高。
117.在一个具体的实施例中，可以从每个样本商户的历史交易记录中提取对应的多个商户特证信息。
118.本技术通过获取多个样本商户各自对应的商户类别标签，可以迅速确定每个样本商户对应的多个交易活跃特征信息，提高训练数据的确定效率。
119.s205：根据所述多个交易活跃特征信息和所述商户类别标签，确定第一条件熵；其中，所述第一条件熵表征在所述多个样本商户对应的商户类别标签为目标商户类别标签的条件下，每个交易活跃特征信息的不确定性；所述目标商户类别标签为所述多个样本商户对应的商户类别标签中的任一商户类别标签。
120.本技术实施例中，所述第一条件熵包括多个交易活跃特征信息对应的条件熵。
121.在此需要说明的是，条件熵h(x|y)表示在已知随机变量y的条件下，随机变量x的不确定性。具体的，条件熵越小，在已知随机变量y的条件下，随机变量x的不确定性越低，与随机变量y的关联程度越高。具体的，条件熵h(x|y)的推导公式如下：
[0122][0123]
其中，p(y)表示随机变量y为y的概率；p(x|y＝y)表示随机变量为y的条件下，随机变量x的期望；p(x|y)表示随机变量y为y的条件下，随机变量x为x的概率；p(x,y)表示随机变量y为y、且随机变量x为x的概率。
[0124]
可以理解，本技术实施例通过确定多个交易活跃特征信息对应的条件熵，具体是确定多个样本商户对应的商户类别标签(y)为目标商户类别标签(y)的条件下，每个交易活跃特征信息(x)对应的条件熵，可以根据每个交易活跃特征信息对应的条件熵，准确地评估每个交易活跃特征信息与商户类别标签的关联程度。
[0125]
在一个具体的实施例中，若按照二分类的分类方式将至少两个样本商户分类为交易活跃的商户和交易不活跃的商户，则目标商户类别标签可以为交易活跃的商户。
[0126]
s207：根据所述第一条件熵，从所述多个交易活跃特征信息中确定训练数据；其中，所述训练数据用于训练商户分类模型。
[0127]
本技术实施例中，所述商户分类模型用于对商户进行分类。
[0128]
在一个可选的实施例中，可以将条件熵低于第一预设阈值的交易活跃特征信息选取为训练数据。具体的，第一预设阈值可以基于实际应用需求而定。
[0129]
在一个可选的实施例中，可以根据条件熵由低到高，对多个交易活跃特征信息进
行排序，将顺序位于前n位的交易活跃特征信息作为训练数据。具体的，n可以根据实际应用需求而定。
[0130]
例如，交易天数的条件熵为log3、交易笔数的条件熵为log2、交易时间的条件熵为log4、交易金额区间1的条件熵为log5以及交易金额区间2的条件熵为log0。按照第一种方案选取训练数据，可以将条件熵低于log4的交易活跃特征信息选取出来。按照第二种方案选取训练数据，可以按照条件熵由低到高对上述多个交易活跃特征信息进行排序，将顺序位于前三的交易活跃特征信息选取出来。
[0131]
本技术实施例中，根据第一条件熵从多个交易活跃特征信息中确定训练数据，利用训练数据训练商户分类模型，可以提高训练数据的确定准确性和确定效率，进而提高商户分类模型的训练效果和训练效率，以及提高训练获得的目标商户分类模型的分类能力。
[0132]
在s205中，本技术实施例可以结合上述公式1中的任一个推导步骤，对第一条件熵进行计算。
[0133]
在一个可选的实施例中，可以结合上述公式1的第二个推导步骤，对第一条件熵进行计算。也即，确定第一条件熵所采用的公式为：
[0134][0135]
相应的，上述根据所述多个交易活跃特征信息和所述商户类别标签，确定第一条件熵包括：
[0136]
在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，确定所述多个样本商户的样本商户标识信息在样本商户标识信息集合中的比重信息；
[0137]
根据所述多个交易活跃特征信息、所述商户类别标签和所述比重信息，确定所述第一条件熵。
[0138]
本技术实施例中，所述比重信息可以表征样本商户标识信息集合中的样本商户对应的样本类别标签为目标商户类别标签的概率。也即，所述比重信息可以表征p(y)。
[0139]
此外，根据所述多个交易活跃特征信息和所述商户类别标签，可以确定公式2中除p(y)之外的部分。
[0140]
为了说明如何确定公式2中除p(y)之外的部分，如图3所示，为第一条件熵确定过程的流程示意图。具体的，上述根据所述多个交易活跃特征信息、所述商户类别标签和所述比重信息，确定所述第一条件熵包括：
[0141]
s301：获取所述多个交易活跃特征信息对应的交易活跃特征值集合。
[0142]
本技术实施例中，每个交易活跃特征信息对应的交易活跃特征值集合可以包括至少两个样本商户对应的每个交易活跃特征信息的交易活跃特征值。可以理解，每个交易活跃特征信息对应随机变量x，每个交易活跃特征信息对应的交易活跃特征值集合对应随机变量x的所有取值x的集合。
[0143]
以交易活跃特征信息为交易天数为例，样本商户标识a对应的交易天数为10天，样本商户标识b对应的交易天数为20天，样本商户标识c对应的交易天数为30天，样本商户标识d对应的交易天数为25天，样本商户标识e对应的交易天数为15天。则交易天数对应的交易天数值集合为{10,20,30,25,15}。
[0144]
s303：根据所述交易活跃特征值集合和所述商户类别标签，确定第一信息熵；其
中，所述第一信息熵表征在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，所述每个交易活跃特征信息的信息量的不确定性。
[0145]
本技术实施例中，所述第一信息熵包括每个交易活跃特征信息对应的信息熵。
[0146]
具体的，信息熵的计算公式如下：
[0147][0148]
其中，p(x|y)表示随机变量y为y的条件下，随机变量x为x的概率。
[0149]
可以理解，本技术实施例确定第一信息熵，具体是确定商户类别标签(y)为目标商户类别标签(y)的情况下，每个交易活跃特征信息(x)取不同的交易活跃特征值的期望之和。其中，期望指的是公式3中p(x|y)log(p(x|y))这部分。
[0150]
以交易活跃特征信息为交易天数为例，样本商户标识a、c和d对应的商户类别标签为目标商户类别标签，则利用样本商户标识a、c和d对应的交易天数的交易天数值计算交易天数对应的信息熵。具体计算过程如下：
[0151][0152]
s305：根据所述比重信息和所述第一信息熵，确定所述第一条件熵。
[0153]
本技术实施例中，在获得第一信息熵和所述比重信息的情况下，可以确定第一条件熵。
[0154]
可以理解，在s203中，多个交易活跃特征信息并非服务器可以直接获得的数据。
[0155]
为了确定每个样本商户对应的多个交易活跃特征信息，服务器需要预先获取每个样本商户对应的多个原始特征信息，对多个原始特征信息进行特征构建，得到可以表征样本商户的特征的多个交易活跃特征信息。
[0156]
相应的，上述确定每个样本商户标识信息对应的多个交易活跃特征信息包括：
[0157]
获取所述每个样本商户对应的多个原始特征信息；
[0158]
根据所述多个原始特征信息对应的特征类型，对所述多个原始特征信息进行特征构建，得到所述每个样本商户对应的多个交易活跃特征信息。
[0159]
本技术实施例中，多个原始特征信息可以为至少两个原始特征信息。上述至少两个原始特征信息可以表征每个样本商户的至少两个原始特征。在一个具体的实施例中，若商户分类模型的分类功能为对交易活跃程度不同的商户进行分类，则至少两个原始特征可以包括但不限于原始交易天数、原始交易金额、原始交易时间和原始交易笔数。
[0160]
可以理解，上述至少两个原始特征信息的特征类型包括离散特征和连续特征，例如原始交易天数和原始交易笔数为离散特征类型的原始特征信息，例如原始交易金额为连续特征类型的原始特征信息。
[0161]
考虑到离散特征类型的原始特征信息的数据格式和分散程度不符合要求，需要对离散特征进行优化处理，考虑到连续特征类型的原始特征信息需要进行分割，服务器可以根据所述多个原始特征信息对应的特征类型，对所述多个原始特征信息进行特征构建，满足不同类型的原始特征信息的特征构建需求。
[0162]
本技术实施例中，特征构建的方式包括但不限于分区(分箱)、缺失值处理、独热编码、特征哈希、嵌套法、取对数、特征缩放、归一化和特征交互。其中，上述分区适用于特征类型为连续特征的原始特征信息，上述缺失值处理、独热编码、特征哈希、嵌套法、取对数、特征缩放、标准化、归一化和特征交互适用于特征类型为离散特征的原始特征信息，可对特征类型为离散特征的原始特征信息进行优化。
[0163]
在一个具体的实施例中，如图4所示，为一种多个交易活跃特征信息确定过程的流程示意图。具体的，上述根据所述多个原始特征信息对应的特征类型，对所述多个原始特征信息进行特征构建，得到所述每个样本商户对应的多个交易活跃特征信息包括：
[0164]
s401：在所述多个原始特征信息的特征类型为连续特征的情况下，对所述多个原始特征信息进行离散化，得到每个原始特征信息对应的多个离散化特征信息。
[0165]
本技术实施例中，采用分区的特征构建方式对所述多个原始特征信息进行离散化，具体是将每个原始特征信息划分为多个离散化特征信息。以原始特征信息为原始交易金额为例，上述样本商户标识信息a、b、c、d和e对应的原始交易金额的数值分别为10000、11000、5000、6000和15000。可以确定，原始交易金额可以为[0,15000]的原始交易金额区间，根据实际应用需求确定划分量度，例如划分量度为1000，可以确定分割点为1000、2000、3000、
……
和14000，以将[0,15000]划分为[0,1000]和(1000,15000]，进而将(1000,15000]划分为(1000,2000]和(2000,15000]
……
以此类推。
[0166]
基于此，可以建立如图5所示的结构树，该结构树囊括了根据上述分割点对原始交易金额进行划分的全部方案(左边的分支与右边的任一层分支即可构成一个划分方案)。通过计算该结构树每个分支的条件熵，即可将条件熵满足要求的分割方案所涉及的分割点作为最佳分割点。
[0167]
s403：根据所述多个离散化特征信息和所述商户类别标签，确定第二条件熵；其中，所述第二条件熵表征在所述多个样本商户对应的商户类别标签为目标商户类别标签的条件下，每个离散化特征信息的不确定性。
[0168]
本技术实施例中，所述多个离散化特征信息可以为至少两个离散化特征信息。相应的，所述第二条件熵可以包括至少两个离散化特征信息对应的条件熵。
[0169]
参照公式1，可以理解，本技术实施例通过确定多个离散化特征信息对应的条件熵，具体是确定多个样本商户对应的商户类别标签(y)为目标商户类别标签(y)的条件下，每个离散化特征信息(x)对应的条件熵，可以根据每个离散化特征信息对应的条件熵，准确地评估每个离散化特征信息与商户类别标签的关联程度。
[0170]
s405：根据所述第二条件熵，对所述多个原始特征信息进行特征分割，得到所述多个交易活跃特征信息。
[0171]
本技术实施例中，服务器确定条件熵最低的分割方案为最佳分割方案，将最佳分割方案所涉及的分割点作为最佳分割点。
[0172]
具体的，特征分割的处理方式可以包括分区。
[0173]
本技术实施例中，根据第二条件熵，可以确定对特征类型为连续特征的原始特征信息的最佳分割方案，得到与商户类别标签关联程度更高的多个交易活跃特征信息。
[0174]
在s403中，本技术实施例可以结合公式2对第二条件熵进行计算。具体的，如图6所示，为一种第二条件熵确定过程的流程示意图，上述根据所述多个离散化特征信息和所述
商户类别标签，确定第二条件熵包括：
[0175]
s601：获取每个离散化特征信息对应的离散化特征值集合。
[0176]
本技术实施例中，每个离散化特征信息对应的离散化特征值集合可以包括至少两个样本商户对应的每个离散化特征信息的离散化特征值。可以理解，每个离散化特征信息对应随机变量x，每个离散化特征信息对应的离散化特征值集合对应随机变量x的所有取值x的集合。
[0177]
以原始特征信息为原始交易金额为例，样本商户标识a、b、c、d和e对应的原始交易金额分别为10000、11000、5000、6000和15000。则按照前述方案对原始交易金额进行离散化，得到的多个离散化特征信息包括[0,1000]、(1000,15000]、(1000,2000]和(2000,15000]等，具体可参照图5。
[0178]
s603：根据所述离散化特征值集合和所述商户类别标签，确定第二信息熵；其中，所述第二信息熵表征在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，所述每个离散化特征信息的信息量的不确定性。
[0179]
本技术实施例中，所述第二信息熵包括每个离散化特征信息对应的信息熵。
[0180]
本技术实施例中，结合公式3计算每个离散化特征信息对应的信息熵。
[0181]
可以理解，本技术实施例确定第二信息熵，具体是确定商户类别标签(y)为目标商户类别标签(y)的情况下，每个离散化特征信息(x)取不同的离散化特征值的期望之和。其中，期望指的是公式3中p(x|y)log(p(x|y))这部分。
[0182]
以分割方案涉及的离散化特征信息包括[0,1000]和(1000,15000]为例，样本商户a、c和d对应的商户类别标签为目标商户类别标签，则利用样本商户a、c和d对应的原始交易金额的数值计算该分割方案对应的信息熵。具体计算过程如下：
[0183]
h(x)＝h1 h2；其中，h1为[0,1000]对应的信息熵，h2为(1000,15000]对应的信息熵。
[0184]
其中，h1＝-p([0,1000]|目标商户类别标签)log(p([0,1000]|目标商户类别标签))＝0。因为a、c和d对应的原始交易金额的数值均不在[0,1000]内。
[0185]
其中，其中，
[0186]
则h(x)＝0。
[0187]
s605：根据所述比重信息和所述第二信息熵，确定所述第二条件熵。
[0188]
本技术实施例中，在确定每个离散化特征信息对应的信息熵和所述比重信息的情况下，服务器可以确定每个离散化特征信息对应的条件熵。根据每个离散化特征信息对应的条件熵，服务器可以确定最佳分割方案，将最佳分割方案所涉及的分割点作为最佳分割点，将根据最佳分割点对特征类型为连续特征的每个原始特征信息进行划分得到的离散化特征信息确定为多个交易活跃特征信息。
[0189]
可以理解，根据最佳分割点划分每个原始特征信息得到的离散化特征信息与商户类别标签的关联程度较高。
[0190]
本技术实施例中，对特征类型为连续特征的多个原始特征信息进行离散化处理，
可以得到能够计算条件熵的多个交易活跃特征信息。
[0191]
对于特征类型为离散特征的原始特征信息，在一个具体的实施例中，上述根据所述多个原始特征信息对应的特征类型，对所述多个原始特征信息进行特征构建，得到所述每个样本商户对应的多个交易活跃特征信息包括：
[0192]
在所述多个原始特征信息的特征类型为离散特征的情况下，对所述多个原始特征信息进行优化，得到所述多个交易活跃特征信息。
[0193]
本技术实施例中，在所述多个原始特征信息的特征类型为离散特征的情况下，对所述多个原始特征信息进行优化的方式包括但不限于缺失值处理、独热编码、特征哈希、嵌套法、取对数、特征缩放、标准化、归一化和特征交互。其中，缺失值处理、嵌套法和特征交互有利于完善多个原始特征信息，为获得多个交易活跃特征信息提供全面的数据支持。独热编码、特征哈希、取对数、特征缩放、标准化和归一化有利于将多个原始特征信息转化为数据形式和离散程度满足要求的多个交易活跃特征信息，易于处理。
[0194]
在s207中，为了说明如何利用训练数据训练商户分类模型，在一个具体的实施例中，如图7所示，为一种商户分类模型训练过程的流程示意图。具体的，上述方法还包括：
[0195]
s701：将所述训练数据输入所述商户分类模型进行分类识别，得到所述训练数据对应的预测类别标签。
[0196]
本技术实施例中，预测类别标签可以为所述商户分类模型根据所述训练数据预测的商户类别。
[0197]
s703：获取所述训练数据对应的商户类别标签。
[0198]
s705：根据所述训练数据对应的预测类别标签和商户类别标签，计算所述商户分类模型对应的目标损失。
[0199]
本技术实施例中，所述目标损失可以包括但不限于各种类型的交叉熵损失函数，适用于二分类或者多分类的分类模型的训练。
[0200]
s707：在所述目标损失不满足预设条件的情况下，根据所述目标损失调整所述商户分类模型的模型参数，基于调整后的商户分类模型更新所述目标损失，确定所述目标损失满足所述预设条件时，对应的商户分类模型为目标商户分类模型。
[0201]
在一个可选的实施例中，所述预设条件可以为所述目标损失低于第二预设阈值，或者训练次数达到第三预设阈值。具体的，第二预设阈值和第三预设阈值可以根据实际应用需求进行确定。
[0202]
本技术实施例中，利用确定的训练数据训练商户分类模型，可以提高商户分类模型的训练效果和训练效率，还可以提高获得的目标商户分类模型的分类能力。
[0203]
此外，本技术实施例所提供的训练数据确定方法也适用于多分类的场景。在多分类的场景中，可以先确定目标分类和除目标分类之外的其他分类，将多分类的场景简化为存在多次二分类处理的场景。然后对其他分类再进行二分类，以此类推。
[0204]
例如，在三分类的场景中，按照三分类的方式将至少两个样本商户分类为交易活跃程度高等的商户、交易活跃程度中等的商户和交易活跃程度低等的商户，可以将三分类的场景简化为两个二分类阶段。第一个二分类阶段对交易活跃程度高等的商户和其他商户进行分类，第二个二分类阶段将其他商户分类为交易活跃程度中等的商户和交易活跃程度低等的商户。在每个二分类阶段，均进行训练数据的选取。可以多选取一些训练数据，将每
个二分类阶段选取的训练数据取交集，得到目标训练数据，利用目标训练数据训练三分类场景的商户分类模型。
[0205]
在一个具体的实施例中，利用目标商户分类模型进行分类的过程包括：
[0206]
确定目标商户对应的待检测数据；
[0207]
将所述待检测数据输入所述目标商户分类模型，得到目标商户的商户类别标签。
[0208]
其中，上述目标商户可以为需要进行分类的商户。
[0209]
其中，上述待检测数据可以表征目标商户的多个特征，其数据类型与所述训练数据一致。
[0210]
本技术通过获取多个样本商户各自对应的商户类别标签，可以迅速确定每个样本商户对应的多个交易活跃特征信息，提高训练数据的确定效率。通过确定第一条件熵，可以根据第一条件熵所表征的每个交易活跃特征信息的不确定性，从多个交易活跃特征信息中确定训练数据，可以提高训练数据的确定效率和确定准确性，进而在利用训练数据训练商户分类模型的情况下，提高商户分类模型的训练效果和训练效率。
[0211]
其中，在确定每个样本商户对应的多个交易活跃特征信息的方案中，在所述多个原始特征信息的特征类型为离散特征的情况下，对所述多个原始特征信息进行优化的方式包括但不限于缺失值处理、独热编码、特征哈希、嵌套法、取对数、特征缩放、标准化、归一化和特征交互。其中，缺失值处理、嵌套法和特征交互有利于完善多个原始特征信息，为获得多个交易活跃特征信息提供全面的数据支持。独热编码、特征哈希、取对数、特征缩放、标准化和归一化有利于将多个原始特征信息转化为数据形式和离散程度满足要求的多个交易活跃特征信息，易于处理。
[0212]
在所述多个原始特征信息的特征类型为连续特征的情况下，将多个原始特征信息进行离散化，得到多个离散化特征信息，根据每个离散化特征信息对应的条件熵，服务器可以确定最佳分割方案，将最佳分割方案所涉及的分割点作为最佳分割点，将根据最佳分割点对特征类型为连续特征的每个原始特征信息进行划分得到的离散化特征信息确定为多个交易活跃特征信息。
[0213]
此外，本技术实施例所提供的训练数据确定方法适用于丰富的分类场景，具有良好的应用前景。
[0214]
如图8所示，本技术实施例还提供了一种训练数据确定装置800，上述装置包括：
[0215]
第一获取模块801，用于获取多个样本商户各自对应的商户类别标签；其中，所述商户类别标签表征多个样本商户对应的交易活跃程度；
[0216]
第一确定模块803，用于确定每个样本商户对应的多个交易活跃特征信息；
[0217]
第二确定模块805，用于根据所述多个交易活跃特征信息和所述商户类别标签，确定第一条件熵；其中，所述第一条件熵表征在所述多个样本商户对应的商户类别标签为目标商户类别标签的条件下，每个交易活跃特征信息的不确定性；所述目标商户类别标签为所述多个样本商户对应的商户类别标签中的任一商户类别标签；
[0218]
第三确定模块807，用于根据所述第一条件熵，从所述多个交易活跃特征信息中确定训练数据；其中，所述训练数据用于训练商户分类模型。
[0219]
在一些实施例中，所述第二确定模块805包括：
[0220]
第一确定单元，用于在所述多个样本商户对应的商户类别标签为所述目标商户类
别标签的条件下，确定所述多个样本商户的样本商户标识信息在样本商户标识信息集合中的比重信息；
[0221]
第二确定单元，用于根据所述多个交易活跃特征信息、所述商户类别标签和所述比重信息，确定所述第一条件熵。
[0222]
在一些实施例中，所述第二确定单元包括：
[0223]
获取子单元，用于获取所述多个交易活跃特征信息对应的交易活跃特征值集合；
[0224]
第一确定子单元，用于根据所述交易活跃特征值集合和所述商户类别标签，确定第一信息熵；其中，所述第一信息熵表征在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，所述每个交易活跃特征信息的信息量的不确定性；
[0225]
第二确定子单元，用于根据所述比重信息和所述第一信息熵，确定所述第一条件熵。
[0226]
在一些实施例中，所述第一确定模块803包括：
[0227]
获取单元，用于获取所述每个样本商户对应的多个原始特征信息；
[0228]
特征构建单元，用于根据所述多个原始特征信息对应的特征类型，对所述多个原始特征信息进行特征构建，得到所述每个样本商户对应的多个交易活跃特征信息。
[0229]
在一些实施例中，所述特征构建单元包括：
[0230]
离散化子单元，用于在所述多个原始特征信息的特征类型为连续特征的情况下，对所述多个原始特征信息进行离散化，得到每个原始特征信息对应的多个离散化特征信息；
[0231]
确定子单元，用于根据所述多个离散化特征信息和所述商户类别标签，确定第二条件熵；其中，所述第二条件熵表征在所述多个样本商户对应的商户类别标签为目标商户类别标签的条件下，每个离散化特征信息的不确定性；
[0232]
特征分割子单元，用于根据所述第二条件熵，对所述多个原始特征信息进行特征分割，得到所述多个交易活跃特征信息。
[0233]
在一些实施例中，所述特征构建单元的确定子单元包括：
[0234]
获取子子单元，用于获取每个离散化特征信息对应的离散化特征值集合；
[0235]
第一确定子子单元，用于根据所述离散化特征值集合和所述商户类别标签，确定第二信息熵；其中，所述第二信息熵表征在所述多个样本商户对应的商户类别标签为所述目标商户类别标签的条件下，所述每个离散化特征信息的信息量的不确定性；
[0236]
第二确定子子单元，用于根据所述比重信息和所述第二信息熵，确定所述第二条件熵。
[0237]
在一些实施例中，特征构建单元包括：
[0238]
优化子单元，用于在所述多个原始特征信息的特征类型为离散特征的情况下，对所述多个原始特征信息进行优化，得到所述多个交易活跃特征信息。
[0239]
在一些实施例中，上述装置还包括：
[0240]
分类识别模块，用于将所述训练数据输入所述商户分类模型进行分类识别，得到所述训练数据对应的预测类别标签；
[0241]
第二获取模块，用于获取所述训练数据对应的商户类别标签；
[0242]
计算模块，用于根据所述训练数据对应的预测类别标签和商户类别标签，计算所
述商户分类模型对应的目标损失；
[0243]
第四确定模块，用于在所述目标损失不满足预设条件的情况下，根据所述目标损失调整所述商户分类模型的模型参数，基于调整后的商户分类模型更新所述目标损失，确定所述目标损失满足所述预设条件时，对应的商户分类模型为目标商户分类模型。
[0244]
所述的装置实施例中的装置与方法实施例基于同样地发明构思。
[0245]
本技术实施例还提供了一种训练数据确定设备，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或者所述至少一段程序由所述处理器加载并执行以实现如上方法实施例提供的训练数据确定方法。
[0246]
所述的设备实施例中的设备与方法实施例基于同样地发明构思。
[0247]
本技术实施例还提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如上方法实施例提供的训练数据确定方法。
[0248]
所述的计算机可读存储介质实施例中的存储介质与方法实施例基于同样地发明构思。
[0249]
本技术还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各种可选实现方式中提供的方法。
[0250]
本技术实施例提供了一种训练数据确定服务器，该数据处理服务器包括处理器和存储器，该存储器中存储有至少一条指令、至少一段程序、代码集或指令集，该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现如上述方法实施例所提供的训练数据确定方法。
[0251]
存储器可用于存储软件程序以及模块，处理器通过运行存储在存储器的软件程序以及模块，从而执行各种功能应用以及训练数据确定。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、功能所需的应用程序等；存储数据区可存储根据所述设备的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器还可以包括存储器控制器，以提供处理器对存储器的访问。
[0252]
本技术实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例，图9是本技术实施例提供的一种训练数据确定方法的服务器的硬件结构框图。如图9所示，该服务器900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，cpu)910(处理器910可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器930，一个或一个以上存储应用程序923或数据922的存储介质920(例如一个或一个以上海量存储设备)。其中，存储器930和存储介质920可以是短暂存储或持久存储。存储在存储介质920的程序可以包括一个或一个以上模块，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器910可以设置为与存储介质920通信，在服务器900上执行存储介质920中的一系列指令操作。服务器900还可以包括一个或一个以上电
源960，一个或一个以上有线或无线网络接口950，一个或一个以上输入输出接口940，和/或，一个或一个以上操作系统921，例如windows servertm，mac os xtm，unixtm，linuxtm，freebsdtm等等。
[0253]
输入输出接口940可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器900的通信供应商提供的无线网络。在一个实例中，输入输出接口940包括一个网络适配器(network interface controller，nic)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，输入输出接口940可以为射频(radio frequency，rf)模块，其用于通过无线方式与互联网进行通讯。
[0254]
本领域普通技术人员可以理解，图9所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，服务器900还可包括比图9中所示更多或者更少的组件，或者具有与图9所示不同的配置。
[0255]
本技术的实施例还提供了一种存储介质，所述存储介质可设置于服务器之中以保存用于实现方法实施例中一种训练数据确定方法相关的至少一条指令、至少一段程序、代码集或指令集，该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述方法实施例提供的训练数据确定方法。
[0256]
可选地，在本实施例中，上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地，在本实施例中，上述存储介质可以包括但不限于：u盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，randomaccess memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0257]
由上述本技术提供的训练数据确定方法、装置、设备及计算机可读存储介质的实施例可见，本技术通过获取多个样本商户各自对应的商户类别标签，可以迅速确定每个样本商户对应的多个交易活跃特征信息，提高训练数据的确定效率。通过确定第一条件熵，可以根据第一条件熵所表征的每个交易活跃特征信息的不确定性，从多个交易活跃特征信息中确定训练数据，可以提高训练数据的确定效率和确定准确性，进而在利用训练数据训练商户分类模型的情况下，提高商户分类模型的训练效果和训练效率。
[0258]
需要说明的是：上述本技术实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
[0259]
本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
[0260]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0261]
以上所述仅为本技术的较佳实施例，并不用以限制本技术，凡在本技术的精神和
原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：远程尾控制导炮弹气动特性的分析方法及装置

训练数据确定方法、装置、设备及计算机可读存储介质与流程

相关文献

最热文献