一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于索引的可扩展交易对手识别方法、系统及介质与流程

2022-04-27 12:00:31 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,尤其涉及基于索引的可扩展交易对手识别方法、系统及介质。


背景技术:

2.现券交易是金融交易市场最活跃的一种交易形式。在现券交易的文本理解中,现券交易对手的识别是一个很重要的问题,针对现券交易的文本理解,一般需要综合一系列的智能算法和业务规则索引,才能完成对现券文本的综合理解。例如一段常见的现券交易语料“a债,0000001.ib 1y 3.901 xx机构出给yy机构\n c债0000002.ib 2 1y 3.5 yy机构出给zz机构请求hh机构”,要理解这段文本,并且为下游任务提供便捷的、智能化的操作,需要将这段文本结构化为如表1所示的结构形式:
3.表1文本结构化后的结构
[0004][0005]
这其中包括几个子任务过程,首先是意图理解,判断用户是在询价还是成交;其次是要素提取,提取出用户提供的核心要素“债券名称、利率、交易量、交易对手”等等,针对意图识别和要素提取,可以基于深度神经网络比较好的解决此类问题。
[0006]
但是针对交易对手的识别,基于“对话文本”并不能准确判断对手、以及对手方向,往往需要场外的“金融专业知识”才能进行综合判断,由于通常采用硬编码的计算方法,规则固定难以更改,使得交易对手识别模型的维护成本很高且可扩展性差。
[0007]
因此,现有技术还有待于改进和发展。


技术实现要素:

[0008]
鉴于上述现有技术的不足,本发明的目的在于提供基于索引的可扩展交易对手识别方法、系统及介质,旨在提高交易对手识别的泛化能力和可扩展性。
[0009]
本发明的技术方案如下:
[0010]
一种基于索引的可扩展交易对手识别方法,包括:
[0011]
获取待识别文本,对所述待识别文本进行特征提取,得到所述待识别文本中的实体要素;
[0012]
基于预设的结构化规则索引,根据所述实体要素对所述待识别文本进行结构化处
理,得到结构化订单信息;
[0013]
根据预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手。
[0014]
在一个实施例中,所述获取待识别文本,对所述待识别文本进行特征提取,得到所述待识别文本中的实体要素,包括:
[0015]
通过预训练模型对所述待识别文本进行逐个字符切分,得到相应的字符向量编码;
[0016]
对所述字符向量编码进行特征提取后输出每个字符的语义特征向量;
[0017]
对所述语义特征向量中的实体要素进行标签预测,标注得到所述待识别文本中的实体要素。
[0018]
在一个实施例中,所述基于预设的结构化规则索引,根据所述实体要素对所述待识别文本进行结构化处理,得到结构化订单信息,包括:
[0019]
对所述待识别文本进行换行分割,得到若干行子文本以及每行子文本包括的实体要素;
[0020]
根据各行子文本中的实体要素对每行子文本进行类别判断,得到每行子文本的信息类别;
[0021]
根据预设的结构化规则索引以及每行子文本的信息类别,对各行子文本进行要素聚合补齐,得到至少一个结构化订单信息。
[0022]
在一个实施例中,所述根据各行子文本中的实体要素对每行子文本进行类别判断,得到每行子文本的信息类别,包括:
[0023]
预先构建第二决策树模型以及用于训练所述第二决策树模型的实体特征训练样本;
[0024]
采用基尼指数最小作为特征选择准则,通过所述实体特征训练样本对所述第二决策树模型进行学习训练;
[0025]
根据各行子文本中的实体要素,通过训练完成的所述第二决策树模型对每行子文本进行类别判断,得到每行子文本的信息类别。
[0026]
在一个实施例中,所述信息类别包括订单信息、共享信息、补充信息和其他信息。
[0027]
在一个实施例中,所述根据预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手之前,所述方法还包括:
[0028]
预先构建第一决策树模型以及用于训练所述第一决策树模型的机构特征训练样本,所述机构特征训练样本包括交易机构的位置与方向;
[0029]
采用id3算法的信息增益策略,通过所述机构特征训练样本对所述第一决策树模型进行训练,直到所述第一决策树模型的信息增益达到最大时完成训练。
[0030]
在一个实施例中,所述根据预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手,包括:
[0031]
获取所述结构化订单信息中各个交易机构的位置与交易方向;
[0032]
根据各个交易机构的位置与交易方向,通过训练完成的所述第一决策树模型对每
个交易机构的机构类别进行判断,所述机构类别包括买方机构、卖方机构和过桥机构;
[0033]
基于当前的视觉机构,根据所述逻辑索引和每个交易机构的机构类别确认所述待识别文本中相对于所述视觉机构的交易对手。
[0034]
在一个实施例中,所述基于当前的视觉机构,根据所述逻辑索引和每个交易机构的机构类别确认所述待识别文本中相对于所述视觉机构的交易对手,具体包括:
[0035]
若当前的视觉机构为买方机构,则所述交易对手为所述待识别文本中的卖方机构;
[0036]
若当前的视觉机构为卖方机构,则所述交易对手为所述待识别文本中的买方机构;
[0037]
若当前的视觉机构为过桥机构,则所述交易对手为所述待识别文本中的买方机构和卖方机构。
[0038]
一种基于索引的可扩展交易对手识别系统,所述系统包括至少一个处理器;以及,
[0039]
与所述至少一个处理器通信连接的存储器;其中,
[0040]
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述基于索引的可扩展交易对手识别方法。
[0041]
一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的基于索引的可扩展交易对手识别方法。
[0042]
有益效果:本发明公开了基于索引的可扩展交易对手识别方法、系统及介质,相比于现有技术,本发明实施例通过准确提取待识别文本中的实体要素特征,并基于结构化规则索引进行订单切割实现高效的订单文本结构化处理,进一步采用软编码形式的决策树模型来实现泛化能力强的交易对手识别,有效提高交易对手识别的可扩展性且降低了训练维护成本。
附图说明
[0043]
下面将结合附图及实施例对本发明作进一步说明,附图中:
[0044]
图1为本发明实施例提供的基于索引的可扩展交易对手识别方法的一个流程图;
[0045]
图2为本发明实施例提供的基于索引的可扩展交易对手识别方法中第二决策树模型的示意图;
[0046]
图3为本发明实施例提供的基于索引的可扩展交易对手识别装置的功能模块示意图;
[0047]
图4为本发明实施例提供的基于索引的可扩展交易对手识别系统的硬件结构示意图。
具体实施方式
[0048]
为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。以下结合附图对本发明实施例进行介绍。
[0049]
请参阅图1,图1为本发明提供的基于索引的可扩展交易对手识别方法一个实施例的流程图。本实施例提供的基于索引的可扩展交易对手识别方法适用于对交易过程中的交易对手进行自动识别的情况。如图1所示,该方法具体包括如下步骤:
[0050]
s100、获取待识别文本,对所述待识别文本进行特征提取,得到所述待识别文本中的实体要素。
[0051]
本实施例中,待识别文本可以是现券交易过程中的交易对话文本信息,例如不同交易机构之间发送的订单信息、咨询信息等等,通过获取交易对话中的文本信息作为待识别文本并自动提取其中的特征,进而得到待识别文本中的实体要素,具体的实体要素可以包括机构名称、交易方向、交易期限、交易量、交易方式、交易产品名称等等,实现高效的文本特征提取以作为后续识别交易对手的数据基础。当然,在其他实施例中,待识别文本不仅限于现券交易中的文本信息,也可以是其他交易中的文本信息,或者对交易语音信息进行识别转换得到的文本信息等等,本实施例对此不作限定。
[0052]
在一个实施例中,步骤s100包括:
[0053]
通过预训练模型对所述待识别文本进行逐个字符切分,得到相应的字符向量编码;
[0054]
对所述字符向量编码进行特征提取后输出每个字符的语义特征向量;
[0055]
对所述语义特征向量中的实体要素进行标签预测,标注得到所述待识别文本中的实体要素。
[0056]
本实施例中,在进行文本特征提取时,通过预训练模型对所述待识别文本进行逐个字符切分,得到相应的字符向量编码,本实施例具体采用基于bert的预训练模型进行字符编码,bert是一个预训练的语言表征模型,其强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练,而是采用新的mlm(masked language model,掩蔽语言模型),以生成深度的双向语言表征,即对于输入文本按一定的概率随机屏蔽掉文本内一些词汇,然后让bert模型去预测这些被屏蔽的词汇从而进行预训练,获得每个字符的向量编码,当然在其它实施例中还可采用例如roberta、ernie等预训练模型进行字符编码,本实施例对此不作限定。
[0057]
在得到字符向量编码则进行特征学习与提取,以得到每个字符的语义特征向量,具体可通过lstm(long short-term memory,长短期记忆)网络结构对字符编码后的序列文本的特征进行学习,以提取得到每个字符的语义特征向量,具体将bert预训练模型获取的字符向量编码作为lstm网络的输入,采用n维的lstm网络结构进行特征学习和提取,输出n维的语义特征向量。
[0058]
在获取到字符的语义特征向量后则可通过已完成训练的标签预测模型对该语义特征向量进行解码标注,标注得到待识别文本中实体要素的位置和类别等信息,具体标签预测训练模型可采用成熟的crf(conditional random fields,条件随机场)算法来实现高效准确的序列标注,即本实施例中通过基于bert lstm crf并针对现券进行定向优化的深度学习模型,将序列文本中的“机构名称、交易方向、交易期限、交易量、交易方式、交易产品名称”等实体要素信息进行提取,获取到序列文本中的各种核心要素信息,当然在其它实施例中,还可采用其它具有相同提取效果的深度学习模型,本实施例对此不作限定。
[0059]
s200、基于预设的结构化规则索引,根据所述实体要素对所述待识别文本进行结
构化处理,得到结构化订单信息。
[0060]
本实施例中,针对非结构文本,在获取到待识别文本中的实体要素后则基于预设的结构化规则索引对其进行自动的结构化处理,针对一条信息中的“多债券”情况进行多条订单的切割,形成具有相应结构且信息完整的结构化订单信息,从而将杂乱无序且可能有信息缺失的待识别文本进行规则化,以便后续能基于准确的结构化订单信息进行高效的对手识别处理,提高对手识别的效率和准确性。
[0061]
在一个实施例中,步骤s200包括:
[0062]
对所述待识别文本进行换行分割,得到若干行子文本以及每行子文本包括的实体要素;
[0063]
根据各行子文本中的实体要素对每行子文本进行类别判断,得到每行子文本的信息类别;
[0064]
根据预设的结构化规则索引以及每行子文本的信息类别,对各行子文本进行要素聚合补齐,得到至少一个结构化订单信息。
[0065]
本实施例中,在进行结构化处理是,先基于待识别文本中本身存在换行符“\n”,通过“\n”字符对所述待识别文本进行换行分割,得到若干行子文本,从而获得每行子文本中所包括的实体要素,基于每行子文本中的实体要素对每行信息进行类别判断,将每行信息判断为订单信息、共享信息、补充信息、其他信息,即得到每行子文本的信息类别,其中,订单信息定义为本行信息有“债券名或债券代码”等核心的现券交易主题的文本信息;补充信息定义为本行信息无现券交易的核心信息的补充信息;共享信息为本行信息是共享到各个订单信息中的公共共享信息;其它信息是一些无效的文本信息,如没有任何有效实体的信息。
[0066]
对于每行信息的判断,通常的做法是采用硬编码的规则逻辑进行判断,其灵活性较差且维护成本高,而本发明实施例中则采用基于决策树机器学习模型,不同于深度学习,决策树并不需要大量的训练样本,同时具比较好的泛化能力。
[0067]
具体地,所述根据各行子文本中的实体要素对每行子文本进行类别判断,得到每行子文本的信息类别,包括:
[0068]
预先构建第二决策树模型以及用于训练所述第二决策树模型的实体特征训练样本;
[0069]
采用基尼指数最小作为特征选择准则,通过所述实体特征训练样本对所述第二决策树模型进行学习训练;
[0070]
根据各行子文本中的实体要素,通过训练完成的所述第二决策树模型对每行子文本进行类别判断,得到每行子文本的信息类别。
[0071]
本实施例中,通过预先构建第二决策树模型并通过实体特征训练样本对其进行训练学习,其中实体特征训练样本的定义如表2所示,基于金融专业的相关经验知识,本实施例中提取如表2的实体作为关键特征,同时将每一行是否存在实体作为特征,量化为“有/无”(存在为有,不存在为无),最终形成如下表格形式的实体特征训练样本。
[0072]
表2实体特征训练样本
[0073][0074][0075]
其中,类别1表示订单信息、类别2表示共享信息、类别3表示补充信息、类别4表示其他信息。考虑到计算效率和效果,本实施例中采用cart方法生成决策树,由于cart只能生成二叉树,因此生成的决策树图如图2所示,决策树生成的采用gini(基尼)指数最小作为特征选择的准则,通过所述实体特征训练样本对所述第二决策树模型进行学习训练,其公式如下:
[0076][0077]
特征a条件下集合d的基尼指数为:
[0078][0079]
其中,d是样本集合,lk是d中属于第k类的样本子集,k是类的个数,d1是特征存在时的样本集合,d2是特征不存在时的样本集合,基于训练完成的第二决策树模型,即可对每行子文本进行类别判断,得到每一行子文本的信息类别。
[0080]
获取了每行子文本的信息类别后,则根据预设的结构化规则索引以及每行子文本的信息类别对各行子文本进行要素聚合补齐,使其组合成完整的一个或多个订单。具体的结构化规则索引的逻辑为:以“订单为核心”将“补充信息”按“向上补充”逻辑拼接到“订单信息中”,如“买入:\n a债000001 3000w xx机构出给yy机构\n卖出:\n b债000002 4000w xx机构出给kk机构”,其中“\n”是换行符,在该语料中,“买入”和“卖出”都是“补充信息”,“买入”先会补给距离它最近的“订单信息”,此时该订单信息不再缺失交易方向,所以“卖出”这个交易方向不再往上补,而且下一条“订单信息”也缺失交易方向,因此“卖出”则补给下一条“订单信息”,“共享信息”直接复制补充到每个“订单信息”中,由此形成以“订单”为维度的一个或多个结构化订单信息。
[0081]
s300、根据预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手。
[0082]
本实施例中,通过结构化处理获取到一个或多个结构化订单信息后,该订单信息中包含了核心的订单要素、补充要素以及共享要素,在这些要素序列中,则包含一个或多个“机构名”,后续则通过预先构建并训练完成的第一决策树模型和逻辑索引,对结构化订单信息中的交易机构进行对手识别实现交易对手的识别。
[0083]
例如,基于约定俗成的金融规则,“xx银行发给yy基金”可以将此类结构表达为[机构a方向机构b];在硬编码逻辑中,方案整理出各种类似的表达结构,如[机构a机构b方向机构c]、[方向机构a方向机构b]等等,依据各种表达,判断“机构a、机构b”等等的方向,由于在自然语言中,有无穷的表达形式,因此硬编码需要大量的判断逻辑规则,而本发明实施例中则采用基于“决策树算法”的软编码形式,通过预先训练完成的第一决策树模型来进行机构判断。
[0084]
具体实施时,步骤s100之前,方法还包括:
[0085]
预先构建第一决策树模型以及用于训练所述第一决策树模型的机构特征训练样本,所述机构特征训练样本包括交易机构的位置与方向;
[0086]
采用id3算法的信息增益策略,通过所述机构特征训练样本对所述第一决策树模型进行训练,直到所述第一决策树模型的信息增益达到最大时完成训练。
[0087]
本实施例中,通过预先构建第一决策树模型并通过机构特征训练样本对其进行训练学习,由于判断对手方向主要依据“机构的位置、方向、方向的位置、整个句式”等特征,因此本实施例中创新性的将这些特征表达为如表3所示的机构特征训练样本,作为决策树算法所需的输入特征。
[0088]
表3机构特征训练样本
[0089][0090]
其中,1表示存在,0表示不存在,表3中的机构特征训练样本代表着机构和交易方向在语料中的位置。如果语料有两个机构,一个方向,如“a债000001 3000w xx机构卖给yy机构”则符合第一条,左机构1为“xx机构”交易方向1为“卖给”,机构1为“yy机构”;如果语料为“a债000001 3000w买入方:xx机构,卖出方:yy机构”则符合第五条,此时“买入”为交易方向1,“xx机构”为机构1,“卖出”为交易方向2,“yy机构”为右机构1。因此通过这些表示了机构和方向在语料中所处的位置来对第一决策树模型进行最优化的决策训练。
[0091]
在最优化的决策上,本实施例中采用id3的信息增益策略,当根据一个特征进行切分后,整个决策树的信息增益增加,那么说明根据这个特征进行切分是正确的。当决策树的信息增益不能再增大时,则说明此时的决策树是最优的。具体公式如下所示:
[0092]
g(e,b)=h(e)-h(e|b)
[0093][0094][0095]
其中,h(e)是数据集e的熵,h(ei)是数据集ei的熵,h(e|b)是数据集e对特征b的条件熵。ei是e中特征b取第i个值的样本子集,ck是e中属于第k类的样本子集。n是特征b取值的个数,k是类的个数。基于训练完成的第一决策树模型,即可对结构化订单信息中的交易机构进行判断,得到每条结构化订单信息中交易机构的机构类别。
[0096]
具体地,步骤s300包括:
[0097]
获取所述结构化订单信息中各个交易机构的位置与交易方向;
[0098]
根据各个交易机构的位置与交易方向,通过训练完成的所述第一决策树模型对每个交易机构的机构类别进行判断,所述机构类别包括买方机构、卖方机构和过桥机构;
[0099]
基于当前的视觉机构,根据所述逻辑索引和每个交易机构的机构类别确认所述待识别文本中相对于所述视觉机构的交易对手。
[0100]
本实施例中,针对每个交易机构,先获取其在结构化订单信息中的位置与交易方向,例如可以根据每个机构名所在的位置,获取其位置之前的机构名、交易方向,之后的机构名、交易方向等信息,作为判断当前机构方向的特征,之后基于各个交易机构的位置与交易方向,通过训练完成的第一决策树模型,判断出每个交易机构是买方机构、卖方机构或者过桥机构。
[0101]
针对每一个交易机构,基于确定了“买方机构、卖方机构、过桥机构”的三种类别,则通过已构建的逻辑索引结合交易方向的信息即可获得交易对手的识别,交易对手的识别需要根据视觉机构来去确定,即逻辑索引的构建需要根据视觉方来确定,视觉机构则是看到这条待识别文本的机构,具体的逻辑索引为若当前的视觉机构为买方机构,则所述交易对手为所述待识别文本中的卖方机构;若当前的视觉机构为卖方机构,则所述交易对手为所述待识别文本中的买方机构;若当前的视觉机构为过桥机构,则所述交易对手为所述待识别文本中的买方机构和卖方机构。因此,本实施例通过结合金融逻辑来构建特征信息,再利用软编码形式的决策树算法进行对手的识别判断,一方面降低训练样本的要求,降低了成本;另一方面比现有的硬编码方案有更强的泛化能力,能够解决更多不同类型的问题,并且解决了规则维护成本高的问题。
[0102]
本发明另一实施例提供一种基于索引的可扩展交易对手识别装置,如图3所示,装置包括:
[0103]
特征提取模块11,用于获取待识别文本,对所述待识别文本进行特征提取,得到所述待识别文本中的实体要素;
[0104]
结构化模块12,用于基于预设的结构化规则索引,根据所述实体要素对所述待识别文本进行结构化处理,得到结构化订单信息;
[0105]
对手识别模块13,用于根据预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手。
[0106]
特征提取模块11、结构化模块12和对手识别模块13依次连接,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述基于索引的可扩展交易对手识别的执行过程,各模块的具体实施方式请参考上述对应的方法实施例,此处不再赘述。
[0107]
本发明另一实施例提供一种基于索引的可扩展交易对手识别系统,如图4所示,系统10包括:
[0108]
一个或多个处理器110以及存储器120,图4中以一个处理器110为例进行介绍,处理器110和存储器120可以通过总线或者其他方式连接,图4中以通过总线连接为例。
[0109]
处理器110用于完成系统10的各种控制逻辑,其可以为通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)、单片机、arm(acorn risc machine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。还有,处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合,例如,dsp和微处理器的组合、多个微处理器、一个或多个微处理器结合dsp和/或任何其它这种配置。
[0110]
存储器120作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的基于索引的可扩展交易对手识别方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元,从而执行系统10的各种功能应用以及数据处理,即实现上述方法实施例中的基于索引的可扩展交易对手识别方法。
[0111]
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据系统10使用所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至系统10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0112]
一个或者多个单元存储在存储器120中,当被一个或者多个处理器110执行时,执行上述任意方法实施例中的基于索引的可扩展交易对手识别方法,例如,执行以上描述的图1中的方法步骤s100至步骤s300。
[0113]
本发明实施例提供了一种非易失性计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1中的方法步骤s100至步骤s300。
[0114]
作为示例,非易失性存储介质能够包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦rom(eeprom)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(ram)。通过说明而非限制,ram可以以诸如同步ram(sram)、动态ram、(dram)、同步dram(sdram)、双数据速率sdram(ddrsdram)、增强型sdram(esdram)、synchlink dram(sldram)以及直接rambus(兰巴斯)ram(drram)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器组件或存储器旨在包括这些和/或任何其他适合类
型的存储器中的一个或多个。
[0115]
综上,本发明公开的基于索引的可扩展交易对手识别方法、系统及介质中,方法通过获取待识别文本,对所述待识别文本进行特征提取,得到所述待识别文本中的实体要素;基于预设的结构化规则索引,根据所述实体要素对所述待识别文本进行结构化处理,得到结构化订单信息;根据预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手。通过准确提取待识别文本中的实体要素特征,并基于结构化规则索引进行订单切割实现高效的订单文本结构化处理,进一步采用软编码形式的决策树模型来实现泛化能力强的交易对手识别,有效提高交易对手识别的可扩展性且降低了训练维护成本。
[0116]
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的计算机程序可存储于一非易失性计算机可读取的存储介质中,该计算机程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、软盘、闪存、光存储器等。
[0117]
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献