一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信用证文本的解析方法、信用证对象的审核方法和装置与流程

2022-04-25 01:52:42 来源:中国专利 TAG:


1.本发明涉及知识图谱技术领域,尤其涉及一种信用证文本的解析方法、信用证对象的审核方法和装置。


背景技术:

2.信用证是银行根据进口人的请求,开给出口人的一种保证承担支付货款责任的书面凭证。信用证审单中,通过对比信用证的要求内容与各单据展示要素是否“单证一致”、各单据之间是否“单单一致”,得到“相符/不符”的审单结论。传统的信用证审单中,需要人工理解信用证或信用证单据中的相关内容,并获取信用证相关元素的对应值,完成信用证审单,审单过程需要耗费大量人力成本且效率较低。


技术实现要素:

3.有鉴于此,本发明实施例提供一种信用证文本的解析方法、信用证对象的审核方法和装置,系统能够自动获取信用证中的目标元素对应的槽位及槽值,从而识别出信用证文本中的相关内容,减少信用证审单过程中所需的人力成本且效率较高。
4.第一方面,本发明实施例提供了一种信用证文本的解析方法,包括:
5.获取目标信用证文本,所述目标信用证文本中包括至少一个目标要素;
6.获取所述目标信用证文本对应的目标语义模板,所述目标语义模板包括:语句模板及所述语句模板的上位共享层级,所述语句模板中包括至少一个目标槽位,所述目标槽位与所述目标要素相对应;
7.根据所述语句模板及所述上位共享层级,得到所述目标信用证文本的全链路槽位;
8.将所述目标语义模板与所述目标信用证文本进行匹配,以得到所述全链路槽位对应的目标槽值。
9.可选地,所述上位共享层级中包括:第一算子;
10.所述根据所述语句模板及所述上位共享层级,得到所述目标信用证文本的全链路槽位,包括:
11.根据所述第一算子,确定所述上位共享层级与所述目标槽位的第一组合方式;
12.以所述第一组合方式,组合所述上位共享层级与所述目标槽位,以得到所述目标信用证文本的全链路槽位。
13.可选地,所述上位共享层级中包括:第一共享层级、第二共享层级及第二算子;
14.所述以所述第一组合方式,组合所述上位共享层级与所述目标槽位,以得到所述目标信用证文本的全链路槽位,包括:
15.以所述第一组合方式,组合所述第一共享层级与所述目标槽位,得到第一链路槽位;
16.以所述第一组合方式,组合所述第二共享层级与所述目标槽位,得到第二链路槽
位;
17.根据所述第二算子,确定所述第一链路槽位与所述第二链路槽位的第二组合方式;
18.以所述第二组合方式,组合所述第一链路槽位与所述第二链路槽位,以得到所述目标信用证文本的全链路槽位。
19.可选地,所述第二算子位于所述目标语义模板的上位共享层次部分,所述第二算子包括以下至少之一:和、或及输出方式。
20.可选地,所述第一算子包括以下至少之一:无意图、单一意图、或意图及输出方式。
21.可选地,所述语句模板中包括:第一目标槽位、第二目标槽位及第三算子;
22.所述根据所述语句模板及所述上位共享层级,得到所述目标信用证文本的全链路槽位,包括:
23.组合所述上层共享层级与所述第一目标槽位,得到第三链路槽位;
24.组合所述上层共享层级与所述第二目标槽位,得到第四链路槽位;
25.根据所述第三算子,确定所述第三链路槽位与所述第四链路槽位的第三组合方式;
26.以所述第三组合方式,组合所述第三链路槽位与所述第四链路槽位,以得到所述目标信用证文本的全链路槽位。
27.可选地,所述第三算子位于所述目标语义模板的语句模板部分,所述第三算子包括以下至少之一:和、或及替换方式。
28.第二方面,本发明实施例提供了一种信用证对象的审核方法,包括:
29.获取第一信用证对象的第一信用证文本,采用上述信用证文本的解析方法,得到所述第一信用证文本的第一文本槽位及所述第一文本槽位对应的槽值;
30.获取第二信用证对象的第二信用证文本,采用上述信用证文本的解析方法,得到所述第二信用证文本的第二文本槽位及所述第二文本槽位对应的槽值;
31.根据所述第一文本槽位对应的槽值及所述第二文本槽位对应的槽值,确定所述第一信用证对象与所述第二信用证对象是否一致。
32.可选地,所述第一信用证文本对应于至少一个第一文本槽位;
33.所述根据所述第一文本槽位对应的槽值及所述第二文本槽位对应的槽值,确定所述第一信用证对象与所述第二信用证对象是否一致,包括:
34.针对每个所述第一文本槽位:确定当前第一文本槽位对应的当前第二文本槽位;分别确定所述当前第一文本槽位对应的第一槽值及所述当前第二文本槽位对应的第二槽值;确定所述第一槽值与所述第二槽值是否匹配;若不匹配,则确定所述当前第一文本槽位为差错槽位;
35.确定所述第一文本槽位中是否包含差错槽位;
36.若包含,则确定所述第一信用证对象与所述第二信用证对象不一致;
37.若不包含,则确定所述第一信用证对象与所述第二信用证对象一致。
38.第三方面,本发明实施例提供了一种信用证文本的解析装置,包括:
39.文本获取模块,用于获取目标信用证文本,所述目标信用证文本中包括至少一个目标要素;
40.模板获取模块,用于获取所述目标信用证文本对应的目标语义模板,所述目标语义模板包括:语句模板及所述语句模板的上位共享层级,所述语句模板中包括至少一个目标槽位,所述目标槽位与所述目标要素相对应;
41.槽位确定模块,用于根据所述语句模板及所述上位共享层级,得到所述目标信用证文本的全链路槽位;
42.值确定模块,用于将所述目标语义模板与所述目标信用证文本进行匹配,以得到所述全链路槽位对应的目标槽值。
43.可选地,所述上位共享层级中包括:第一算子;
44.所述槽位确定模块具体用于:
45.根据所述第一算子,确定所述上位共享层级与所述目标槽位的第一组合方式;
46.以所述第一组合方式,组合所述上位共享层级与所述目标槽位,以得到所述目标信用证文本的全链路槽位。
47.第四方面,本发明实施例提供了一种信用证对象的审核装置,包括:
48.第一获取模块,用于获取第一信用证对象的第一信用证文本,采用上述信用证文本的解析方法,得到所述第一信用证文本的第一文本槽位及所述第一文本槽位对应的槽值;
49.第二获取模块,用于获取第二信用证对象的第二信用证文本,采用上述信用证文本的解析方法,得到所述第二信用证文本的第二文本槽位及所述第二文本槽位对应的槽值;
50.审核模块,用于根据所述第一文本槽位对应的槽值及所述第二文本槽位对应的槽值,确定所述第一信用证对象与所述第二信用证对象是否一致。
51.第五方面,本发明实施例提供了一种电子设备,包括:
52.一个或多个处理器;
53.存储装置,用于存储一个或多个程序,
54.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。
55.第六方面,本发明实施例提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
56.第七方面,本发明实施例提供了一种计算机程序产品,包括计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
57.上述发明中的一个实施例具有如下优点或有益效果:根据目标信用证文本对应的目标语义模板中的语句模板及上位共享层级,来得到目标信用证文本的全链路槽位。全链路槽位为需要从目标信用证文本中提取出的槽位。再将目标语义模板与目标信用证文本进行匹配,以得到全链路槽位对应的目标槽值。因此,能够自动识别出信用证文本中的相关内容,减少信用证审单过程中所需的人力成本且效率较高。
58.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
59.附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
60.图1是本发明第一实施例提供的一种信用证文本的解析方法的流程示意图;
61.图2是本发明第二实施例提供的一种信用证文本的解析方法的流程示意图;
62.图3是本发明第三实施例提供的一种信用证文本的解析方法的流程示意图;
63.图4是本发明第四实施例提供的一种信用证对象的审核方法的流程示意图;
64.图5是本发明的实施例提供的一种信用证文本的解析装置的结构示意图;
65.图6是本发明的实施例提供的一种信用证对象的审核装置的结构示意图;
66.图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
67.以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
68.本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
69.为使本发明实施例的方案便于理解,下面对本发明实施例涉及到的术语进行解释:
70.知识表示:属于知识图谱中的子范畴,描述知识的组织形式,是知识图谱应用的基石。
71.意图:语句核心想表达的大类内容,如“给我放一首周杰伦的青花瓷”意图是“听音乐”。
72.槽位:实体类别,定义为相关内容项的类别,如槽位“歌手”、“歌曲名”。
73.槽值:即实体,是槽位在当前语句中的具体取值,如槽值“周杰伦(歌手)”、“青花瓷(歌曲名)”。
74.与自然语言理解应用相对应地,理解信用证条款可以表达为如下4个层面:
75.(1)识别条款所表达的意图,如“禁止某种行为”、“必须展示要素”等;
76.(2)识别条款中该意图下的槽位,一般为要素名称,如“信用证号”、“签署人”等;
77.(3)识别条款中该意图及槽位的联合要求下的具体槽值,一般为字符串或数值等;
78.(4)将上述意图、槽位、槽值按照知识图谱定义的知识表示结构进行组装,以表达完整的条款要求的内容。
79.本发明实施例基于知识图谱定义的知识表示结构进行条款语义的表示,与通用知识表示定义类似,具有多层级继承关系、基础要素结构共享等特点。
80.要素与槽位相对应,要素为进行语义识别或解析的基本单位。要素可以为托运人姓名、托运人所属国家名称、受益人姓名、受益人电话号码等。可以三元组方式《subject,property,object》举例描述基础要素如下:
81.《party,hasproperty,name》用于表征托运人姓名的要素;
82.《party,hasproperty,address》用于表征托运人地址的要素;
83.《party,hasproperty,country》用于表征托运人所述国家名称的要素。
84.以“.”连接要素的上下级关系,“(*)”对该层内容的说明,得到完整要素(槽位)为:
85.表1 信用证部分数据属性要素示例
86.中文说明要素(槽位)槽位类别要求提单上托运人姓名billladingrequiredclause.shiper.namedp要求提单上托运人所属国家名称billladingrequiredclause.shipper.country.namedp要求提单上托运人电话信息billladingrequiredclause.shipper.contactinfo.phonenumberdp
…ꢀꢀ
要求发票上受益人姓名invoicerequiredclause.beneficiary.namedp要求发票上受益人所属国家名称invoicerequiredclause.beneficiary.country.namedp要求发票上受益人电话信息invoicerequiredclause.beneficiary.contactinfo.phonenumberdp
87.表1中dp表示该槽位为数据属性(data property)。此外,信用证条款中还会仅要求单据中显示托运人或受益人,而不明确其具体名称,则对应到的要素(槽位)为op(object property,对象属性)。
88.表2 信用证部分对象属性要素示例
89.中文说明要素(槽位)槽位类别要求提单上托运人billladingrequiredclause.shiperop要求提单上托运人所属国家billladingrequiredclause.shipper.countryop要求发票上受益人姓名invoicerequiredclause.beneficiaryop要求发票上受益人信息invoicerequiredclause.beneficiary.contactinfoop
90.为方便对信用证文本信息的识别,需要将文本中的长句条款拆分为各独立要素。在信用证所处的封闭语言场景中,业务要素表述密集、要素单元大多独立。因此,本发明实施例提出将长句条款拆分为各独立要素,按照各自语义分别解析,再基于组合规则合并成完整语义结构。长句条款可拆分成各自独立的要素单元。
91.例句1.signed commercial invoice in three copies indicate manufacturer's/exportor's name and address,lc no.abc123456 and dt 2020 may 20.
92.例句1可拆分成如下多个独立要素,各要素之间以分号相隔:signed;commercial invoice;in three copies;indicate manufacturer's/exportor's name and address;lc no.abc123456 and dt 2020 may 20。
93.例句2.signed commercial invoice or packing list show lc number and date,goods amount,price term.
94.例句2可拆分成如下多个独立要素,各要素之间以分号相隔:signed;commercial invoice or packing list show;lc number and date;goods amount;price term。
95.例句3.in case of by courier shipment,bene’s cert not required.
96.例句3可拆分成如下多个独立要素,各要素之间以分号相隔:in case of by courier shipment;bene’s cert not required.。
97.由上示例可知,不同要素单元完整表达所要求的语义信息,且彼此独立。要素内部可能包含和(and)、或(or)、如果(in case of)等逻辑关系,其作用根据要素值的不同有所区别(单据名称包含逻辑,则逻辑关系覆盖整句;其他要素包含逻辑,则逻辑仅限该要素)。
98.基于上述分析,本发明实施例提供了一种信用证文本的解析方法。图1是本发明第一实施例提供的一种信用证文本的解析方法的流程示意图,如图1所示,该方法包括:
99.步骤101:获取目标信用证文本,所述目标信用证文本中包括至少一个目标要素。
100.目标信用证文本为与信用证相关的文本。目标信用证文本可以为从信用证或信用证单据中提取出的文本。
101.要素与槽位相对应,要素为进行语义识别或解析的基本单位。要素可以为托运人姓名、托运人所属国家名称、受益人姓名、受益人电话号码等。
102.目标信用证文本可以为短文本。本发明实施例中涉及的目标信用证文本为长文本,其可以拆分成多个独立的短文本进行解析。短文本中包括一个要素或者多个相关要素,短文本能够通过单个语义模板进行解析,从而达到解析整个长文本的目的。
103.步骤102:获取所述目标信用证文本对应的目标语义模板,所述目标语义模板包括:语句模板及所述语句模板的上位共享层级。
104.语句模板中包括至少一个目标槽位,目标槽位与目标要素相对应。利用语句模板,与目标信用证文本进行匹配,能够确定槽位对应的槽值。如下给出一个语义模板的具体示例:
105.{address:《address》}》》consignee
106.上式中“》》”左侧为语句模板部分,右侧为槽位的上位共享层级部分。语义模板部分可包括一个或多个目标槽位。上位共享层级部分可包括一个或多个上位共享层次。上位共享层级一般为none或op属性。可以用“意图”简化描述上位共享层级,本发明实施例的描述中也会通过意图来替代上位共享层级。
107.步骤103:根据所述语句模板及所述上位共享层级,得到所述目标信用证文本的全链路槽位。
108.全链路槽位为目标信用证文本中需要解析出槽值的槽位,全链路槽位为目标信用证文本中的目标要素对应的槽位。语义模板中可包括语义算子,通过语义算子,确定语句模板与上位共享层级的组合方式,来生成目标信用证文本的全链路槽位。
109.步骤104:将所述目标语义模板与所述目标信用证文本进行匹配,以得到所述全链路槽位对应的目标槽值。
110.在本发明实施例中,根据目标信用证文本对应的目标语义模板中的语句模板及上位共享层级,来得到目标信用证文本的全链路槽位。全链路槽位为需要从目标信用证文本中提取出的槽位。再将目标语义模板与目标信用证文本进行匹配,以得到全链路槽位对应的目标槽值。因此,能够自动识别出信用证文本中的相关内容,减少信用证审单过程中所需的人力成本且效率较高。
111.图2是本发明第二实施例提供的一种信用证文本的解析方法的流程示意图,如图2所示,该方法包括:
112.步骤201:获取目标信用证文本,所述目标信用证文本中包括至少一个目标要素。
113.步骤202:获取所述目标信用证文本对应的目标语义模板,所述目标语义模板包括:语句模板及所述语句模板的上位共享层级,所述上位共享层级中包括:第一算子。
114.第一算子用于确定上位共享层级与目标槽位的第一组合方式。第一算子包括以下至少之一:无意图、单一意图、或意图及输出方式。
115.步骤203:根据所述第一算子,确定所述上位共享层级与所述目标槽位的第一组合方式。
116.第一组合方式包括以下至少之一:无意图方式、单一意图方式、或意图方式及输出方式。
117.步骤204:以所述第一组合方式,组合所述上位共享层级与所述目标槽位,以得到所述目标信用证文本的全链路槽位。
118.步骤205:将所述目标语义模板与所述目标信用证文本进行匹配,以得到所述全链路槽位对应的目标槽值。
119.在本发明实施例中,根据上位共享层级中的第一算子,确定所述上位共享层级与所述目标槽位的第一组合方式,再根据第一组合方式,组合所述上位共享层级与所述目标槽位,能够灵活方便的得到目标信用证文本的全链路槽位。
120.在本发明的一个实施例中,所述上位共享层级中包括:第一共享层级、第二共享层级及第二算子;所述以所述第一组合方式,组合所述上位共享层级与所述目标槽位,以得到所述目标信用证文本的全链路槽位,包括:以所述第一组合方式,组合所述第一共享层级与所述目标槽位,得到第一链路槽位;以所述第一组合方式,组合所述第二共享层级与所述目标槽位,得到第二链路槽位;根据所述第二算子,确定所述第一链路槽位与所述第二链路槽位的第二组合方式;以所述第二组合方式,组合所述第一链路槽位与所述第二链路槽位,以得到所述目标信用证文本的全链路槽位。
121.第二算子位于目标语义模板的上位共享层次部分,第二算子可用于连接多个上位共享层次。第二算子包括以下至少之一:和、或及输出方式。第二组合方式包括以下至少之一:和方式、或方式及输出方式。根据第一算子及第二算子能够灵活方便的得到目标信用证文本的全链路槽位。
122.在本发明的一个实施例中,所述语句模板中包括:第一目标槽位、第二目标槽位及第三算子;所述根据所述语句模板及所述上位共享层级,得到所述目标信用证文本的全链路槽位,包括:组合所述上层共享层级与所述第一目标槽位,得到第三链路槽位;组合所述上层共享层级与所述第二目标槽位,得到第四链路槽位;根据所述第三算子,确定所述第三链路槽位与所述第四链路槽位的第三组合方式;以所述第三组合方式,组合所述第三链路槽位与所述第四链路槽位,以得到所述目标信用证文本的全链路槽位。
123.第三算子位于目标语义模板的语句模板部分。第三算子可用于连接多个目标槽位。第三算子包括以下至少之一:和、或及替换方式。第三组合方式包括以下至少之一:和方式、或方式及替换方式。根据第三算子能够灵活方便的得到目标信用证文本的全链路槽位。
124.为方便本发明实施例方案的理解。以下以具体示例讲解语义模板、语义算子等概念。其中,语义算子包括:第一算子、第二算子及第三算子。基于知识表示结构的继承、共享的特点,及长句条款中要素单元语义独立的特点,本发明实施例的方案提出了一种基于语义模板的要素解析规则,并定义了一套语义算子及其表示要求。
125.语义模板1:in?{totalcopy:《num》}[copies|copy]》》none
[0126]
语义模板2:[consigneed|consignee]and[notified|notify]{name:《company》}[,|#]{address:《address》}》》and_consignee_notifyparty
[0127]
在上述语义模板1及语义模板2中,“》》”左侧为语句模板,右侧为槽位的上位共享
层级,以“意图”简化描述,一般为none或op属性。“*?”表示该词可存在或不存在;“{}”中定义最细粒度槽位,“:”前为槽位名,其后为具体槽值,“《*》”为一类槽值的通配符,一般为预处理结果或者词典可替换表达的场景,如《company》则对应一个公司名称库;“[*|*]”中描述同义词或其他同类可替换表示而不影响语义的场景,并以竖线分割,其中“#”表示该位置所属词可为空,与“?”作用一致。因此针对下述待解析长句,可通过5个语义模板表达其完整语义含义。
[0128]
待解析长句:signed commercial invoice in three copies indicate manufacturer's/exportor's name and address,lc no.abc123456 and dt 2020 may 20.
[0129]
语义模板1:all?duly?{show_signer:signed}》》none
[0130]
语义模板2:{doctitle:《document》}》》none
[0131]
语义模板3:in?{totalcopy:《num》}[copies|copy]》》none
[0132]
语义模板4:actual?[manufacturer's|exporter's][or|/][manufacturer's|exporter's]{show_name:name}[and|,]{show_address:address}》》or_exporter_manufacturer
[0133]
语义模板5:[documentary credit|letter of credit|lc|dc][number|no.|no]{creditnumber:《code》}[and|,][dated|dt|dd]{lcissuedate:《date》}》》none
[0134]
假设上述待解析长句所属类别invoicerequiredclause,将右侧“意图”与左侧各槽位以“.”连接后得到整句话的所有语义如下,冒号左侧为槽位,冒号右侧为利用语义模板匹配待解析长句得到的槽值:
[0135]
invoicerequiredclause.signer:”[0136]
invoicerequiredclause.doctitle:commercial invoice
[0137]
invoicerequiredclause.totalcopy:3
[0138]
(invoicerequiredclause.exporter.name:”&invoicerequiredclause.exporter.address:”)|(invoicerequiredclause.manufacturer.name:”&invoicerequiredclause.manufacturer.address:”)
[0139]
invoicerequiredclause.creditnumber:123456
[0140]
invoicerequiredclause.lcissuedate:2020 may 20
[0141]
基于信用证语言所要求的要素及其关系,定义如下语义算子(第一算子、第二算子及第三算子):
[0142]
and/or在意图或意图首位;
[0143]“》》or”表达左侧槽位or关系;
[0144]“》》and/or_a”表达意图a与左侧槽位拼接后为and/or关系;
[0145]“》》and/or_a_b”表达意图a与b为and/or的关系,再与左侧槽位拼接;
[0146]
or槽位首位,表达多个or定义下的槽位具有or的关系,如“issued by{or_name:《company》}or{or_name:《company》}》》issuer”;
[0147]
none意图,条款内容由左侧槽位直接表达;
[0148]
show在意图/槽位首位,将原非boolean属性转换为boolean意图
[0149]“》》show_a”表达单据展示槽位a,输出{a:”};
[0150]“》》show_a_b”表达多个槽位a、b值为boolean,且为and关系;
[0151]“》》showor_a_b”表达多个槽位a、b值为boolean,且为or关系;
[0152]
replace_a@b,表达该槽值为指代场景,需要被“@”后的“b”的具体值替换,如{replace_issuer.name@seller.name}输出结果为{issuer.name:abc ltd}其中“abc ltd”为seller.name。
[0153]
a_b表达多个槽位共享一个槽值,如槽位{issuer.name_seller.name:abc ltd}输出结果为{issuer.name:abc ltd},{seller.name:abc ltd}。
[0154]
本发明实施例提出一种基于模板组合的复杂条款解析及结构还原方案。图3是本发明第三实施例提供的一种信用证文本的解析方法的流程示意图,如图3所示,输入目标语义模板,目标语义模板包括:语句模板及所述语句模板的上位共享层级,所述语句模板中包括至少一个目标槽位,该上位共享层级可用于意图来表示。根据意图的形式及语义模板中包含的算账确定后续拼接操作。遍历槽位,根据槽位形式及算子,与意图做拼接,得到全链路槽位。根据or算子的位置,确定是否将or意图扩展到权条款。利用目标语义模板与目标信用证文本进行匹配,输出目标信用证文本的语义信息。按照上述定义的语义模板及语义算子,可按照意图、槽位、槽值的情况还原信用证条款的业务含义,并直接映射到知识图谱的知识表示。在上述不同场景下,意图及槽位的组合方式有所差别。
[0155]
表3 基于意图槽位及语义算子的结构还原逻辑
[0156][0157]
表3展示了基于意图槽位及语义算子的结构还原逻辑,利用表3所示的逻辑关系,可解析出信用证文本中的语义信息。其中,a或b可用于代表意图或槽位。表3中的意图也可以理解为上位共享层级。
[0158]
表3中,none意图对应于第一算子的无意图。单一意图对应于第一算子的单一意图。or_意图中的“or”对应于第三算子的或方式。or_a中的“or”对应于第一算子的或意图。or_a_b中的“or”对应于第二算子的或方式。and_a_b中的“and”对应于第二算子的和方式。show_a中的“show”对应于第一算子的输出方式。show_a中的“show”也可对应于第三算子的
输出方式。对于showor_a_b,如果a、b为意图,则showor对应于第一算子的输出方式、或意图;如果a、b为槽位,则showor对应于第三算子的输出方式、或方式。replace_a@b中的“replace”对应于第三算子的替换方式。
[0159]
为了便于理解,以信用证要求条款invoicerequiredclause为例,举例各场景语义还原结果(还可参考上述完整长句的语义解析及结构还原结果):
[0160]
文本a:signed or stamped by beneficiary
[0161]
模板a:signed or stamped by{partyindicator:beneficiary}》》or_signer_stamper
[0162]
模板a中“》》or_signer_stamper”的“or”,对应于第二算子,或方式。通过模板a提取文本a中的全链路槽位及槽值:
[0163]
invoicerequiredclause.signer.partyindicator:beneficiary|invoicerequiredclause.stamper.partyindicator:beneficiary
[0164]
文本b:signed by beneficiary or abc ltd
[0165]
模板b:issued by the?{partyindicator:beneficiary}[or|/]{name:《company》}》》or_issuer
[0166]
模板b中的[or|/]对应于第三算子的或方式。通过模板b提取文本b中的全链路槽位及槽值:
[0167]
invoicerequiredclause.issuer.partyindicator:beneficiary|invoicerequiredclause.issuer.name:abc ltd
[0168]
文本c:lc number and date
[0169]
模板c:[documentary credit|letter of credit|lc|dc][number|no.|no][and|,][issuing|issued|#][date|dt|dd]》》show_creditnumber_lcissuedate
[0170]
模板c中“show_creditnumber_lcissuedate”的“show”对应于第二算子的输出方式。通过模板c提取文本c中的全链路槽位及槽值:
[0171]
creditnumber:”&lcissuedate:”[0172]
文本d:issued by the seller
[0173]
模板d:
[0174]
issued by the?{replace_name@seller.name:seller}》》issuer
[0175]
模板d中的“issuer”对应于第一算子的单一意图。通过模板d提取文本d中的全链路槽位及槽值:
[0176]
issuer.name:abc ltd,其中“abc ltd”为seller.name
[0177]
文本e:invoice or packing list must indicate goods origin.
[0178]
模板e1:{doctitle:《document》}or{origincountry:《origincountry》}》》or
[0179]
模板e2:[goods origin|origin country|origin of goods|country of origin]》》show_origincountry
[0180]
模板e1中的第一个“or”对应于第三算子的或方式。模板e2中的“show”对应于第一算子的输出方式。通过模板e1和模板e2提取文本e中的全链路槽位及槽值:
[0181]
(invoicerequiredclause.doctitle:invoice&invoicerequiredclause.origincountry:”)|(packinglistrequiredclause.doctitle:packing list&packinglistrequi
redclause.origincountry:”)
[0182]
其中,文本a至文本d为短文本,短文本为通过单个语义模板能够解析的文本。文本e为长文本,长文本需要拆分成多个独立的短文本进行解析。
[0183]
信用证语言具有要素密度大、带逻辑场景多、槽位类型差别大的问题,难以使用基于深度学习模型方法(样本需求量极大,且槽位定义困难)。因此,本发明实施例提出基于语义模板组合的信用证文本的解析方法,其中多要素的关系及逻辑句式,均在短模板中体现,大大降低了解析复杂度。本发明实施例还提出了一套适用于信用证语言的语义算法,可以覆盖各类属性、属性boolean化、属性逻辑组合等场景,进一步避免了传统槽位定义中无法处理属性组合场景的情况。本发明实施例的方案巧妙设计的语义算子与槽位的组合,可以覆盖更丰富的语义表示,避免了传统解析中槽位只能分场景冗余定义的问题。
[0184]
此外,本发明实施例提出一种“短语义模板解析”的方式将长句、复杂的信用证要求条款解析难题拆分成解析各短句的子问题,降低了解析难度。此外,通过巧妙设计的一套语义算子,能够覆盖复杂的属性值识别、非布尔属性布尔(boolean)化(“show_a”形式或“show_a_b”形式等)、共享属性上位词、带逻辑和或(and/or)的复杂属性的识别等,避免了传统槽位识别中针对每种类型属性分别定义槽位的冗余性和复杂性。最终通过语义算子对应的操作流程,将短句解析结果进行组合,得到完整长句复杂条款的语义表示。因此,本发明实施例的方案有如下技术效果:
[0185]
(1)长句解析按照其独立语义含义解耦为短句解析的方案,并设计了一种解析表达式,能够覆盖同义词替换、可选词、槽位提取、意图(槽位共享上位词)。
[0186]
(2)设计了的一套语义算子,可以覆盖各类属性、属性boolean化、属性逻辑组合等特殊场景的槽识别问题。此外,语义算子与其操作流程绑定,可按照组合逻辑将短句结果组合还原为长句的完整语义。
[0187]
(3)通过对槽位及算子的组合方式,以实现信用证文本的各种复杂语义的自动化识别。
[0188]
图4是本发明第四实施例提供的一种信用证对象的审核方法的流程示意图。如图4所示,该方法包括:
[0189]
步骤401:获取第一信用证对象的第一信用证文本,采用上述信用证文本的解析方法,得到所述第一信用证文本的第一文本槽位及所述第一文本槽位对应的槽值。
[0190]
第一信用证对象为与信用证相关的对象。第一信用证对象可以为信用证、信用证单据、信用证条款等。可通过第一文本槽位及第一文本槽位对应的槽值,解析第一信用证文本中的语义。
[0191]
步骤402:获取第二信用证对象的第二信用证文本,采用上述信用证文本的解析方法,得到所述第二信用证文本的第二文本槽位及所述第二文本槽位对应的槽值。
[0192]
第二信用证对象为与信用证相关的对象。第二信用证对象可以为信用证、信用证单据、信用证条款等。可通过第二文本槽位及第二文本槽位对应的槽值,解析第二信用证文本中的语义。
[0193]
步骤403:根据所述第一文本槽位对应的槽值及所述第二文本槽位对应的槽值,确定所述第一信用证对象与所述第二信用证对象是否一致。
[0194]
具体地,可通过下述方式确定所述第一信用证对象与所述第二信用证对象是否一
致:针对每个所述第一文本槽位:确定当前第一文本槽位对应的当前第二文本槽位;分别确定所述当前第一文本槽位对应的第一槽值及所述当前第二文本槽位对应的第二槽值;确定所述第一槽值与所述第二槽值是否匹配;若不匹配,则确定所述当前第一文本槽位为差错槽位;确定所述第一文本槽位中是否包含差错槽位;若包含,则确定所述第一信用证对象与所述第二信用证对象不一致;若不包含,则确定所述第一信用证对象与所述第二信用证对象一致。
[0195]
通过上述方式将第一信用证对象中的各第一槽位对应的第一槽值,与第二槽位对应的第二槽值依次比较,如果存在第一槽值与第二槽值不匹配的情况,则说明第一信用证对象与第二信用证对象不一致。如果所有的第一槽值均存在对应的第二槽值,则说明第一信用证对象与第二信用证对象一致。
[0196]
将本发明实施例提供的信用证文本的解析方法,应用于信用证审单中,系统能够自动获取信用证对象中元素对应的槽位及槽值,从而识别出信用证对象中包含的语义内容,减少信用证审单过程中所需的人力成本且效率较高。
[0197]
图5是本发明的实施例提供的一种信用证文本的解析装置的结构示意图。如图5所示,该装置包括:
[0198]
文本获取模块501,用于获取目标信用证文本,所述目标信用证文本中包括至少一个目标要素;
[0199]
模板获取模块502,用于获取所述目标信用证文本对应的目标语义模板,所述目标语义模板包括:语句模板及所述语句模板的上位共享层级,所述语句模板中包括至少一个目标槽位,所述目标槽位与所述目标要素相对应;
[0200]
槽位确定模块503,用于根据所述语句模板及所述上位共享层级,得到所述目标信用证文本的全链路槽位;
[0201]
值确定模块504,用于将所述目标语义模板与所述目标信用证文本进行匹配,以得到所述全链路槽位对应的目标槽值。
[0202]
可选地,所述上位共享层级中包括:第一算子;
[0203]
所述槽位确定模块503具体用于:
[0204]
根据所述第一算子,确定所述上位共享层级与所述目标槽位的第一组合方式;
[0205]
以所述第一组合方式,组合所述上位共享层级与所述目标槽位,以得到所述目标信用证文本的全链路槽位。
[0206]
可选地,所述第二算子包括以下至少之一:和、或及输出方式。
[0207]
可选地,所述第一算子包括以下至少之一:无意图、单一意图、或意图及输出方式。
[0208]
可选地,所述语句模板中包括:第一目标槽位、第二目标槽位及第三算子;
[0209]
所述槽位确定模块503具体用于:
[0210]
组合所述上层共享层级与所述第一目标槽位,得到第三链路槽位;
[0211]
组合所述上层共享层级与所述第二目标槽位,得到第四链路槽位;
[0212]
根据所述第三算子,确定所述第三链路槽位与所述第四链路槽位的第三组合方式;
[0213]
以所述第三组合方式,组合所述第三链路槽位与所述第四链路槽位,以得到所述目标信用证文本的全链路槽位。
[0214]
可选地,所述第三算子包括以下至少之一:和、或及替换方式。
[0215]
图6是本发明的实施例提供的一种信用证对象的审核装置的结构示意图。如图6所示,该装置包括:
[0216]
第一获取模块601,用于获取第一信用证对象的第一信用证文本,采用上述信用证文本的解析方法,得到所述第一信用证文本的第一文本槽位及所述第一文本槽位对应的槽值;
[0217]
第二获取模块602,用于获取第二信用证对象的第二信用证文本,采用上述信用证文本的解析方法,得到所述第二信用证文本的第二文本槽位及所述第二文本槽位对应的槽值;
[0218]
审核模块603,用于根据所述第一文本槽位对应的槽值及所述第二文本槽位对应的槽值,确定所述第一信用证对象与所述第二信用证对象是否一致。
[0219]
可选地,所述第一信用证文本对应于至少一个第一文本槽位;
[0220]
审核模块603具体用于:
[0221]
针对每个所述第一文本槽位:确定当前第一文本槽位对应的当前第二文本槽位;分别确定所述当前第一文本槽位对应的第一槽值及所述当前第二文本槽位对应的第二槽值;确定所述第一槽值与所述第二槽值是否匹配;若不匹配,则确定所述当前第一文本槽位为差错槽位;
[0222]
确定所述第一文本槽位中是否包含差错槽位;
[0223]
若包含,则确定所述第一信用证对象与所述第二信用证对象不一致;
[0224]
若不包含,则确定所述第一信用证对象与所述第二信用证对象一致。
[0225]
本发明实施例提供了一种电子设备,包括:
[0226]
一个或多个处理器;
[0227]
存储装置,用于存储一个或多个程序,
[0228]
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述任一实施例的方法。
[0229]
本发明实施例提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本发明实施例中的信用证文本的解析方法或信用证对象的审核方法。
[0230]
下面参考图7,其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0231]
如图7所示,计算机系统700包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中,还存储有系统700操作所需的各种程序和数据。cpu 701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
[0232]
以下部件连接至i/o接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711,诸如
磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
[0233]
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(cpu)701执行时,执行本发明的系统中限定的上述功能。
[0234]
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0235]
附图中的流程图和框图,图示了根据本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0236]
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:文本获取模块、模板获取模块、槽位确定模块及值确定模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,文本获取模块还可以被描述为“获取目标信用证文本,所述目标信用证文本中包括至少一个目标要素的模块”。
[0237]
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算
机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
[0238]
获取目标信用证文本,所述目标信用证文本中包括至少一个目标要素;
[0239]
获取所述目标信用证文本对应的目标语义模板,所述目标语义模板包括:语句模板及所述语句模板的上位共享层级,所述语句模板中包括至少一个目标槽位,所述目标槽位与所述目标要素相对应;
[0240]
根据所述语句模板及所述上位共享层级,得到所述目标信用证文本的全链路槽位;
[0241]
将所述目标语义模板与所述目标信用证文本进行匹配,以得到所述全链路槽位对应的目标槽值。
[0242]
根据本发明实施例的技术方案,根据目标信用证文本对应的目标语义模板中的语句模板及上位共享层级,来得到目标信用证文本的全链路槽位。全链路槽位为需要从目标信用证文本中提取出的槽位。再将目标语义模板与目标信用证文本进行匹配,以得到全链路槽位对应的目标槽值。因此,能够自动识别出信用证文本中的相关内容,减少信用证审单过程中所需的人力成本且效率较高。
[0243]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献