一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于AI的跨境供应链表单生成方法及相关装置与流程

2022-04-30 02:51:08 来源:中国专利 TAG:

基于ai的跨境供应链表单生成方法及相关装置
技术领域
1.本发明涉及跨境供应链业务领域,尤其涉及一种基于ai的跨境供应链表单生成方法及相关装置。


背景技术:

2.在跨境进出口贸易日常业务过程中,供应链企业及跨境物流企业人员需要处理大量的各类表单,而由于不同国家间贸易习惯、使用语言、信息化管理等方面存在较大的差异,相关表单的信息非常复杂,所涉及的文件格式也各不相同,如图片、传真、pdf、邮件、标签、手写纸张、电子表格等。
3.由于表单信息复杂及格式多样,企业在进行表单信息的识别、读取、分析、较验、传输等处理时,主要依赖人工操作,工作效率低下,容易出错,且所需的人工成本较高。尽管有的企业已经实施了电子化操作,但大量的表单信息在进入信息系统时,仍需通过人工进行加工及输入,并不能真正有效地提升工作效率。
4.目前人工智能表单领域已有的方法、装置尚不能支持用户对自定义的多格式类型文件进行智能识别、智能比对及智能较验。


技术实现要素:

5.鉴于上述问题,本发明的目的在于提供一种基于人工智能(英文:ai)的跨境供应链表单生成方法及相关装置。
6.第一方面,本发明提供了一种基于ai的跨境供应链表单生成方法,所述方法包括:原始表单图像识别,用于获取待处理的原始表单图像;锚点定义,用于设定待处理输出表单项在所述原始表单图像中的像素点标识、坐标位置及应用作用域;锚点框选及信息提取,利用锚点标识算法,在原始表单图像中查找并提取所有符合锚点参数的唯一特征标识的信息,并将信息自动填入所述待处理输出表单项中。
7.结合本公开提供的任一实施方式,所述原始表单识别是通过应用ocr(optical character recognition,光学字符识别)技术将待处理的原始表单转换成统一格式的原始表单图像,所述表单图像包含相关的字符、文本像素点及其对应的物理位置等相关信息。
8.结合本公开提供的任一实施方式,所述锚点是待处理输出表单中项的字段标识,通过锚点定义,设定待处理输出表单项在所述原始表单图像中的像素点标识、坐标位置及应用作用域,建立待处理输出表单项与所述原始表图像的对应关系,以便于进行锚点框选处理。
9.结合本公开提供的任一实施方式,所述锚点框选是通过框选固定锚点标识算法,在所述原始表单图像中查找所有符合锚点参数唯一特征标识的图像信息,利用定义锚点在所述原始表单图像的应用作用域 ({page,xmin,xmax},{ymin,ymax}),以确定每一个锚点在所述原始表单图像中的坐标位置及覆盖范围,通过锚点标识算法自动计算锚点左边的内容及区域范围。
10.结合本公开提供的任一实施方式, 通过锚点的像素点坐标位置查找锚点所对应的应用作用域内所有符合锚点参数的唯一特征标识的像素点信息;判断查找出的内容是否有null值并智能的作出一下步的处理方法;通过设计的坐标值范围判断框选区内容的有效性并智能的自动计算在一定偏移度内的内容;通过设置分页标识,利用锚点坐标计算跨页内容的位置(坐标);再次利用正则表达式来匹配所需要的内容或过滤掉不需要的内容,并将获取到的信息自动填入所述待处理输出表单项中。
11.第二方面,本发明提供一供种基于ai的跨境供应链表单处理相关装置,所述相关装置包括:模板训练单元; 获取传输单元; 数据分析单元; 智能处理单元; 数据接口单元。
12.在其中一个实施例中,模板训练单元用于设定及存储所述待处理输出表单样式,进行定义锚点及表单模板训练,包括组织构架管理模块、模板配置管理模块、自定义模板训练模块。
13.在其中一个实施例中,获取传输单元用于获取待处理原始表单信息,并将原始表单传输至云平台,通过ocr识别将原始表单转换成所述待处理原始表单图像,包括本地计算终端、图像获取设备、网络传输设施、云平台模块。
14.在其中一个实施例中,数据分析单元用于统计、查询、校验所述待处理表单项相关信息,包括数据统计模块、数据查询模块、数据较验模块。
15.在其中一个实施例中,智能处理单元用于表单图像信息识别、纠错、提取、存储及转换输出,包括表单识别模块、ai提取模块。
16.在其中一个实施例中,数据接口单元用于管理及对接各种信息系统接口,自动获取或传输表单数据及信息。
17.与现有技术相比,本发明的优点在于:精准度更高。通过表单设置和锚点标识坐标算法,将表单图像中跟业务相关的每一个字符/元素进行全面检索,并过滤掉与目标业务处理没有帮助的字符/元素,从而实现表格内容的精准定位和有效范围的有效内容集中,大大降低了无效信息对算法的干扰,从而提高了识别的精准度。
18.成本更低。通过ai操作来减少人工处理,大提高了企业人员的工作效率,有利于降低企业人工成本支出。
19.可扩展性高。本发明通过提供api接口对接系统,可与其他的系统进行集成。当需要处理更加复杂的表单时,可通过对核心算法进行调整或接入新算法的方式增强算力。
20.应用范围广。本发明应用的范围非常广泛,任何跟表单处理的业务场景都可以应用上本发明的技术和算法。
21.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
22.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
23.] 图1为本发明示出的一种基于ai的跨境供应链表单生成方法的流程图。
24.图2为本发明示出的一种基于ai的跨境供应链表单模板设置结果图。
25.图3为本发明示出的其中一例表单模板训练流程图。
26.图4为本发明示出的数据统计功能界面图。
27.图5为本发明示出的数据查询、校验功能界面图。
28.图6为本发明示出的一种基于ai的跨境供应链表单生成装置的示意图。
29.图7为本发明示出的一种基于ai的跨境供应链表单生成装置系统功能界面图。
30.图8为本发明示出的一种基于ai的跨境供应链表单系统功能结构图。
具体实施方式
31.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本技术,并不用于限定本技术。
32.在如图1所示的一种实施例中,本发明提供了一种基于ai的跨境供应链表单生成方法,所述方法包括步骤101~步骤106。
33.在步骤101中,设置待处理表单模板。
34.所述待处理表单模板包括基于用户输入设定的各类待处理表样式、表单类型、相关表单项的锚点及锚点对应各项参数。
35.所述锚点是待处理表单模板中相关表单项的关键字段(key)标识。通过锚点定义,设定所述待处理表单项的关键字段(key)与所述待处理表单图像中文本特征信息的键值(value)关联对应关系,即k-v对设置。
36.通过智能表单模板训练单元设定相关表单项的锚点,配置锚点参数及其应用作用域,将定义锚点及锚点参数后的待处理表单存储为表单模板。图2示出本公开实施例其中一个待处理表单模板的设置结果。
37.在步骤102中,获取原始表单图像。
38.所述原始表单图像包括跨境贸易环节中的所需处理的各类原始表单,如采购单、供应商装箱单、供应商发票、运输单等。
39.优选地,获取原始表单图像可通过扫描仪或者手持拍摄设备拍摄所需处理的原始表单图像,并将所述原始表单图像存储在本地计算终端中。
40.所述原始表单可以为图片、数据表格、pdf等文件格式。
41.在步骤103中,将所述原始表单图像通过网络传输至云平台。
42.在步骤104中,识别原始表单图像,得到待处理表单图像。
43.应用ocr(optical character recognition,光学字符识别)技术对上传至云平台的原始表单图像进行识别,得到所述待处理表单图像。
44.所述待处理表单图像包含待处理的文本特征信息、视觉特征信息及位置特征信息。
45.在步骤105中,选择待处理表单模板进行模板训练。
46.通过智能表单模板训练单元,根据ocr识别后的待处理表单图像选择所需处理表单模板,进行表单模板训练。
47.所述表单模板训练包括锚点选择、作用域定义、框选锚点及锚点提取。图3示出了
本公开实施例其中一例表单模板训练流程图。
48.如图3所示,表单模板训练的实现方法包括:锚点选择、框选锚点、作用域定义、锚点提取。
49.3a锚点选择,在所述表单模板中选择已定义的锚点(ea)及锚点所对应的标识算法程序。
50.3b框选锚点,通过设定的锚点正则表达式结合对应的锚点标识算法寻找所有符合锚点(ea)唯一特征标识的文本。
51.3c作用域定义,以锚点所在待处理表单图像上的坐标为原点,定义表格的应用作用域{page,xmin,xmax},{ymin,ymax}。
52.所述表格的应用作用域{page,xmin,xmax},{ymin,ymax}中,page表示待处理表单图像的页面;xmin表示在所述待处理表单图像页面上锚点坐标的x轴最小取值;xmax表示在所述待处理表单图像页面上锚点坐标的x轴最大取值;ymin在所述待处理表单图像页面上锚点坐标的y轴最小取值; ymax在所述待处理表单图像页面上锚点坐标的y轴最大取值。
53.通过定义表格的应用作用域,以确定表单图像中的每一个锚点及其覆盖范围,通过锚点算法自动计算锚点左边的内容及区域范围。
54.3d锚点提取,通过框选固定锚点标识算法,在所述待处理表单图像上查找选定的锚点,并将光标精准定位在所述待处理表单图像上的锚点所在像素点的位置;判断查找出的锚点对应信息内容是否有null值;通过设计的坐标值范围判断框选区内容的有效性并智能的自动计算在一定偏移度内的内容;设置分页标识,利用锚点坐标计算跨页内容的位置(坐标);再次利用正则表达式来匹配所需要的内容或过滤掉不需要的内容,并将获取到的所需锚点对应信息自动填入所述待处理表单中并存储在对应表单模板中,完成所述待处理表单模板的信息提取。
55.在步骤106中,进行数据分析及应用。所述数据分析包括数据统计、数据查阅、数据校验及数据输出。
56.如图4所示,通过数据统计功能对各表单模板训练结果及待处理表单图像进行统计,可统计对应表单图像的份数、页数,表单模板训练的次数以及表单训练的错误率。
57.如图5所示,通过数据查阅功能对各表单模板获取后到的进行查看、校验及格式化传输。
58.第二方面,本发明提供一供种基于ai的跨境供应链表单处理相关装置,如图6所示所述相关装置包括:模板训练单元、获取传输单元、数据分析单元、智能处理单元、数据接口单元。
59.201模板训练单元,用于配置及存储各类目标输出表单模板,进行表单智能训练,包括组织构架管理模块、模板配置管理模块、自定义模板训练模块。
60.202获取传输单元,用于获取待处理原始表单信息,并将原始表单传输至云平台,通过ocr识别将原始表单转换成待处理的表单图像,包括本地计算终端、图像获取设备、网络传输设施、云平台模块。
61.203数据分析单元,用于统计、查询、较验表单相关信息,包括数据统计模块、数据查询模块、数据较验模块。
62.204智能处理单元,用于表单图像信息识别、纠错、提取、存储及转换输出,包括表
单识别模块、ai提取模块。
63.205数据接口单元,用于管理及对接各种信息系统接口,自动获取或传输表单数据及信息。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献