一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种对账单数据处理方法、装置及存储介质与流程

2022-02-19 11:59:10 来源:中国专利 TAG:


1.本发明涉及人工智能技术领域,具体涉及一种对账单数据处理方法、装置及存储介质。


背景技术:

2.以互联网、大数据和人工智能等为代表的现代信息技术的发展日新月异,各种高大上的智能技术,已经运用到了社会生活的方方面面,智能化时代已经到来。然而,在财务记账方面,由于技术力量有限,目前许多小微企业的会计人员仍然停留在靠手工进行收付单据处理,人工进行凭证编制,业务处理的效率十分低下。亟需智能化的业务辅助处理能力,使财会人员摆脱繁重单调的劳作,提高领域的工作效率。
3.在资金流水和银行对账单中,流水摘要信息是对整体交易过程的简单描述,虽然信息简略,但是内涵丰富,对于后续账务处理十分有帮助。在本发明中,基于对账单流水摘要信息,fasttest模型可以用于文本的快速分类,但是由于对账单的文本较短,在对其训练时难以得到准确的分类模型,从而导致后续的处理准确性较差。这是现有技术的缺陷。


技术实现要素:

4.本发明针对上述现有技术中一个或多个技术缺陷,提出了如下技术方案。
5.一种对账单数据处理方法,该方法包括:训练步骤,使用从数据库中获取的历史对账单数据对业务分类模型进行训练得到训练后的业务分类模型;分类步骤,使用所述训练后的业务分类模型对待处理的对账单数据进行分类,得到所述对账单数据的初始类别;判断步骤,将所述初始类别基于对账单数据中的对方账号进行调整后作为对账单数据的类别,或/和通过显示界面将所述初始类别提供给用户,用户确定该初始类别是否需要修改,如果是,由用户对所述初始类别进行修改得到对账单数据的类别;生成步骤,基于所述对账单数据的类别对所述对账单数据进行处理得到记账凭证后保存在数据库中。
6.更进一步地,所述业务分类模型是改进的fasttext模型,所述改进的fasttext模型的输入参数为词w
t
‑1、w
t
‑2、
……
、w
t

n 1
的索引,基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
),将所述词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
)输入隐蔽层处理后输入softmax层输出账单数据的初始类别。
7.更进一步地,所述基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
)的操作为:基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引获取词w
t
‑1、w
t
‑2、
……
w
t

n 1
,计算任意两个词之间的关系值:rel(w
t

i
,w t

j
)=a*dis b*sim c*diff,其中,a、b、c为相应的权重值,dis=
;sim表示词w t

i
和w t

j
的语义相关度;diff表示词w t

i
和w t

j
中的字个数差的绝对值,i不等于j,t1为预设的阈值;将所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
向量化得到的向量乘以对应的sumrel得到词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
);其中,sumrel=。
8.更进一步地,在确定该初始类别需要修改时,所述用户对初始类别进行修改,如果用户没有对所述初始类别进行修改,而是直接修改了凭证模版,则根据修改后的凭证模版的对方科目在数据库查找该凭证模板对应的类别,基于所述该对应的类别对所述初始类别进行修改。
9.更进一步地,所述生成步骤的操作为:匹配所述对账单数据的类别后再基于户名和科目明细的匹配规则对所述对账单数据进行匹配得到记账凭证后保存在数据库中。
10.本发明还提出了一种对账单数据处理装置,该装置包括:训练单元,使用从数据库中获取的历史对账单数据对业务分类模型进行训练得到训练后的业务分类模型;分类单元,使用所述训练后的业务分类模型对待处理的对账单数据进行分类,得到所述对账单数据的初始类别;判断单元,将所述初始类别基于对账单数据中的对方账号进行调整后作为对账单数据的类别,或/和通过显示界面将所述初始类别提供给用户,用户确定该初始类别是否需要修改,如果是,由用户对所述初始类别进行修改得到对账单数据的类别;生成单元,基于所述对账单数据的类别对所述对账单数据进行处理得到记账凭证后保存在数据库中。
11.更进一步地,所述业务分类模型是改进的fasttext模型,所述改进的fasttext模型的输入参数为词w
t
‑1、w
t
‑2、
……
、w
t

n 1
的索引,基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
),将所述词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
)输入隐蔽层处理后输入softmax层输出账单数据的初始类别。
12.更进一步地,所述基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
)的操作为:基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引获取词w
t
‑1、w
t
‑2、
……
w
t

n 1
,计算任意两个词之间的关系值:rel(w
t

i
,w t

j
)=a*dis b*sim c*diff,其中,a、b、c为相应的权重值,dis=;sim表示词w t

i
和w t

j
的语义相关度;diff表示词w t

i
和w t

j
中的字个数差的绝对值,i不等于j,t1为预设的阈值;将所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
向量化得到的向量乘以对应的sumrel得到词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
);其中,sumrel=。
13.更进一步地,在确定该初始类别需要修改时,所述用户对初始类别进行修改,如果
用户没有对所述初始类别进行修改,而是直接修改了凭证模版,则根据修改后的凭证模版的对方科目在数据库查找该凭证模板对应的类别,基于所述该对应的类别对所述初始类别进行修改。
14.更进一步地,所述生成单元的操作为:匹配所述对账单数据的类别后再基于户名和科目明细的匹配规则对所述对账单数据进行匹配得到记账凭证后保存在数据库中。
15.本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序代码,当所述计算机程序代码被计算机执行时执行上述之任一的方法。
16.本发明的技术效果在于:本发明的一种对账单数据处理方法、装置及存储介质,该方法包括:训练步骤s101,使用从数据库中获取的历史对账单数据对业务分类模型进行训练得到训练后的业务分类模型;分类步骤s102,使用所述训练后的业务分类模型对待处理的对账单数据进行分类,得到所述对账单数据的初始类别;判断步骤s103,将所述初始类别基于对账单数据中的对方账号进行调整后作为对账单数据的类别,或/和通过显示界面将所述初始类别提供给用户,用户确定该初始类别是否需要修改,如果是,由用户对所述初始类别进行修改得到对账单数据的类别;生成步骤s104,基于所述对账单数据的类别对所述对账单数据进行处理得到记账凭证后保存在数据库中。本发明中,使用训练好的业务分类模型对对账单数据进行业务类型判断,初步的业务分类精度有限,然后基于对方账户信息,进一步对初步确认的部分业务类型进行精细化调整,在推荐不准确的情况下用户进行手动微调得到准确的对账单数据的类别,从而生成准确的记账凭证;本发明中,在生成词向量时,使用改进的fasttext模型,在生成词向量时考虑了词之间的关系,提高了模型的准确度,并提出了具体的如何将词之间的关系应用到生成词向量中,经过实际测试表明,上述操作可以使得生成的词向量准确的表述对账单摘要中的信息,提高了模型分类的准确性;本发明中,在用户没有直接微调初始类别,而是直接修改了系统推荐的凭证模板,则根据修改后的凭证模版的对方科目在数据库查找该凭证模板对应的类别,基于所述该对应的类别对所述初始类别进行修改后作为对账单数据的类别,从而提高了系统的兼容性,确保了后续模板的准确性,即会将用户手动调整过的凭证记录融入系统,当下一次用户输入类似凭证时,系统将根据以往用户手动调整过的记录以及凭证信息,最终给出最优的结果,保证了生成凭证的准确性。
附图说明
17.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本技术的其它特征、目的和优点将会变得更明显。
18.图1是根据本发明的实施例的一种对账单数据处理方法的流程图。
19.图2是根据本发明的实施例的一种对账单数据处理装置的结构图。
具体实施方式
20.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
21.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相
互组合。下面将参考附图并结合实施例来详细说明本技术。
22.图1示出了本发明的一种对账单数据处理方法,该方法包括:训练步骤s101,使用从数据库中获取的历史对账单数据对业务分类模型进行训练得到训练后的业务分类模型;分类步骤s102,使用所述训练后的业务分类模型对待处理的对账单数据进行分类,得到所述对账单数据的初始类别;判断步骤s103,将所述初始类别基于对账单数据中的对方账号进行调整后作为对账单数据的类别,或/和通过显示界面将所述初始类别提供给用户,用户确定该初始类别是否需要修改,如果是,由用户对所述初始类别进行修改得到对账单数据的类别;生成步骤s104,基于所述对账单数据的类别对所述对账单数据进行处理得到记账凭证后保存在数据库中。
23.本发明中,对账单数据的类别包括:收款、提供服务、利息收入、收到投资、付款、接受服务、利息支出、银行手续费、发放工资、支付社保费、支付住房公积金、支付福利费用、缴纳增值税、缴纳所得税、支付个税、支付附加税等。使用训练好的业务分类模型对对账单数据进行业务类型判断,初步的业务分类精度有限,然后基于对方账户信息,进一步对初步确认的部分业务类型进行精细化调整,在推荐不准确的情况下用户进行手动微调得到准确的对账单数据的类别,从而生成准确的记账凭证,这是本发明的一个重要发明点在一个实施例中,所述业务分类模型是改进的fasttext模型,所述改进的fasttext模型的输入参数为词w
t
‑1、w
t
‑2、
……
、w
t

n 1
的索引,基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
),将所述词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
)输入隐蔽层处理后输入softmax层输出账单数据的初始类别。
24.本发明对现有的fasttext模型进行了改进,输入参数为词w
t
‑1、w
t
‑2、
……
、w
t

n 1
的索引,基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
),替代了现有技术中的直接使用生成的词向量进行输入,t

1、t

2、t

n 1表示词的标记,即共n

1个词,编号依次为t

1、t

2、t

n 1。本发明中,在生成词向量时,考虑所述不同词之间的关系,这是因为对账单中的文本都比较短,单纯使用其中的词生成的向量包含的信息过于简单,从而分类不准确,因此,本发明在生成词向量时考虑了词之间的关系,提高了模型的准确度,这是本发明的另一个发明点。
25.在一个实施例中,所述基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
)的操作为:基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引获取词w
t
‑1、w
t
‑2、
……
w
t

n 1
,计算任意两个词之间的关系值:rel(w
t

i
,w t

j
)=a*dis b*sim c*diff,其中,a、b、c为相应的权重值,dis=;sim表示词w t

i
和w t

j
的语义相关度;diff表示词w t

i
和w t

j
中的字个数差的绝对值,i不等于j,t1为预设的阈值;将所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
向量化得到的向量乘以对应的sumrel得到词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
);
其中,sumrel=。
26.本发明中,提出了具体的如何将词之间的关系应用到生成词向量中,经过实际测试表明,上述操作可以使得生成的词向量准确的表述对账单摘要中的信息,提高了模型分类的准确性,这是本发明的一个重要发明点。
27.在一个实施例中,在确定该初始类别需要修改时,所述用户对初始类别进行修改,如果用户没有对所述初始类别进行修改,而是直接修改了凭证模版,则根据修改后的凭证模版的对方科目在数据库查找该凭证模板对应的类别,基于所述该对应的类别对所述初始类别进行修改。
28.本发明中,一个特殊的情况是,用户没有直接微调初始类别,而是直接修改了系统推荐的凭证模板,则根据修改后的凭证模版的对方科目在数据库查找该凭证模板对应的类别,基于所述该对应的类别对所述初始类别进行修改后作为对账单数据的类别,从而提高了系统的兼容性,确保了后续模板的准确性,即会将用户手动调整过的凭证记录融入系统,当下一次用户输入类似凭证时,系统将根据以往用户手动调整过的记录以及凭证信息,最终给出最优的结果,保证了生成凭证的准确性,这是本发明的另一个重要发明点。
29.在一个实施例中,所述生成步骤s104的操作为:匹配所述对账单数据的类别后再基于户名和科目明细的匹配规则对所述对账单数据进行匹配得到记账凭证后保存在数据库中。
30.比如,对账单数据的类别为收入,在目前系统已有档案中搜索,搜索客户 员工档案,客户名称匹配上90%则判定为匹配。如果匹配上客户档案,则为“收款”,同时对方户名的参照为客户档案。如果匹配上员工档案,则为“个人收款”,同时对方户名的参照为个人档案;在应收账款,其他应收款,其他应付款下面查找是否有匹配上的明细科目,如果匹配上,则对方科目自动赋值。如果上级科目是应收账款,则收支类型为收款,如果是其他应收款或者其他应付款,收支类型为个人收款;在导入的时候,如果符合90%名称匹配的规则(匹配辅助核算或者明细科目),就把对方户名改成对应的名称显示。如果以上都没有匹配上,且对方户名为2个或者3个字符,默认为“个人收款”。类别为支出时,进行类似的处理。即,本发明中,匹配所述对账单数据的类别后再基于户名和科目明细的匹配规则对所述对账单数据进行匹配得到记账凭证,从而提高了凭证生成的准确性,这是本发明的另一个重要发明点。
31.图2示出了本发明的一种对账单数据处理装置,该装置包括:训练单元201,使用从数据库中获取的历史对账单数据对业务分类模型进行训练得到训练后的业务分类模型;分类单元202,使用所述训练后的业务分类模型对待处理的对账单数据进行分类,得到所述对账单数据的初始类别;判断单元203,将所述初始类别基于对账单数据中的对方账号进行调整后作为对账单数据的类别,或/和通过显示界面将所述初始类别提供给用户,用户确定该初始类别是否需要修改,如果是,由用户对所述初始类别进行修改得到对账单数据的类别;生成单元204,基于所述对账单数据的类别对所述对账单数据进行处理得到记账凭证后保存在数据库中。
32.本发明中,对账单数据的类别包括:收款、提供服务、利息收入、收到投资、付款、接
受服务、利息支出、银行手续费、发放工资、支付社保费、支付住房公积金、支付福利费用、缴纳增值税、缴纳所得税、支付个税、支付附加税等。使用训练好的业务分类模型对对账单数据进行业务类型判断,初步的业务分类精度有限,然后基于对方账户信息,进一步对初步确认的部分业务类型进行精细化调整,在推荐不准确的情况下用户进行手动微调得到准确的对账单数据的类别,从而生成准确的记账凭证,这是本发明的一个重要发明点在一个实施例中,所述业务分类模型是改进的fasttext模型,所述改进的fasttext模型的输入参数为词w
t
‑1、w
t
‑2、
……
、w
t

n 1
的索引,基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
),将所述词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
)输入隐蔽层处理后输入softmax层输出账单数据的初始类别。
33.本发明对现有的fasttext模型进行了改进,输入参数为词w
t
‑1、w
t
‑2、
……
、w
t

n 1
的索引,基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
),替代了现有技术中的直接使用生成的词向量进行输入,t

1、t

2、t

n 1表示词的标记,即共n

1个词,编号依次为t

1、t

2、t

n 1。本发明中,在生成词向量时,考虑所述不同词之间的关系,这是因为对账单中的文本都比较短,单纯使用其中的词生成的向量包含的信息过于简单,从而分类不准确,因此,本发明在生成词向量时考虑了词之间的关系,提高了模型的准确度,这是本发明的另一个发明点。
34.在一个实施例中,所述基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引和所述不同词之间的关系生成输入层词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
)的操作为:基于所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
的索引获取词w
t
‑1、w
t
‑2、
……
w
t

n 1
,计算任意两个词之间的关系值:rel(w
t

i
,w t

j
)=a*dis b*sim c*diff,其中,a、b、c为相应的权重值,dis=;sim表示词w t

i
和w t

j
的语义相关度;diff表示词w t

i
和w t

j
中的字个数差的绝对值,i不等于j,t1为预设的阈值;将所述词w
t
‑1、w
t
‑2、
……
w
t

n 1
向量化得到的向量乘以对应的sumrel得到词序列向量c(w
t
‑1)、c(w
t
‑2)、
……
、c(w
t

n 1
);其中,sumrel=。
35.本发明中,提出了具体的如何将词之间的关系应用到生成词向量中,经过实际测试表明,上述操作可以使得生成的词向量准确的表述对账单摘要中的信息,提高了模型分类的准确性,这是本发明的一个重要发明点。
36.在一个实施例中,在确定该初始类别需要修改时,所述用户对初始类别进行修改,如果用户没有对所述初始类别进行修改,而是直接修改了凭证模版,则根据修改后的凭证模版的对方科目在数据库查找该凭证模板对应的类别,基于所述该对应的类别对所述初始类别进行修改。
37.本发明中,一个特殊的情况是,用户没有直接微调初始类别,而是直接修改了系统推荐的凭证模板,则根据修改后的凭证模版的对方科目在数据库查找该凭证模板对应的类别,基于所述该对应的类别对所述初始类别进行修改后作为对账单数据的类别,从而提高了系统的兼容性,确保了后续模板的准确性,即会将用户手动调整过的凭证记录融入系统,当下一次用户输入类似凭证时,系统将根据以往用户手动调整过的记录以及凭证信息,最
终给出最优的结果,保证了生成凭证的准确性,这是本发明的另一个重要发明点。
38.在一个实施例中,所述生成单元204的操作为:匹配所述对账单数据的类别后再基于户名和科目明细的匹配规则对所述对账单数据进行匹配得到记账凭证后保存在数据库中。
39.比如,对账单数据的类别为收入,在目前系统已有档案中搜索,搜索客户 员工档案,客户名称匹配上90%则判定为匹配。如果匹配上客户档案,则为“收款”,同时对方户名的参照为客户档案。如果匹配上员工档案,则为“个人收款”,同时对方户名的参照为个人档案;在应收账款,其他应收款,其他应付款下面查找是否有匹配上的明细科目,如果匹配上,则对方科目自动赋值。如果上级科目是应收账款,则收支类型为收款,如果是其他应收款或者其他应付款,收支类型为个人收款;在导入的时候,如果符合90%名称匹配的规则(匹配辅助核算或者明细科目),就把对方户名改成对应的名称显示。如果以上都没有匹配上,且对方户名为2个或者3个字符,默认为“个人收款”。类别为支出时,进行类似的处理。即,本发明中,匹配所述对账单数据的类别后再基于户名和科目明细的匹配规则对所述对账单数据进行匹配得到记账凭证,从而提高了凭证生成的准确性,这是本发明的另一个重要发明点。
40.本发明一个实施例中提出了一种对账单数据处理设备,所述设备包括处理器和存储器,所述处理器与所述处理器通过总线连接,所述存储器上存储有计算机程序,所述处理器执行所述存储器上的计算机程序时实现上述的方法,该设备可以是台式计算机、服务器、笔记本、智能终端等等。
41.本发明一个实施例中提出了一种计算机存储介质,所述计算机存储介质上存储有计算机程序,当所述计算机存储介质上的计算机程序被处理器执行时实现上述的方法,该计算机存储介质可以是硬盘、dvd、cd、闪存等等存储器。
42.本发明的为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本技术时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
43.通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质 中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例或者实施例的某些部分所述的装置。
44.最后所应说明的是:以上实施例仅以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献