一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

金融需求项生成方法及装置与流程

2021-10-24 14:41:00 来源:中国专利 TAG:金融 数据处理 装置 生成 需求


1.本技术涉及数据处理技术领域,特别涉及金融技术领域,具体涉及金融需求项生成方法及装置。


背景技术:

2.在互联网时代,银行等金融机构为了快速适应业务需求,项目的开发过程逐渐从传统方式转化为敏捷开发,以适应产品快速上线的市场要求。每个项目由多个需求项组成,每个需求项由一个或多个产品应用共同开发实现。在项目敏捷迭代过程中,测试流程中通常会产生大量不影响产品基本功能的易用性问题,这些问题在极短的迭代时间内不要求强制优化。在产品推广后,为了便于项目管理,使原始需求完成开发环节的闭环,通常会再次人为撰写成下一轮迭代项目的需求项,使产品进一步完成优化,不断更新。这种方法削弱了前期已发现的测试问题的价值,也严重消耗迭代项目中输出需求项的人力成本。
3.在金融需求项输出方面,目前需求大致可以分为业务改造类需求和技术改造类需求,目前通常的方法是:对于金融业务改造类需求,需求方通过线上线下形式收集客户在使用产品中反馈的问题,并结合前期的测试问题进行归纳总结,人工撰写需求项。对于技术改造类需求,需求方通过征求开发人员和测试人员的意见,结合金融投产实际情况人工撰写技术改造需求。然而,无论是哪一种类型,由于每个步骤对人力成本要求都极高,因此均存在金融需求项生成效率过低等问题,因此无法在保证金融需求项个性化的基础上,完全适应产品快速优化上线的敏捷过程。


技术实现要素:

4.针对现有技术中的问题,本技术提供一种金融需求项生成方法及装置,能够有效提高生成金融需求项的个性化、准确性及可靠性,并能够专门适用于金融业,并能够有效提高金融需求项生成过程的自动化程度及效率,进而提高根据金融需求项上线及优化金融软件产品的效率及可靠性。
5.为解决上述技术问题,本技术提供以下技术方案:
6.第一方面,本技术提供一种金融需求项生成方法,包括:
7.基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,以得到由各个所述关键词组成的目标问题数据集,其中,所述问题数据集包含有各个开发项目各自对应的多个迭代过程中的测试问题;
8.对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集;
9.将所述关键问题词集输入预设的金融需求项文字模板,以生成对应的金融需求项。
10.进一步地,在所述基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词之前,还包括:
11.获取各个开发项目各自对应的多个迭代过程中的测试问题,并生成对应的问题数据集;
12.对所述问题数据集进行预处理;
13.基于预设的条件随机场crf算法将预处理的问题数据集进行分词处理,以得到已分词的问题数据集。
14.进一步地,所述对所述问题数据集进行预处理,包括:
15.对所述问题数据集进行数据清洗;
16.将数据清洗后的问题数据集进行格式化处理,以使该问题数据集中包含有各个测试问题的唯一标识和测试问题内容之间的对应关系,其中,所述测试问题内容以各个属性进行划分,各个属性包括:项目名称、业务种类、业务场景、问题描述和涉及应用。
17.进一步地,所述基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,包括:
18.调取预设的金融词汇集合;
19.在已分词的问题数据集中提取所述金融词汇集合中的用于生成金融需求项的金融词汇;
20.应用预设的fudannlp工具包标注各个所述金融词汇的词性,并提取其中词性为名词和动词的金融词汇作为关键词,以形成由各个所述关键词组成的目标问题数据集。
21.进一步地,在所述对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集之前,还包括:
22.基于预设的专业词汇划分规则,将所述目标问题数据集中的各个测试问题各自对应的关键词划分为专业类名词、非专业类名词、专业类动词和非专业类动词;
23.按照权重值由大到小的顺序,为属于专业类名词、非专业类名词、专业类动词和非专业类动词的关键词分别进行权重赋值。
24.进一步地,所述对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集,还包括:
25.基于预设的lp聚类算法,对关键词权重赋值后的所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集。
26.进一步地,还包括:
27.输出所述金融需求项。
28.第二方面,本技术提供一种金融需求项生成装置,包括:
29.数据提取模块,用于基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,以得到由各个所述关键词组成的目标问题数据集,其中,所述问题数据集包含有各个开发项目各自对应的多个迭代过程中的测试问题;数据聚类模块,用于对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集;模板生成模块,用于将所述关键问题词集输入预设的金融需求项文字模板,以生成对应的金融需求项。
30.第三方面,本技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的金融需求项生成方法。
31.第四方面,本技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的金融需求项生成方法。
32.由上述技术方案可知,本技术提供的一种金融需求项生成方法及装置,方法包括:基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,以得到由各个所述关键词组成的目标问题数据集,其中,所述问题数据集包含有各个开发项目各自对应的多个迭代过程中的测试问题;对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集;将所述关键问题词集输入预设的金融需求项文字模板,以生成对应的金融需求项,通过基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,能够在有效降低已分词的问题数据集的数据量的基础上,使得目标问题数据集能够专门适用于金融业,进而能够有效提高后续对目标问题数据集进行聚类处理的可靠性、准确性及适用性;通过对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集,能够有效提高查找到目标问题数据集中的相似测试问题的准确性、自动化程度及智能化程度;通过将所述关键问题词集输入预设的金融需求项文字模板,能够有效提高生成金融需求项的个性化、准确性及可靠性,并能够有效提高金融需求项生成过程的自动化程度及效率,进而提高根据金融需求项上线及优化金融软件产品的效率及可靠性,有效提高金融软件产品开发人员的用户体验。
附图说明
33.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
34.图1是本技术实施例中的金融需求项生成装置与客户端设备之间的关系示意图。
35.图2是本技术实施例中的金融需求项生成方法的第一种流程示意图。
36.图3是本技术实施例中的金融需求项生成方法的第二种流程示意图。
37.图4是本技术实施例中的金融需求项生成方法的第三种流程示意图。
38.图5是本技术实施例中的金融需求项生成方法的第四种流程示意图。
39.图6是本技术实施例中的金融需求项生成方法的第五种流程示意图。
40.图7是本技术实施例中的金融需求项生成方法的第六种流程示意图。
41.图8是本技术实施例中的金融需求项生成方法的第七种流程示意图。
42.图9是本技术实施例中的金融需求项生成装置的结构示意图。
43.图10是本技术应用实例提供的金融需求项生成系统的结构示意图。
44.图11是本技术应用实例提供的数据预处理装置的结构示意图。
45.图12是本技术应用实例提供的聚类分析装置的结构示意图。
46.图13是本技术应用实例提供的需求项生成装置的结构示意图。
47.图14是本技术实施例中的电子设备的结构示意图。
具体实施方式
48.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例
中的附图,对本技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
49.需要说明的是,本技术公开的金融需求项生成方法和装置可用于金融技术领域,也可用于除金融技术领域之外的任意领域,本技术公开的金融需求项生成方法和装置的应用领域不做限定。
50.针对现有的金融需求项生成方式存在无法在保证金融需求项个性化的基础上满足金融需求项生成效率要求等问题,即在需求项输出的过程中,没有能够不需人力自动产生需求项的方法,如何找到一种能够从已知问题中自动归纳生成需求项的解决方案,是本领域亟待解决的技术难题;本技术实施例提供一种金融需求项生成方法,基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,以得到由各个所述关键词组成的目标问题数据集,其中,所述问题数据集包含有各个开发项目各自对应的多个迭代过程中的测试问题;对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集;将所述关键问题词集输入预设的金融需求项文字模板,以生成对应的金融需求项,通过基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,能够在有效降低已分词的问题数据集的数据量的基础上,使得目标问题数据集能够专门适用于金融业,进而能够有效提高后续对目标问题数据集进行聚类处理的可靠性、准确性及适用性;通过对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集,能够有效提高查找到目标问题数据集中的相似测试问题的准确性、自动化程度及智能化程度;通过将所述关键问题词集输入预设的金融需求项文字模板,能够有效提高生成金融需求项的个性化、准确性及可靠性,并能够有效提高金融需求项生成过程的自动化程度及效率,进而提高根据金融需求项上线及优化金融软件产品的效率及可靠性,有效提高金融软件产品开发人员的用户体验。
51.在本技术的一个或多个实施例中,条件随机场crf(conditional random fields)算法是给定一组输入序列条件下另一组输出序列的条件概率分布模型,在自然语言处理中得到了广泛应用。
52.在本技术的一个或多个实施例中,fudannlp工具包是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。包括中文分词、词性标注、命名实体识别、依存句法分析、关键词抽取、时间短语识别、文本分类、新闻聚类、层次分类、在线学习等功能。
53.在本技术的一个或多个实施例中,lp(layer

partition)聚类算法基于划分与层次聚类的思想,每次计算类簇距离依赖上一次计算结果找到当前最优解,避免比较所有类簇间的相似度,提升整体聚类速度。
54.基于上述内容,本技术还提供一种用于实现本技术一个或多个实施例中提供的金融需求项生成方法的金融需求项生成装置,该金融需求项生成装置可以为一服务器,参见图1,该金融需求项生成装置可以自行或通过第三方服务器等与各个客户端设备之间依次通信连接,金融需求项生成装置可以接收客户端设备发送的金融需求项生成请求,基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,以得到由各个所述关键词组成的目标问题数据集,其中,所述问题数据集包含有各个开发项目各自
对应的多个迭代过程中的测试问题;对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集;将所述关键问题词集输入预设的金融需求项文字模板,以生成对应的金融需求项,通过基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,金融需求项生成装置还可以将各个金融需求项发送至预设的显示设备进行显示,也可以将包含有各个金融需求项具体内容的告知消息发送至开发人员等的客户端设备等等。
55.在另一种实际应用情形中,前述的金融需求项生成装置进行金融需求项生成的部分可以在如上述内容的服务器中执行,也可以所有的操作都在所述用户端设备中完成。具体可以根据所述用户端设备的处理能力,以及用户使用场景的限制等进行选择。本技术对此不作限定。若所有的操作都在所述用户端设备中完成,所述用户端设备还可以包括处理器,用于金融需求项生成的具体处理。
56.可以理解的是,所述移动终端可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、个人数字助理(pda)、车载设备、智能穿戴设备等任何能够装载应用的移动设备。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
57.上述的移动终端可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
58.上述服务器与所述移动终端之间可以使用任何合适的网络协议进行通信,包括在本技术提交日尚未开发出的网络协议。所述网络协议例如可以包括tcp/ip协议、udp/ip协议、http协议、https协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的rpc协议(remote procedure call protocol,远程过程调用协议)、rest协议(representational state transfer,表述性状态转移协议)等。
59.具体通过下述各个实施例及应用实例分别进行详细说明。
60.为了解决现有的金融需求项生成方式存在无法在保证金融需求项个性化的基础上满足金融需求项生成效率要求等问题,本技术提供一种金融需求项生成方法的实施例,参见图2,基于金融需求项生成装置执行的所述金融需求项生成方法具体包含有如下内容:
61.步骤100:基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,以得到由各个所述关键词组成的目标问题数据集,其中,所述问题数据集包含有各个开发项目各自对应的多个迭代过程中的测试问题。
62.在步骤100中,金融词汇集合可以为预先存储在金融需求项生成装置本地或金融需求项生成装置可访问的数据库中,金融词汇集合中用于存储预先设置的各个银行业专业词汇等金融词汇,具体可以由用户预先输入至金融需求项生成装置本地或金融需求项生成装置可访问的数据库中进行存储。在本技术的一个或多个实施例中,所述问题数据集包含有各个开发项目各自对应的多个迭代过程中的测试问题是指:所述问题数据集用于存储各个开发项目各自对应的多个迭代过程中的测试问题的唯一标识和测试问题内容之间的对应关系。
63.在问题数据集被分词处理之前,问题数据集中存储的各个测试问题的唯一标识对
应的测试问题内容是完整的测试问题内容;在问题数据集被分词处理之后,问题数据集中存储的各个测试问题的唯一标识对应的测试问题内容是由各个被划分好(例如各词汇之间以标点隔开)的各个词汇组成的内容。
64.在问题数据集中提取关键词之后,问题数据集中存储的各个测试问题的唯一标识对应的测试问题内容是由各个金融词汇(即关键词)组成的内容,且此时将该问题数据集确认为需要进行步骤200的聚类处理的目标问题数据集。也就是说,该目标问题数据集依然用于存储各个开发项目各自对应的多个迭代过程中的测试问题的唯一标识和测试问题内容之间的对应关系,但此时的测试问题内容不再是完整的测试问题内容或是分词后的各个词汇,而是原完整的测试问题内容中涉及的各个金融词汇。
65.步骤200:对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集。
66.在步骤200中,对所述目标问题数据集中的各个测试问题进行聚类是指,对所述目标问题数据集中的每一个由各个金融词汇组成的测试问题进行聚类,以提高查找到目标问题数据集中的相似测试问题的准确性。
67.在本技术的一个或多个实施例中,所述关键问题词集也用于存储各个开发项目各自对应的多个迭代过程中的测试问题的唯一标识和测试问题内容之间的对应关系,但其中的测试问题内容是由各个金融词汇(即关键词)组成的内容,且其中的测试问题的唯一标识的数量明显少于目标问题数据集中的测试问题的唯一标识的数量,因为经过步骤200中,相似的测试问题被聚类,使得对应的测试问题的唯一标识的总数相应变少。
68.步骤300:将所述关键问题词集输入预设的金融需求项文字模板,以生成对应的金融需求项。
69.在步骤300中,可以设置金融需求项文字模板,并支持需求方进行人工修改,通过拼装关键问题词集输出对应需求项描述,完成完整的需求项输出。
70.从上述描述可知,本技术实施例提供的金融需求项生成方法,通过基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,能够在有效降低已分词的问题数据集的数据量的基础上,使得目标问题数据集能够专门适用于金融业,进而能够有效提高后续对目标问题数据集进行聚类处理的可靠性、准确性及适用性;通过对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集,能够有效提高查找到目标问题数据集中的相似测试问题的准确性、自动化程度及智能化程度;通过将所述关键问题词集输入预设的金融需求项文字模板,能够有效提高生成金融需求项的个性化、准确性及可靠性,并能够有效提高金融需求项生成过程的自动化程度及效率,进而提高根据金融需求项上线及优化金融软件产品的效率及可靠性,有效提高金融软件产品开发人员的用户体验。
71.为了使得目标问题数据集能够专门适用于金融业,在本技术提供的金融需求项生成方法的一个实施例,参见图3,所述金融需求项生成方法的步骤100之前还具体包含有如下内容:
72.步骤010:获取各个开发项目各自对应的多个迭代过程中的测试问题,并生成对应的问题数据集。
73.在步骤010中,导入多个项目的多个迭代过程中的测试问题,然后筛选出迭代过程
中状态为未完成修改的易用性问题,并组成清洗后的待处理数据源,即初始的问题数据集。
74.步骤020:对所述问题数据集进行预处理。
75.步骤030:基于预设的条件随机场crf算法将预处理的问题数据集进行分词处理,以得到已分词的问题数据集。
76.具体来说,利用crf算法进行基础汉语分词,设立取值集合{b,e,m,s}用于计算字与字之间的标注概率,设定向量f(x,y)和权值向量w,观测序列x,设定递推函数计算,输出y集合作为最优路径输出,其中结合银行业词汇识别出专业词汇,筛选出可用于生成银行业需求项的关键词。
77.从上述描述可知,本技术实施例提供的金融需求项生成方法,通过基于预设的条件随机场crf算法将预处理的问题数据集进行分词处理,能够为后续在已分词的问题数据集中提取用于生成金融需求项的关键词提供准确且有效的数据基础,进而能够在有效降低已分词的问题数据集的数据量的基础上,使得目标问题数据集能够专门适用于金融业,进而能够有效提高后续对目标问题数据集进行聚类处理的可靠性、准确性及适用性。
78.为了提高数据预处理的有效性及效率,在本技术提供的金融需求项生成方法的一个实施例,参见图4,所述金融需求项生成方法的步骤020具体包含有如下内容:
79.步骤021:对所述问题数据集进行数据清洗。
80.步骤022:将数据清洗后的问题数据集进行格式化处理,以使该问题数据集中包含有各个测试问题的唯一标识和测试问题内容之间的对应关系,其中,所述测试问题内容以各个属性进行划分,各个属性包括:项目名称、业务种类、业务场景、问题描述和涉及应用。
81.具体来说,将清洗后的数据按照项目名称、业务种类、业务场景、问题描述以及涉及应用等属性进行构建,再将属性构造后的数据进行规则化输出,变换成可以建模识别的建模数据源。
82.从上述描述可知,本技术实施例提供的金融需求项生成方法,通过将数据清洗后的问题数据集进行格式化处理,以使该问题数据集中包含有各个测试问题的唯一标识和测试问题内容之间的对应关系,能够有效提高数据预处理的有效性及效率,进而能够有效提高将预处理的问题数据集进行分词处理的效率及可靠性。
83.为了提高目标问题数据集中关键词的有效性及应用可靠性,在本技术提供的金融需求项生成方法的一个实施例,参见图5,所述金融需求项生成方法的步骤100具体包含有如下内容:
84.步骤110:调取预设的金融词汇集合。
85.步骤120:在已分词的问题数据集中提取所述金融词汇集合中的用于生成金融需求项的金融词汇。
86.步骤130:应用预设的fudannlp工具包标注各个所述金融词汇的词性,并提取其中词性为名词和动词的金融词汇作为关键词,以形成由各个所述关键词组成的目标问题数据集。
87.具体来说,先利用crf算法进行基础汉语分词,这种算法基于序列标注模型,能很好地处理在描述测试问题时产生的汉语歧义等问题,结合银行业词汇识别出专业词汇,筛
选出可用于生成银行业需求项的关键词,并利用fudannlp工具包标注词性。
88.从上述描述可知,本技术实施例提供的金融需求项生成方法,通过应用预设的fudannlp工具包标注各个所述金融词汇的词性,并提取其中词性为名词和动词的金融词汇作为关键词,能够有效降低目标问题数据集的数据量的基础上,提高目标问题数据集中关键词的有效性及应用可靠性,进而能够进一步提高生成金融需求项的个性化、准确性及可靠性,并能够专门适用于金融业,并能够有效提高金融需求项生成过程的自动化程度及效率。
89.为了提高对所述目标问题数据集中的各个测试问题进行聚类的可靠性及准确性,在本技术提供的金融需求项生成方法的一个实施例,参见图6,所述金融需求项生成方法的步骤100和步骤200之间还具体包含有如下内容:
90.步骤140:基于预设的专业词汇划分规则,将所述目标问题数据集中的各个测试问题各自对应的关键词划分为专业类名词、非专业类名词、专业类动词和非专业类动词。
91.步骤150:按照权重值由大到小的顺序,为属于专业类名词、非专业类名词、专业类动词和非专业类动词的关键词分别进行权重赋值。
92.具体来说,保留每条问题描述中的属于专业类名词、非专业类名词,专业类动词以及非专业类动词,构建成关键词集;假设关键词集中的词项个数为n,某关键词为t
i
,则每个测试问题由多个关键词构成,一个问题s采用vsm方法构建向量空间模型可以表示为s(t
1,
t
2,...,
t
n
),t
i
出现则记为1,未出现则记为0,使每个问题构成一个n维的空间向量。但向量计算若仅采用0和1的计算方式难以细致区分相似程度,故按照专业类名词、非专业类名词,专业类动词以及非专业类动词由大到小依次设置权重值w1至w4,默认值分别为100、50、10和5,构建测试问题集s对应的文本向量s
c
=s(w
11
,w
21
,w
32
,w
43
,......w
nn
)。
93.从上述描述可知,本技术实施例提供的金融需求项生成方法,通过将所述目标问题数据集中的各个测试问题各自对应的关键词划分为专业类名词、非专业类名词、专业类动词和非专业类动词,并为属于专业类名词、非专业类名词、专业类动词和非专业类动词的关键词分别进行权重赋值,能够为对所述目标问题数据集中的各个测试问题进行聚类提供有效且可靠的数据基础,进而能够有效提高对所述目标问题数据集中的各个测试问题进行聚类的可靠性及准确性。
94.为了提高关键问题词集的有效性,在本技术提供的金融需求项生成方法的一个实施例,参见图7,所述金融需求项生成方法的步骤200具体包含有如下内容:
95.步骤210:基于预设的lp聚类算法,对关键词权重赋值后的所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集。
96.具体来说,使用layer

partition(简称lp)聚类算法构建算法模型,该聚类算法继承基于划分与层次聚类的思想,每次计算类簇距离依赖上一次计算结果找到当前最优解,避免比较所有类簇间的相似度,提升整体聚类速度,设定测试问题集s={s1,s2,...,s
m
},计算每个问题间的相似度sim(s
i
,s
j
),相似度计算采用余弦定理计算,设定距离阈值为α。初始每个s
i
作为单个簇t
i
,任意选取一个t
i
,依次计算每个s
j
与t
i
间的距离,若距离小于α则将s
j
归为t
i
,直到所有剩下的s
j
大于α,然后再选取上一个与聚类起点最不相似的t
j
作为起点,重复计算距离步骤,直到所有的簇都参与了聚类。设定每个专业类名词为最大关键词,输出围绕最大关键词的聚类结果。
97.从上述描述可知,本技术实施例提供的金融需求项生成方法,通过基于预设的lp聚类算法,对关键词权重赋值后的所述目标问题数据集中的各个测试问题进行聚类,能够有效提高关键问题词集的有效性,并能够有效提高查找到目标问题数据集中的相似测试问题的准确性、自动化程度及智能化程度。
98.为了提高研发人员等用户获知自动生成的金融需求项的便捷性及效率,在本技术提供的金融需求项生成方法的一个实施例,参见图8,所述金融需求项生成方法的步骤300之后还具体包含有如下内容:
99.步骤400:输出所述金融需求项。
100.具体来说,可以将步骤300生成的各个金融需求项发送至预设的显示设备进行显示,也可以将包含有各个金融需求项具体内容的告知消息发送至开发人员等的客户端设备等等。
101.从上述描述可知,本技术实施例提供的金融需求项生成方法,通过输出所述金融需求项,能够有效提高研发人员等用户获知自动生成的金融需求项的便捷性及效率,能够进一步提高研发人员等的用户体验,进而能够进一步提高根据金融需求项上线及优化金融软件产品的效率及可靠性,有效提高金融软件产品开发人员的用户体验。
102.从软件层面来说,为了解决现有的金融需求项生成方式存在无法在保证金融需求项个性化的基础上满足金融需求项生成效率要求等问题,本技术提供一种用于执行所述金融需求项生成方法中全部或部分内容的金融需求项生成装置的实施例,参见图9,所述金融需求项生成装置具体包含有如下内容:
103.数据提取模块10,用于基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,以得到由各个所述关键词组成的目标问题数据集,其中,所述问题数据集包含有各个开发项目各自对应的多个迭代过程中的测试问题;
104.数据聚类模块20,用于对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集;
105.模板生成模块30,用于将所述关键问题词集输入预设的金融需求项文字模板,以生成对应的金融需求项。
106.本技术提供的金融需求项生成装置的实施例具体可以用于执行上述实施例中的金融需求项生成方法的实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
107.从上述描述可知,本技术实施例提供的金融需求项生成装置,通过基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,能够在有效降低已分词的问题数据集的数据量的基础上,使得目标问题数据集能够专门适用于金融业,进而能够有效提高后续对目标问题数据集进行聚类处理的可靠性、准确性及适用性;通过对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集,能够有效提高查找到目标问题数据集中的相似测试问题的准确性、自动化程度及智能化程度;通过将所述关键问题词集输入预设的金融需求项文字模板,能够有效提高生成金融需求项的个性化、准确性及可靠性,并能够有效提高金融需求项生成过程的自动化程度及效率,进而提高根据金融需求项上线及优化金融软件产品的效率及可靠性,有效提高金融软件产品开发人员的用户体验。
108.为了进一步说明本方案,本技术应用实例提供一种基于测试问题集和lp聚类算法的金融需求项生成方法,涉及产品需求领域,为解决产品需求领域中,在需求项输出的过程中,没有无需人力自动产生需求项的方法,本技术应用实例提供了一种基于测试问题数据集,构建基于自然语言处理的lp聚类分析模型,归纳发现相同业务场景的需求关键词,构建个性化需求项生成模型,通过设计模板进行关键词的输入最终生成需求项,力图解放在项目迭代过程中输出需求项投入的人力成本。
109.本技术应用实例提供的一种基于测试问题集自动生成需求项的方法,主要包括如下步骤:
110.步骤1):数据预处理装置,对测试问题集进行预处理,解析成含项目名称、业务种类、业务场景、问题描述以及涉及应用等标准化问题格式,将新数据集提供给聚类分析装置。
111.步骤2):聚类分析装置,装置利用条件随机场crf算法的分词算法作为基础分词算法,结合银行业专业词汇组成专项测试问题集分词工具,并利用fudannlp工具包标注词性。该方法相较传统分词方式可以识别出银行专业名词,并提供词性标注功能,通过词性标注可以方便组织需求项最后生成的关键词语序。使用lp聚类算法构建聚类分析模型发现相似测试问题场景的关键问题词集,该聚类算法继承了基于划分与层次聚类的思想,避免比较所有类簇间的相似度,可以提升整体聚类速度,便于提供关键词给需求项生成装置。
112.步骤3):需求项生成装置,设置需求项专用模板,并支持需求方进行人工修改,通过拼装关键问题词集输出对应需求项描述,完成完整的需求项输出。
113.参见图10,本技术应用实例提供的用于实现金融需求项生成方法的金融需求项生成系统具体包含有如下内容:
114.数据预处理装置、聚类分析装置及需求项生成装置。
115.其中,数据预处理装置与聚类分析装置相连;聚类分析装置与需求项生成装置相连。
116.(1)数据预处理装置:用于对原始测试问题数据集进行清洗和处理,包括多个项目的多个迭代过程中的测试问题,筛选出易用性问题,并对数据进行清洗和属性构造,属性包含项目名称、业务种类、业务场景、问题描述以及涉及应用等。重构完成后提供给聚类分析装置。
117.(2)聚类分析装置:用于输入预处理后的数据源,采用聚类算法构建模型,输出各类业务场景对应的关键问题词集。先利用crf算法进行基础汉语分词,这种算法基于序列标注模型,能很好地处理在描述测试问题时产生的汉语歧义等问题,结合银行业词汇识别出专业词汇,筛选出可用于生成银行业需求项的关键词,并利用fudannlp工具包标注词性。在进行汉语分词,对名词、动词等词性进行标注的基础上,还需要增加银行业专业词汇和名词的分词权重,使用lp聚类算法构建聚类分析模型发现相似测试问题场景的关键问题词集,提供给需求项生成装置。
118.(3)需求项生成装置:用于将聚类分析得到的关键词集作为输入数据源,设置需求项文字模板自动填入关键词集组成完整需求项,并支持人工修改与保存,最后输出基于测试问题集产生的完整需求项。
119.参见图11,数据预处理装置1具体包含有如下内容:
120.数据获取单元11、数据清洗单元12、属性构造单元13和数据变换单元14。
121.(1)数据获取单元11:用来导入多个项目的多个迭代过程中的测试问题。
122.(2)数据清洗单元12:筛选出迭代过程中状态为未完成修改的易用性问题,并组成清洗后的待处理数据源。
123.(3)属性构造单元13:用来将清洗后的数据按照项目名称、业务种类、业务场景、问题描述以及涉及应用等属性进行构建。
124.(4)数据变换单元14:用来将属性构造后的数据进行规则化输出,变换成可以建模识别的建模数据源。
125.其中,所述测试问题示例参见表1:
126.表1测试问题示例表
[0127][0128]
参见图12,聚类分析装置2具体包含有如下内容:
[0129]
分词单元21、数据筛选单元22、权重计算单元23、聚类计算单元24和结果输出单元25。
[0130]
(1)分词单元21:利用crf算法进行基础汉语分词,设立取值集合{b,e,m,s}用于计算字与字之间的标注概率,设定向量f(y,x)和权值向量w,观测序列x,设定递推函数计算,输出y集合作为最优路径输出,其中结合银行业词汇识别出专业词汇,筛选出可用于生成银行业需求项的关键词,并利用fudannlp工具包标注词性。在进行汉语分词,对名词、动词等词性进行标注的基础上,还需要过滤特殊符号、形容词、助词等无用词,便于词向量模型降维,而且通过词性标注可以方便组织需求项最后生成的关键词语序。
[0131]
(2)数据筛选单元22:保留每条问题描述中的属于专业类名词、非专业类名词,专业类动词以及非专业类动词,构建成关键词集。
[0132]
(3)权重计算单元23:假设关键词集中的词项个数为n,某关键词为t
i
,则每个测试问题由多个关键词构成,一个问题s采用vsm方法构建向量空间模型可以表示为s(t
1,
t
2,...,
t
n
),t
i
出现则记为1,未出现则记为0,使每个问题构成一个n维的空间向量。但向量计算若仅采用0和1的计算方式难以细致区分相似程度,故按照专业类名词、非专业类名词,专业类动词以及非专业类动词由大到小依次设置权重值w1至w4,默认值分别为100、50、10和5,构建测
试问题集s对应的文本向量s
c
=s(w
11
,w
21
,w
32
,w
43
,......w
nn
)。
[0133]
(4)聚类计算单元24:使用layer

partition(简称lp)聚类算法构建算法模型,该聚类算法继承基于划分与层次聚类的思想,每次计算类簇距离依赖上一次计算结果找到当前最优解,避免比较所有类簇间的相似度,提升整体聚类速度,设定测试问题集s={s1,s2,...,s
m
},计算每个问题间的相似度sim(s
i
,s
j
),相似度计算采用余弦定理计算,设定距离阈值为α。初始每个s
i
作为单个簇t
i
,任意选取一个t
i
,依次计算每个s
j
与t
i
间的距离,若距离小于α则将s
j
归为t
i
,直到所有剩下的s
j
大于α,然后再选取上一个与聚类起点最不相似的t
j
作为起点,重复计算距离步骤,直到所有的簇都参与了聚类。设定每个专业类名词为最大关键词,输出围绕最大关键词的聚类结果。
[0134]
(5)结果输出单元25:用于将聚类结果发送至文字模板。
[0135]
参见图13,需求项生成装置3具体包含有如下内容:
[0136]
文字模板设置单元31、文字排版单元32、个性化设置单元33和需求项发布单元34。
[0137]
(1)文字模板设置单元31:预先设置多个需求项生成的文字模板,在需求项发布时可按照预留模板进行填充输出;
[0138]
(2)文字排版单元32:对生成的需求项进行排版,首起空两格,最后增加空行符,进行简单的美化功能;
[0139]
(3)个性化设置单元33:支持人工录入新模板,修改已有文字模板和删除模板等功能,支持在系统自动生成需求项后进行修改和保存。
[0140]
(4)需求项发布单元34:支持按照关键词生成完整需求项集合。表1和表2展示了原始问题和最后生成需求项的对比结果,经过聚类后使用模板
“‘
渠道类’、

名词’、发起

场景类
’‘
动词’,

名词’需要支持

动词’。”自动填充生成需求项。
[0141]
其中,输出的需求项示例参见表2:
[0142]
表2输出需求项示例表
[0143][0144]
本技术应用实例提供的金融需求项生成方法,基于项目迭代过程中产生的测试问题集,构建基于自然语言处理技术的聚类模型,发现业务场景和问题描述中的关键词,自动归纳生成下一轮迭代项目的产品需求。其优点如下:
[0145]
基于测试问题集的原始数据,可以节省人力再次收集已发现的产品缺陷,提升测试问题中易用性问题的使用价值,在项目全周期中发挥更多作用。
[0146]
通过聚类算法可以自学习地发现问题中的关键词,对关键词的涉及场景进行聚类挖掘,大大节省了通过人力收集问题归纳同类的时间成本。
[0147]
依赖文字模板的需求项自动生成,可以节省需求方撰写需求项的时间,并可以使用个性化工具生成模板,保持不同需求生成的多样性。
[0148]
从硬件层面来说,为了解决现有的金融需求项生成方式存在无法在保证金融需求项个性化的基础上满足金融需求项生成效率要求等问题,本技术提供一种用于实现所述金融需求项生成方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
[0149]
图14为本技术实施例的电子设备9600的系统构成的示意框图。如图14所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图14是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
[0150]
在一实施例中,金融需求项生成功能可以被集成到中央处理器中。其中,中央处理器可以被配置为进行如下控制:
[0151]
步骤100:基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,以得到由各个所述关键词组成的目标问题数据集,其中,所述问题数据集包含有各个开发项目各自对应的多个迭代过程中的测试问题。
[0152]
步骤200:对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集。
[0153]
步骤300:将所述关键问题词集输入预设的金融需求项文字模板,以生成对应的金融需求项。
[0154]
从上述描述可知,本技术实施例提供的电子设备,通过基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,能够在有效降低已分词的问题数据集的数据量的基础上,使得目标问题数据集能够专门适用于金融业,进而能够有效提高后续对目标问题数据集进行聚类处理的可靠性、准确性及适用性;通过对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集,能够有效提高查找到目标问题数据集中的相似测试问题的准确性、自动化程度及智能化程度;通过将所述关键问题词集输入预设的金融需求项文字模板,能够有效提高生成金融需求项的个性化、准确性及可靠性,并能够有效提高金融需求项生成过程的自动化程度及效率,进而提高根据金融需求项上线及优化金融软件产品的效率及可靠性,有效提高金融软件产品开发人员的用户体验。
[0155]
在另一个实施方式中,金融需求项生成装置可以与中央处理器9100分开配置,例如可以将金融需求项生成装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现金融需求项生成功能。
[0156]
如图14所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图14中所示的所有部件;此外,电子设备9600还可以包括图14中没有示出的部件,可以参考现有技术。
[0157]
如图14所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
[0158]
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
[0159]
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为lcd显示器,但并不限于此。
[0160]
该存储器9140可以是固态存储器,例如,只读存储器(rom)、随机存取存储器(ram)、sim卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为eprom等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
[0161]
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
[0162]
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
[0163]
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
[0164]
本技术的实施例还提供能够实现上述实施例中的金融需求项生成方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的金融需求项生成方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
[0165]
步骤100:基于预设的金融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,以得到由各个所述关键词组成的目标问题数据集,其中,所述问题数据集包含有各个开发项目各自对应的多个迭代过程中的测试问题。
[0166]
步骤200:对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集。
[0167]
步骤300:将所述关键问题词集输入预设的金融需求项文字模板,以生成对应的金融需求项。
[0168]
从上述描述可知,本技术实施例提供的计算机可读存储介质,通过基于预设的金
融词汇集合在已分词的问题数据集中提取用于生成金融需求项的关键词,能够在有效降低已分词的问题数据集的数据量的基础上,使得目标问题数据集能够专门适用于金融业,进而能够有效提高后续对目标问题数据集进行聚类处理的可靠性、准确性及适用性;通过对所述目标问题数据集中的各个测试问题进行聚类,以得到对应的关键问题词集,能够有效提高查找到目标问题数据集中的相似测试问题的准确性、自动化程度及智能化程度;通过将所述关键问题词集输入预设的金融需求项文字模板,能够有效提高生成金融需求项的个性化、准确性及可靠性,并能够有效提高金融需求项生成过程的自动化程度及效率,进而提高根据金融需求项上线及优化金融软件产品的效率及可靠性,有效提高金融软件产品开发人员的用户体验。
[0169]
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
[0170]
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0171]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0172]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0173]
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜