一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于漏斗模型和余弦算法的中标项目检索方法与流程

2022-07-30 18:45:14 来源:中国专利 TAG:


1.本发明涉及中标项目检索领域,尤其涉及一种基于漏斗模型和余弦算法的中标项目检索方法。


背景技术:

2.目前行业普遍没有完善的项目全周期数据,且国家对于各类招投标数据的管理目标也是在逐步精准化、整体化。而这类数据对招投标从业者又极为重要,它能够打破项目实施前最大的两个数据孤岛,让整个项目周期数据能够精准闭环。


技术实现要素:

3.针对上述问题,本发明提供一种基于漏斗模型和余弦算法的中标项目检索方法。
4.本发明通过以下技术方案实现:一种基于漏斗模型和余弦算法的中标项目检索方法,包括以下步骤:s1. 根据中标项目的项目名称全匹配招标项目的项目名称,并判断结果,若结果为空,则执行步骤s2;s2. 对中标项目进行模糊匹配,将分词处理后的词库与招标项目的招标名称做减词包含查询,并判断结果,若结果为包含查询有返回,则执行步骤s3,若结果为包含查询无返回,则从末尾减词继续查询;s3. 判断招标项目的正文是否包含业主单位名称,若结果为包含,则执行步骤s4;s4. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为包含,则关联成功,若结果为不包含,则执行步骤s5;s5. 判断被删减的词句和招标项目的正文是否包含关键词:标段、包,并判断招标项目的项目名称和中标项目的项目名称是否包含减词包含查询中未删减的词句,若结果均为是,则执行步骤s6;s6. 根据余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,判断结果,提取关联成功结果。
5.进一步的,还包括步骤s0,预先取出待检索关联的相关中标数据,其包含项目名称、业主单位和中标时间,所述中标项目的业主单位非空。
6.进一步的,步骤s1中判断中标项目的业主单位是否与匹配结果的业主单位互相包含具体包括以下子步骤:s101. 判断中标项目的业主单位是否与匹配结果的业主单位互相包含,若包含,则执行步骤s102,若不是,则表示关联成功;s102. 判断中标项目的中标时间和招标项目的招标截止时间是否小于一个月,若是,则执行步骤s2,若否,则表示关联成功。进一步的,所述步骤s2具体包括以下子步骤:s201. 进行模糊匹配,对中标项目和招标项目进行关键词处理;
s202. 对经过关键词处理后的中标项目的项目名称进行分词处理;s203. 将得到分词处理后的词库与招标项目的对招标名称做减词包含查询,并判断结果,若结果为包含查询有返回,则执行步骤s3,若结果为包含查询无返回,则从末尾减词继续查询。
7.进一步的,所述步骤s201中关键词处理具体包括以下子步骤:s2011. 将中标项目的项目名称和招标项目的项目名称中的英文括号替换为中文括号;s2012. 删去中标项目的名称中的关键词:项目名称、项目编号、不分标段、招标项目。
8.进一步的,所述步骤s202中分词处理的具体步骤为:将关键词处理后的中标项目的项目名称和招标项目的项目名称进行ik智能分词。
9.进一步的,所述步骤s203具体包括以下子步骤:s2031. 将分词处理后的词库与招标项目的招标名称做减词包含查询,当搜索词小于4个时,则表示关联失败,当搜索词大于4个时,则执行步骤s2032;s2032. 判断包含查询结果,当结果为包含查询有返回,则执行步骤s3,当结果为包含查询无返回,则从末尾减词继续查询。
10.进一步的,所述步骤s5中,若结果有其一为否,则判断减词包含查询中被删减的词句是否包含关键词。
11.进一步的,所述步骤s5中判断减词包含查询中被删减的词句是否包含关键词具体包括以下步骤:s501. 判断减词包含查询中被删减的词句是否包含关键词:联合体、标段、监理、设计、总承包,并判断招标项目的项目名称是否包含减词包含查询中未删减的词句,若否,则判断减词包含查询中被删减的词句是否为空,若是,则执行步骤s502;s502. 通过余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,当匹配度小于60%时,则执行步骤s503;当匹配度大于60%时,则表示关联成功;s503. 判断替换后的中标项目的项目名称与招标项目的项目名称的匹配度,当匹配度小于94%时,则执行步骤s504,当匹配度大于94%时,则表示关联成功;s504. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为否,则表示关联失败,若结果为是,则表示关联成功。
12.进一步的,所述步骤s6具体包括以下子步骤:s601. 根据余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,判断匹配度,当匹配度小于60% 时,则执行步骤s602,当匹配度大于60%时,则表示关联成功;s602. 判断替换后的中标项目的项目名称与招标项目的项目名称的匹配度,判断匹配度,当匹配度小于94% 时,则执行步骤s603,当匹配度大于94%时,则表示关联成功;s603. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为否,则表示关联失败,若结果为是,则表示关联成功。
13.本发明的有益效果:(1)通过本发明,结合现有的海量项目数据,可实现对招标、中标两个环节中零散
的数据进行关联,得到一个项目基本的生命链,还可以依据关联后的链式数据进一步计算得出中标项目的下浮率,帮助用户精准投标,也能依据下浮率数据统计对招投标市场进行宏观分析或单个项目分析;(2)本发明可对一个项目周期内的各项数据维度,如:建设规模、招标范围、资格要求、开标时间等进行补充,完善项目信息;(3)本发明可以通过大数据分析出业主单位和中标单位的招投标趋势等重要参考信息;(4)本发明提供了一种项目全生命周期信息管理的技术方案。
附图说明
14.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
15.图1为本发明实施例提出的一种基于漏斗模型和余弦算法的中标项目检索方法的方法流程图;图2为本发明实施例提出的一种基于漏斗模型和余弦算法的中标项目检索方法的终端设备的结构示意图;图3为本发明实施例提出的一种基于漏斗模型和余弦算法的中标项目检索方法的计算机可读存储介质结构示意图。
具体实施方式
16.为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
17.实施例1如图1,本实施例提出一种基于漏斗模型和余弦算法的中标项目检索方法,包括以下步骤:一种基于漏斗模型和余弦算法的中标项目检索方法,包括以下步骤:s1. 根据中标项目的项目名称全匹配招标项目的项目名称,并判断结果,若结果为空,则执行步骤s2;s2. 对中标项目进行模糊匹配,将分词处理后的词库与招标项目的招标名称做减词包含查询,并判断结果,若结果为包含查询有返回,则执行步骤s3,若结果为包含查询无返回,则从末尾减词继续查询;s3. 判断招标项目的正文是否包含业主单位名称,若结果为不包含,则关联失败,若结果为包含,则执行步骤s4;s4. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为包含,则关联成功,若结果为不包含,则执行步骤s5;s5. 判断被删减的词句和招标项目的正文是否包含关键词:标段、包,并判断招标
项目的项目名称和中标项目的项目名称是否包含减词包含查询中未删减的词句,若结果均为是,则执行步骤s6;s6. 根据余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,判断结果,提取关联成功结果。
18.进一步的,还包括步骤s0,预先取出待检索关联的相关中标数据,其包含项目名称、业主单位和中标时间,所述中标项目的业主单位非空。
19.进一步的,步骤s1中判断中标项目的业主单位是否与匹配结果的业主单位互相包含具体包括以下子步骤:s101. 判断中标项目的业主单位是否与匹配结果的业主单位互相包含,若包含,则执行步骤s102,若不是,则表示关联成功;s102. 判断中标项目的中标时间和招标项目的招标截止时间是否小于一个月,若是,则执行步骤s2,若否,则表示关联成功。进一步的,所述步骤s2具体包括以下子步骤:s201. 进行模糊匹配,对中标项目和招标项目进行关键词处理;s202. 对经过关键词处理后的中标项目的项目名称进行分词处理;s203. 将分词处理后的词库与招标项目的招标名称做减词包含查询,并判断结果,若结果为包含查询有返回,则执行步骤s3,若结果为包含查询无返回,则从末尾减词继续查询。
20.进一步的,所述步骤s201中关键词处理具体包括以下子步骤:s2011. 将中标项目的项目名称和招标项目的项目名称中的英文括号替换为中文括号;s2012. 删去中标项目的名称中的关键词:项目名称、项目编号、不分标段、招标项目。
21.进一步的,所述步骤s202中分词处理的具体步骤为:将关键词处理后的中标项目的项目名称和招标项目的项目名称进行ik智能分词。
22.进一步的,所述步骤s203具体包括以下子步骤:s2031. 将分词处理后的词库与招标项目的招标名称做减词包含查询,当搜索词小于4个时,则表示关联失败,当搜索词大于4个时,则执行步骤s2032;s2032. 判断包含查询结果,当结果为包含查询有返回,则执行步骤s3,当结果为包含查询无返回,则从末尾减词继续查询。
23.进一步的,所述步骤s5中,若结果有其一为否,则判断减词包含查询中被删减的词句是否包含关键词。
24.进一步的,所述步骤s5中判断减词包含查询中被删减的词句是否包含关键词具体包括以下步骤:s501. 判断减词包含查询中被删减的词句是否包含关键词:联合体、标段、监理、设计、总承包,并判断招标项目的项目名称是否包含减词包含查询中未删减的词句,若否,则判断减词包含查询中被删减的词句是否为空,若是,则执行步骤s502;s502. 通过余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,当匹配度小于60%时,则执行步骤s503;当匹配度大于60%时,则表示关联成功;
s503. 判断替换后的中标项目的项目名称与招标项目的项目名称的匹配度,当匹配度小于94%时,则执行步骤s504,当匹配度大于94%时,则表示关联成功;s504. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为否,则表示关联失败,若结果为是,则表示关联成功。
25.进一步的,所述步骤s6具体包括以下子步骤:s601. 根据余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度,判断匹配度,当匹配度小于60% 时,则执行步骤s602,当匹配度大于60%时,则表示关联成功;s602. 判断替换后的中标项目的项目名称与招标项目的项目名称的匹配度,判断匹配度,当匹配度小于94% 时,则执行步骤s603,当匹配度大于94%时,则表示关联成功;s603. 判断招标项目的正文是否包含减词包含查询中被删减的词句,若结果为否,则表示关联失败,若结果为是,则表示关联成功。
26.其中,本实施例中所述此类匹配度是根据多次反复实验,逐渐调优得来,无具体公式。
27.实施例2在实施例1的基础上,本实施例进一步提出一种基于漏斗模型和余弦算法的中标项目检索系统,包括:全匹配模块,用于根据中标项目的项目名称全匹配招标项目的项目名称;模糊匹配模块,用于对中标项目进行模糊匹配,将得到分词处理后的词库与招标项目的对招标名称做减词包含查询;减词包含查询判断模块,用于判断招标项目的正文是否包含业主单位名称和减词包含查询中被删减的词句;关键词判断模块,用于判断被删减的词句和招标项目的正文是否包含关键词:标段、包,并判断招标项目的项目名称和中标项目的项目名称是否包含减词包含查询中未删减的词句;余弦匹配度计算模块,用于根据余弦算法获取中标项目的项目名称与减词包含查询中未删减的词句的匹配度;关联判断模块,用于对全匹配模块、模糊匹配模块、减词包含查询判断模块、关键词判断模块、余弦匹配度计算模块中的关联成功/失败进行判断。
28.实施例3如图2,在实施例1的基础上,本实施例提出一种基于漏斗模型和余弦算法的中标项目检索的终端设备,终端设备200包括至少一个存储器210、至少一个处理器220以及连接不同平台系统的总线230。
29.存储器210可以包括易失性存储器形式的可读介质,例如随机存取存储器(ram)211和/或高速缓存存储器212,还可以进一步包括只读存储器(rom)213。
30.其中,存储器210还存储有计算机程序,计算机程序可以被处理器220执行,使得处理器220执行本技术实施例中上述任一项一种基于漏斗模型和余弦算法的中标项目检索方法,其具体实现方式与上述方法的实施例中记载的实施方式、所达到的技术效果一致,部分内容不再赘述。存储器210还可以包括具有一组(至少一个)程序模块215的程序/实用工具
214,这样的程序模块包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
31.相应的,处理器220可以执行上述计算机程序,以及可以执行程序/实用工具214。
32.总线230可以为表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
33.终端设备200也可以与一个或多个外部设备240例如键盘、指向设备、蓝牙设备等通信,还可与一个或者多个能够与该终端设备200交互的设备通信,和/或与使得该终端设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口250进行。并且,终端设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与终端设备200的其它模块通信。应当明白,尽管图中未示出,可以结合终端设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储平台等。
34.实施例4在实施例1的基础上,本实施例提出一种基于漏斗模型和余弦算法的中标项目检索的计算机可读存储介质,所述计算机可读存储介质上存储有指令,该指令被处理器执行时实现上述任一的一种基于漏斗模型和余弦算法的中标项目检索方法。其具体实现方式与上述方法的实施例中记载的实施方式、所达到的技术效果一致,部分内容不再赘述。
35.图3示出了本实施例提供的用于实现上述方法的程序产品300,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品300不限于此,在本实施例件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。程序产品300可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
36.计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言诸如java、c 等,还包括常规的过程式程序设计语言诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一
个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
37.以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献