一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种项目报告录入方法、装置、电子设备及存储介质与流程

2022-04-09 02:55:51 来源:中国专利 TAG:


1.本发明实施例涉及信息处理技术领域,特别涉及一种项目报告录入方法、装置、电子设备及存储介质。


背景技术:

2.在投资经理对一个项目进行评估,从而确定是否投资该项目时,需要网上搜寻与项目相关的项目报告,并根据相关项目报告进行评估工作。
3.目前是通过人工全网搜索来汇集项目相关报告,然后再将汇集的报告呈现给投资经理,但是这种汇集项目报告的方式需要大量人力和时间成本,降低了评估项目的效率。


技术实现要素:

4.本发明实施方式的目的在于提供一种项目报告录入方法、装置、电子设备及存储介质,可以实现项目相关报告的自动汇集和呈现,提高项目评估的效率。
5.为解决上述技术问题,本发明的实施方式提供了一种项目报告录入方法,包括以下步骤:获取项目报告的关键词;将所述关键词与预存的行业关键词库进行匹配,得到与所述关键词对应的行业关键词,根据所述行业关键词,将所述项目报告录入至行业数据库中对应的行业;其中,所述行业关键词库根据预录入的各行业的项目报告的关键词生成,所述各行业的项目报告包括:内部转发的公开报告、公开报告以及内部研究报告。
6.为解决上述技术问题,本发明的实施方式还提供了一种项目报告录入装置,包括:获取模块,用于获取项目报告的关键词;匹配模块,用于将所述关键词与预存的行业关键词库进行匹配,得到与所述关键词对应的行业关键词;录入模块,用于根据所述行业关键词,将所述项目报告录入至行业数据库中对应的行业;其中,所述行业关键词库根据预录入的各行业的项目报告的关键词生成,所述各行业的项目报告包括:内部转发的公开报告、公开报告以及内部研究报告。
7.为解决上述技术问题,本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的项目报告录入方法。
8.为解决上述技术问题,本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的项目报告录入方法。
9.本发明实施方式相对于现有技术而言,在收录到新的项目报告时,通过获取项目报告的关键词,将获取的关键词与预存的行业关键词库进行匹配,可以得到项目报告的关键词对应的行业关键词,然后根据行业关键词,将项目报告录入至行业数据库中对应的行业,其中,所述行业关键词库根据预录入的各行业的项目报告的关键词生成,所述各行业的项目报告包括:内部转发的公开报告、公开报告以及内部研究报告。本发明实施例通过预存一个行业关键词库,并将项目报告的行业关键词与其匹配,即可得到项目报告的行业关键
词,从而将项目报告录入行业数据库对应的行业中,实现了与行业相关的项目报告的自动汇集,因此,在投资经理评估项目时,可以根据项目名称和项目所属的行业,直接获取到项目的相关报告,提高了评估的效率。
10.另外,所述将所述关键词与预存的行业关键词库进行匹配,得到与所述关键词对应的行业关键词之前,还包括:获取预录入的各行业的项目报告;提取所述预录入的各行业的项目报告的高频关键词;根据所述高频关键词,获取所述行业关键词库。通过建立行业关键词库使得在有新收录的项目报告时,可以匹配到与该新收录的项目报告对应的行业关键词。
11.另外,所述提取所述预录入的各行业的项目报告的高频关键词,包括:根据分词技术提取所述预录入的各行业的项目报告的高频关键词。通过分词技术提取的高频关键词准确率更高。
12.另外,所述根据所述高频关键词,获取所述行业关键词库,包括:剔除所述高频关键词中与各行业无关的高频关键词,并将所述剔除后的高频关键词作为所述行业关键词库。将与行业无关的高频关键词剔除,得到的行业关键词库更加准确。
13.另外,所述根据所述行业关键词,将所述项目报告录入至行业数据库中对应的行业级别之后,还包括:将所述录入的项目报告存储至支持全文搜索的数据库。将录入的项目报告最终存储至支持全文搜索的数据库,使得投资经理在查看项目时,匹配出的项目相关报告更加准确。
14.另外,所述将所述录入的项目报告存储至支持全文搜索的数据库之后,还包括:根据项目名称和所述项目所属的行业,从所述支持全文搜索的数据库中自动搜索与所述项目相关的项目报告,并显示所述项目报告。通过自动搜索与项目相关的项目报告,节省了人力,同时提高评估的效率。
15.另外,所述内部转发的公开报告和所述内部研究报告通过用户上传,所述公开报告通过爬虫抓取。可以采用多种方式收录项目报告,收录方式更加灵活。
附图说明
16.一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
17.图1是根据本发明一实施例提供的一种项目报告录入方法的流程图;
18.图2是根据本发明另一实施例提供的一种项目报告录入装置的示意图;
19.图3是根据本发明另一实施例提供的一种电子设备的结构图。
具体实施方式
20.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本技术而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本技术所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个
实施例在不矛盾的前提下可以相互结合相互引用。
21.本发明第一实施方式涉及一种项目报告录入方法,应用于服务器。本实施例的具体流程图如图1所示,包括:
22.步骤101,获取项目报告的关键词。
23.步骤102,将关键词与预存的行业关键词库进行匹配,得到与关键词对应的行业关键词。
24.步骤103,根据行业关键词,将项目报告录入至行业数据库中对应的行业。
25.本实施例中,在收录到新的项目报告时,通过获取项目报告的关键词,将获取的关键词与预存的行业关键词库进行匹配,可以得到项目报告的关键词对应的行业关键词,然后根据行业关键词,将项目报告录入至行业数据库中对应的行业,其中,所述行业关键词库根据预录入的各行业的项目报告的关键词生成,所述各行业的项目报告包括:内部转发的公开报告、公开报告以及内部研究报告。本发明实施例通过预存一个行业关键词库,并将项目报告的行业关键词与其匹配,即可得到项目报告的行业关键词,从而将项目报告录入行业数据库对应的行业中,实现了与行业相关的项目报告的自动汇集,因此,在投资经理评估项目时,可以根据项目名称和项目所属的行业,直接获取到项目的相关报告,提高了评估的效率。
26.下面对本实施方式的项目报告录入方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
27.在步骤101中,服务器端在收录到项目报告时,首先会通过通过光学字符识别(optical character recognition,ocr)技术提取项目报告的报告内容,然后获取报告内容的关键词,具体为采用jieba分词技术提取报告内容的高频词。
28.其中,项目报告可以包括:内部转发的公开报告、公开报告以及内部研究报告,内部转发的公开报告和内部研究报告通过用户上传,公开报告通过爬虫抓取,即可以采用多种方式收录项目报告,收录方式更加灵活。
29.在一个例子中,内部转发报告可以通过以下方式获取:首先根据flutter和socket io两个开源框架开发移动端和及时通信,实现自动聊天机器人功能,用户可以通过app将需要上传的项目报告发送给自动聊天机器人,然后通过自动聊天机器人上传项目报告至服务器端。例如,用户将网页链接或文件发送给自动聊天机器人后,自动聊天机器人会将网页链接或文件传输至服务器端,完成项目报告的上传。其中,若上传的项目报告是网页链接的形式,则在用户将网页链接发送给自动聊天机器人后,自动聊天机器人会先将该网页链接放入消息队列,采用爬虫技术从消息队列中获取该网页链接,再通过phantomjs技术将网页转为pdf形式,再发送给服务器进行存储,完成项目报告的上传;若上传的项目报告是文件的形式,则在用户将文件发送给自动聊天机器人后,自动聊天机器人会将文件发送给服务器进行存储,在服务器端保存完成后,会告知自动聊天机器人,自动聊天机器人再向用户返回“接收报告成功”的消息,即完成项目报告的上传。
30.在一个例子中,公开报告可以采用爬虫技术从网页中抓取。
31.在一个例子中,内部研究报告可以由用户从web端系统功能上传,并通过系统管理上传的项目报告。
32.需要说明的是,用户上传的内部转发的报告和内部研究的报告是经过人工筛选得
到的有价值的项目报告。
33.在步骤102中,将获取的项目报告的关键词与预存的行业关键词库进行匹配,可以得到项目报告的关键词对应的行业关键词。
34.在一个例子中,在将关键词与预存的行业关键词库进行匹配,得到与关键词对应的行业关键词之前,首先获取预录入的各行业的项目报告,通过jieba分词技术提取预录入的各行业的项目报告的高频关键词,然后根据获得的高频关键词,确定行业关键词库。通过建立行业关键词库使得在有新收录的项目报告时,可以匹配到与该新收录的项目报告对应的行业关键词。
35.在一个例子中,可以将获得的高频关键词中的与预录入的各行业的项目报告的行业无关的高频关键词剔除,将剔除后的高频关键词作为行业关键词库。例如,可以人工确认与行业无关的高频关键词,使得最终得到的行业关键词库更加准确。
36.其中,行业关键词库根据预录入的各行业的项目报告的关键词生成,各行业的项目报告包括:内部转发的公开报告、公开报告以及内部研究报告,预录入的各行业的项目报告可以为,采用人工的方式将用户上传的内部转发的报告、内部研究的报告或者抓取的公开报告进行行业分类。
37.具体地,建立一个行业数据库,包括:一级行业、二级行业。其中,一级行业可以是电商行业、教育行业以及社交行业,二级行业可以是母婴电商、生鲜电商以及医药电商。首先将内部转发的报告、内部研究的报告或者抓取的公开报告作为初始报告库,根据行业数据库中的一级行业和二级行业的行业分类,通过人工将初始报告库中的项目报告报告进行行业分类,即将初始报告库中的项目报告录入至行业数据库中对应的行业,得到预录入的各行业的项目报告,例如,初始报告库中的项目报告1为一级行业电商行业下的生鲜电商。
38.在步骤103中,根据项目报告的关键词所对应的行业关键词,将项目报告录入到行业关键词所对应的行业中。
39.在一个例子中,在根据行业关键词,将所项目报告录入至行业数据库中对应的行业之后,可以将录入的项目报告存储至支持全文搜索的数据库,即elasticsearch数据库,使得投资经理在查看项目时,匹配出的项目相关报告更加准确。
40.在一个例子中,在将所录入的项目报告存储至支持全文搜索的数据库之后,当投资经理查看某个项目时,服务器端可以根据项目名称和项目所属的行业,从支持全文搜索的数据库中自动搜索出与项目相关的项目报告,并通过web端或者移动端向投资经理显示相关的项目报告。由于服务器可以检测到投资经理查看了某个项目,并且会自动搜索与项目相关的项目报告,节省了人力的同时,提高了项目评估的效率。
41.值得一提的是,在新录入的项目报告存储进支持全文搜索的数据库之前,自动匹配并关联了与其对应的行业关键词,可以通过定期人工确认自动匹配的出的行业关键词是否准确,若不准确,可以对行业关键词进行更新,即更新行业关键词库。或者,在确认行业关键词与行业的对应关系后,可以人工增加行业关键词至行业关键词库,以此不断丰富行业关键词库,提高相关项目报告匹配的准确度。
42.需要说明的是,本实施方式中的上述各示例均为方便理解进行的举例说明,并不对本发明的技术方案构成限定。
43.上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者
对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
44.本发明另一实施例涉及一种项目报告录入装置,如图2所示,包括:获取模块201,匹配模块202,录入模块203。
45.具体而言,获取模块201,用于获取项目报告的关键词。
46.在一个例子中,获取模块201还用于在将关键词与预存的行业关键词库进行匹配,得到与关键词对应的行业关键词之前,获取预录入的各行业的项目报告;提取预录入的各行业的项目报告的高频关键词;根据高频关键词,确定行业关键词库;其中,行业关键词库根据预录入的各行业的项目报告的关键词生成,各行业的项目报告包括:内部转发的公开报告、公开报告以及内部研究报告。
47.在一个例子中,获取模块201还用于根据分词技术提取预录入的各行业的项目报告的高频关键词。
48.在一个例子中,获取模块201还用于剔除高频关键词中与各行业无关的高频关键词,并将剔除后的高频关键词作为行业关键词库。
49.匹配模块202,用于将关键词与预存的行业关键词库进行匹配,得到与关键词对应的行业关键词。
50.录入模块203,用于根据行业关键词,将项目报告录入至行业数据库中对应的行业。
51.在一个例子中,录入模块203还用于在根据行业关键词,将项目报告录入至行业数据库中对应的行业之后,将录入的项目报告存储至支持全文搜索的数据库。
52.在一个例子中,录入模块203还用于在将录入的项目报告存储至支持全文搜索的数据库之后,根据项目名称和项目所属的行业,从支持全文搜索的数据库中自动搜索与项目相关的项目报告,并显示项目报告。
53.不难发现,本实施方式为与第一实施方式相对应的装置实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
54.值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
55.本发明的另一实施例涉及一种电子设备,如图3所示,包括:至少一个处理器301;以及,与所述至少一个处理器301通信连接的存储器302;其中,所述存储器302存储有可被所述至少一个处理器301执行的指令,所述指令被所述至少一个处理器301执行,以使所述至少一个处理器301能够执行上述各实施例中的项目报告录入方法。
56.其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围
设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
57.处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
58.本发明的另一实施例涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
59.即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
60.本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献