一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种科技成果管理方法、平台及电子设备与流程

2022-07-30 21:49:10 来源:中国专利 TAG:


1.本发明属于科技成果转化技术领域,具体涉及一种科技成果管理方法、平台及电子设备。


背景技术:

2.前沿科技成果只有很少一部分被应用于实际生产中,能够真正形成产业的科技成果更是少之又少。相比较而言,国内科技成果中发挥实际作用的部分相对于发达国家来说明显偏低。造成上述现状的很大原因在于缺乏有效的供需对接平台。具体来说,科技成果掌握在各类高校以及科研机构手中,但高校和科研机构不具备成果转化的设备和资金;而另一方面企业不具备技术辨识能力,并且对产生发展动态以及产业政策方向并不清楚;因此,促进成果转化需要专业的第三方从中斡旋,提供专业的科技成果转化指导。
3.目前,有些第三方通过搭建自己的科技成果管理平台实现了高校和科研机构的科技成果(主要是专利)向企业进行转化的模式。但是,现有的科技成果管理平台只是由第三方机构将专利信息和需求信息分别上传至平台,并由第三方机构内的技术经理人展开对接工作。其中,技术经理人在匹配供需时,往往依据的是需求信息和专利的摘要信息。然而专利的摘要信息有时并不能反映专利文件的技术要点或者应用方向,此时技术经理人需要根据对专利中技术的理解来自行提取有用的摘要信息。
4.综上可见,现有的科技成果管理平台对于科技成果转化工作来说,仅起到了数据记录和流程跟踪的作用,无法为供需双方以及第三方提供更深度的数据管理服务。


技术实现要素:

5.为了解决现有技术中存在的上述问题,本发明提供了一种科技成果管理方法、平台及电子设备。本发明要解决的技术问题通过以下技术方案实现:
6.第一方面,本发明提供了一种科技成果管理方法,包括:
7.接收成果供给方或第三方从成果上传入口所上传的科技成果文档;
8.若所述科技成果文档为非专利文本,对所述科技成果文档进行全文关键词的提取;
9.若所述科技成果文档为专利文本,对所述专利文本的具体实施方式进行全文关键词的提取;
10.根据预设的技术词典确定每个所述关键词的第一近义词,并将所述第一近义词添加至所述科技成果文档的关键词中;
11.根据所述科技成果文档的关键词的出现频次以及所述科技成果文档的关键词在所述技术词典中的位置信息,生成所述科技成果文档的二维统计数据;
12.基于所述二维统计数据对所述科技成果文档进行管理,所述管理至少包括:为所述科技成果文档自动匹配成果需求方。
13.可选地,所述管理还包括:
14.利用预设的分类器对所述二维统计数据进行分类,得到的分类结果作为所述科技成果文档所属的技术领域,并为所述科技成果文档添加领域标签;
15.为所述科技成果文档自动匹配成果需求方的方式,包括:
16.基于所述科技成果文档所属的技术领域,为所述科技成果文档自动匹配成果需求方。
17.可选地,所述方法还包括:
18.接收目标方输入的至少一个成果检索词;所述目标方包括成果需求方、成果提供方或第三方;
19.利用预设的神经网络模型预测所述成果检索词所属的技术领域;
20.向所述目标方推荐所述成果检索词所属的技术领域内的科技成果文档。
21.可选地,基于所述二维统计数据对所述科技成果文档进行管理,包括:
22.在向所述目标方推荐所述需求类关键词所属的技术领域内的科技成果文档之后,响应于所述目标方收藏了一个或多个所推荐的目标科技成果文档,基于所述目标科技成果文档的二维统计数据对推荐列表进行重新排序,以重点推荐与所述目标科技成果文档相似的科技成果文档。
23.可选地,所述方法还包括:
24.接收目标方输入的至少一个成果检索词;所述目标方包括成果需求方、成果提供方或第三方;
25.根据所述技术词典确定每个所述成果检索词的第二近义词;
26.筛选关键词含有所述成果检索词和/或所述第二近义词的所有科技成果文档;
27.根据多种排序因素对所筛选的科技成果文档进行综合排序,并展示排序结果;
28.其中,所述多种排序因素至少包括:由所述成果检索词命中的关键词在该关键词所属的二维统计数据中对应的出现频次,以及由所述第二近义词命中的关键词在该关键词所属的二维统计数据中对应的出现频次。
29.可选地,所述管理还包括:
30.获取所述科技成果文档所属的技术领域内的所有同类科技成果文档;
31.针对每个所述同类科技成果文档,根据该同类科技成果文档的二维统计数据以及所述科技成果文档的二维统计数据,比较该两个科技成果文档的相似程度;
32.根据比较结果,确定并展示所述科技成果文档的技术价值。
33.可选地,所述管理还包括:
34.根据所述二维统计数据,提取出现频次超出预设门限的关键词作为所述科技成果文档的技术标签,以在展示所述科技成果文档的成果简介时展示所述技术标签。
35.可选地,所述管理还包括:
36.基于所述科技成果文档的二维统计数据,生成所述科技成果文档的词云,以在展示所述科技成果文档的成果简介时展示所述词云。
37.第二方面,本发明提供了一种科技成果管理平台,包括:
38.第一接收模块,用于接收成果供给方或第三方从成果上传入口所上传的科技成果文档;
39.关键词提取模块,用于在所述科技成果文档为非专利文本时,对所述科技成果文
档进行全文关键词的提取,在所述科技成果文档为专利文本时,对所述专利文本的具体实施方式进行全文关键词的提取;
40.近义词扩展模块,用于根据预设的技术词典确定每个所述关键词的第一近义词,并将所述第一近义词添加至所述科技成果文档的关键词中;
41.统计模块,用于根据所述科技成果文档的关键词的出现频次以及所述科技成果文档的关键词在所述技术词典中的位置信息,生成所述科技成果文档的二维统计数据;
42.管理模块,用于基于所述二维统计数据对所述科技成果文档进行管理,所述管理至少包括:为所述科技成果文档自动匹配成果需求方。
43.可选地,所述管理模块执行的管理还包括:
44.利用预设的分类器对所述二维统计数据进行分类,得到的分类结果作为所述科技成果文档所属的技术领域,并为所述科技成果文档添加领域标签;
45.所述管理模块为所述科技成果文档自动匹配成果需求方的方式,包括:
46.基于所述科技成果文档所属的技术领域,为所述科技成果文档自动匹配成果需求方。
47.可选地,所述装置还包括:第二接收模块、预测模块以及推荐模块;
48.所述第二接收模块,用于接收目标方输入的至少一个成果检索词;所述目标方包括成果需求方、成果提供方或第三方;
49.所述预测模块,用于利用预设的神经网络模型预测所述成果检索词所属的技术领域;
50.所述推荐模块,用于向所述目标方推荐所述成果检索词所属的技术领域内的科技成果文档。
51.可选地,所述管理模块,基于所述二维统计数据对所述科技成果文档进行管理,包括:
52.在向所述目标方推荐所述需求类关键词所属的技术领域内的科技成果文档之后,响应于所述目标方收藏了一个或多个所推荐的目标科技成果文档,基于所述目标科技成果文档的二维统计数据对推荐列表进行重新排序,以重点推荐与所述目标科技成果文档相似的科技成果文档。
53.可选地,所述装置还包括:第二接收模块、文档筛选模块和排序展示模块;
54.所述第二接收模块,用于接收目标方输入的至少一个成果检索词;所述目标方包括成果需求方、成果提供方或第三方;
55.所述近义词扩展模块,还用于根据所述技术词典确定每个所述成果检索词的第二近义词;
56.所述文档筛选模块,还用于筛选关键词含有所述成果检索词和/或所述第二近义词的所有科技成果文档;
57.所述排序展示模块,还用于根据多种排序因素对所筛选的科技成果文档进行综合排序,并展示排序结果;
58.其中,所述多种排序因素至少包括:由所述成果检索词命中的关键词在该关键词所属的二维统计数据中对应的出现频次,以及由所述第二近义词命中的关键词在该关键词所属的二维统计数据中对应的出现频次。
59.可选地,所述管理模块执行的管理还包括:
60.获取所述科技成果文档所属的技术领域内的所有同类科技成果文档;
61.针对每个所述同类科技成果文档,根据该同类科技成果文档的二维统计数据以及所述科技成果文档的二维统计数据,比较该两个科技成果文档的相似程度;
62.根据比较结果,确定并展示所述科技成果文档的技术价值。
63.可选地,所述管理模块执行的管理还包括:
64.根据所述二维统计数据,提取出现频次超出预设门限的关键词作为所述科技成果文档的技术标签,以在展示所述科技成果文档的成果简介时展示所述技术标签。
65.可选地,所述管理模块执行的管理还包括:
66.基于所述科技成果文档的二维统计数据,生成所述科技成果文档的词云,以在展示所述科技成果文档的成果简介时展示所述词云。
67.本发明还提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
68.存储器,用于存放计算机程序;
69.处理器,用于执行存储器上所存放的程序时,实现上述任一种科技成果管理方法所述的方法步骤。
70.本发明的有益效果:
71.本发明提供的科技成果管理方法中,对科技成果文档进行全文关键词的提取;根据预设的技术词典确定每个关键词的第一近义词,并将第一近义词添加至科技成果文档的关键词中;根据科技成果文档的关键词的出现频次以及科技成果文档的关键词在所述技术词典中的位置信息,生成科技成果文档的二维统计数据;基于该二维统计数据对科技成果文档进行管理。由于不同科技成果文档的二维统计数据完全重合的概率极低,故而二维统计数据相当于是从科技成果文档中所加工提取的特征,且该特征是一个统计特征,由此使得基于该统计特征可以直接获取到整个科技成果文档的关键信息,从而可以基于这些关键信息对科技成果文档进行更深度的管理,如机器分类、检索以及匹配等。另外,相较于现有技术依赖人工理解、提取摘要信息的管理方式而言,本发明不依赖人工便可提取整个科技成果文档的关键信息,效率较高。并且,本发明对科技成果文档进行管理所依赖的二维统计数据的产生方式稳定、唯一,减少了人工因素带来的管理效果的差异性。
72.以下将结合附图及实施例对本发明做进一步详细说明。
附图说明
73.图1是本发明实施例提供的一种科技成果管理方法的流程图;
74.图2是本发明实施例中的二维统计数据的示意图;
75.图3是本发明实施例中利用二维统计数据比较两个科技成果文档的相似程度的示意图;
76.图4是本发明实施例中利用阈值从二维统计数据中确定科技成果文档的技术标签的示意图;
77.图5是本发明实施例提供的一种科技成果管理平台的结构示意图;
78.图6是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
79.下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
80.为了在实现科技成果转化的过程中向供需双方以及第三方提供更具深度的数据管理服务,本发明实施例提供了一种科技成果管理方法、平台及电子设备。
81.其中,本发明实施例提供科技成果管理方法的执行主体,可以是一种科技成果管理装置,该装置为本发明实施例提供的科技成果管理平台中的软件模块。可以理解的是,该科技成果管理平台是一个软件平台,可以安装于电子设备中。该电子设备可以是台式计算机、便携式计算机、智能移动终端、服务器等,在此不作限定。任何可以使用本发明实施例所提供的科技成果管理方法的电子设备,均属于本发明实施例所提供的电子设备的范畴。
82.首先,对本发明实施例提供的科技成果管理方法进行详细说明。参见图1所示,该方法包括以下步骤:
83.s1:接收成果供给方或第三方从成果上传入口所上传的科技成果文档。
84.其中,成果供给方例如是在科技成果管理平台注册的校企用户等,第三方例如是在科技成果管理平台注册的技术经理人的账号或其所在公司的账号等。这里说的科技成果文档包括专利、论文等文献,具体形式不限。
85.具体的,科技成果管理平台的软件界面中可以设有一成果上传入口,这样,成果供给方或者第三方便可以利用该入口向科技成果管理平台上传科技成果文档。
86.s11:若科技成果文档为非专利文本,对科技成果文档进行全文关键词的提取。
87.s12:若科技成果文档为专利文本,对专利文本的具体实施方式进行全文关键词的提取。
88.可以理解的是,对于专利文本而言,具体实施方式部分包含了最为全面的信息,因此对该部分进行全文关键词的提取便足以提取到整个专利文本中的关键词。而对于非专利文本而言,由于其内部的格式不定,因此为了避免漏掉某些关键词,采取的是对其全文提取关键词。
89.不同的科技成果文档有时具有不同的文档格式,因此可以先将科技成果文档转换为统一的文档格式,例如转换为方便计算机进行自动识别的.txt格式或.xml格式。然后,基于格式转换后的文档进行关键词的提取。
90.示例性的,在一种实现方式中,可以根据转换后的科技成果文档中的标点符号将科技成果文档拆分为多个句子。然后,使用深度学习模型依次从每个句子中提取关键词。其中,深度学习模型如支持向量机模型、决策树模型、朴素贝叶斯模型等。
91.在该实现方式中,为了使关键词提取准确,可以预先获取大量的科技成果文档,通过对科技成果文档进行语句的拆分,并对句子中的词语进行标注从而形成训练样本。然后使用大量的训练样本对深度学习模型进行训练,从而使用训练完成的深度学习模型完成关键词的提取。
92.在另一种实现方式中,可以使用命名实体识别技术直接从格式转换后的科技成果文档中提取关键字;例如,使用bert bilstm crf来从文档中提取关键字。这里,bert bilstm crf是一种现有的命名实体识别模型。
93.s2:根据预设的技术词典确定每个关键词的第一近义词,并将第一近义词添加至
科技成果文档的关键词中。
94.可以理解的是,该技术词典是一个数字化的技术词典,例如可以是一个预先基于各大常见领域的通用技术词典构建而成的数字化词典。并且,本发明实施例中所构建的该数字化的技术词典中,每个词语都关联了与其语义相同/相近的近义词。这样,利用该技术词典,便可以查询关键词的近义词,即第一近义词。
95.举例而言,在一种实现方式中,技术词典中的数据结构可以包括两个数据表格;其中一个表格用于存放词语,不同词语存放于该表格的不同单元格中;另一个表格则用于存放词语的近义词,不同词语的近义词存放于该表格的不同单元格中,且词语和其近义词的单元格在各自的表格中的编号相同。这样,每个词语和它的近义词之间的关联关系是通过具有相同的单元格编号来实现的。例如,技术词典包括表格a和表格b;其中,在表格a中,第1行第1列的单元格存储的词语为“关键字”,在表格b中,第1行第1列的单元格存储“关键词”、“keyword”以及“保留字”等“关键字”的近义词。
96.在另一种实现方式中,技术词典可以是一个纯文本的文件;该文件中,每一行存储一个词语和该词语的近义词,其中该词语可以位于行首,其近义词位于该词语之后,词语和词语之间使用分隔符间隔开来。例如,该文件中第一行存储的内容为:关键字/关键词/keyword/保留字。其中,“关键字”是该行所存储的词语,后面的“关键词”、“keyword”以及“保留字”均是“关键字”的近义词,分隔符采用的是符号“/”;此外,分隔符还可以使用符号“$”、符号“*”或者符号“#”等。
97.s3:根据科技成果文档的关键词的出现频次以及科技成果文档的关键词在技术词典中的位置信息,生成科技成果文档对应的二维统计数据。
98.其中,科技成果文档的关键词在技术词典中的位置信息可根据技术词典的数据结构来确定。例如,如果是上述包含两个数据表格的技术词典,则关键词在该技术词典中的位置信息即是其所在单元格的编号。由此,生成的二维统计数据可视化之后可以如图2所示。图2中,横轴用于标刻单元格的编号(num),如a1~zn都是单元格的编号,n的大小与技术词典实际存储的词汇量相关,纵轴则用于标刻关键词在科技成果文档中的出现频次(cal)。而如果技术词典是上述的纯文本的文件,则关键词在该技术词典中的位置信息即其所在的行号。
99.可以理解的是,由于步骤s2中已经将第一近义词添加至科技成果文档的关键词中,故而该步骤s3中在利用上述包含两个数据表格的技术词典统计关键词的出现频次时,仅使用表格a进行统计;同理,在使用上述的纯文本的文件统计关键词的出现频次时,仅统计关键词是否命中某行的行首。
100.s4:基于二维统计数据对科技成果文档进行管理,该管理至少包括:为科技成果文档自动匹配成果需求方。
101.可以理解的是,由于不同科技成果文档的二维统计数据完全重合的概率极低,故而二维统计数据相当于是从科技成果文档中所加工提取的特征,且该特征是一个统计特征,由此使得基于该统计特征可以直接获取到整个科技成果文档的关键信息,从而可以基于这些关键信息对科技成果文档进行更深度的管理。
102.其中,基于二维统计数据能够实现的管理工作,除了为科技成果文档自动匹配成果需求方之外,还可以包括多种,例如,基于二维统计数据对科技成果文档进行分类,然后
按类存储;为相同分类的科技成果文档进行类间关联;为科技成果文档添加分类标签;基于二维统计数据进行文档检索以及文档匹配对比等等。
103.另外,相较于现有技术依赖人工理解、提取摘要信息的管理方式而言,本发明实施例不依赖人工便可提取整个文档的关键信息,效率较高。并且,本发明实施例对科技成果文档进行管理所依赖的二维统计数据的产生方式稳定、唯一,减少了人工因素带来的管理效果的差异性。
104.可选地,在一种实现方式中,基于二维统计数据对科技成果文档进行的管理,可以包括:
105.利用预设的分类器对二维统计数据进行分类,得到的分类结果作为科技成果文档所属的技术领域,并为科技成果文档添加领域标签。
106.上述分类器用简单的前馈神经网络即可实现,例如可以用单层感知器实现,或者用多层感知器实现,并不局限于此。将二维统计数据输入到网络中,该网络有m个输入节点,m与二维统计数据的横轴最大刻度相机匹配,每个输入的具体输入值是该刻度对应的词语出现频次;同时,该网络有n个输出节点,n为科技成果文档分类的总个数。
107.在实际应用中,训练分类器只需构建足够多的样本(科技成果文档的真实分类以及科技成果文档的二维统计数据),便可以容易实现对二维统计数据的准确分类。
108.可以理解的是,基于技术领域为科技成果文档自动匹配成果需求方,能够快速地为科技成果文档找到转化出口,从而提高科技成果的转化概率。
109.在实际应用中,用户每上传一个新的科技成果文档时,平台均可以利用该分类器对二维统计数据进行分类,以确定该科技成果文档的技术领域。
110.得到科技成果文档的技术领域后,可以基于该科技成果文档所属的技术领域,为该科技成果文档自动匹配成果需求方。
111.具体而言,成果需求方在进行注册的时候,可以预先填写感兴趣的技术领域。或者,成果需求方可以在科技成果管理平台中发布需求,并在该需求中填写感兴趣的技术领域。由此,若该科技成果文档所属的技术领域在某个成果需求方所需要的技术领域内,则将该科技成果文档匹配至该成果需求方;具体可以是将该科技成果文档推荐给该成果需求方,或者向上传该科技成果文档的用户发送通知,告知已经找到匹配的成果需求方等等。
112.在另一种实现方式中,基于科技成果文档的二维统计数据为科技成果文档自动匹配成果需求方,可以包括:
113.(1)基于科技成果文档的二维统计数据,筛选与该科技成果文档相似的已转化科技成果文档。
114.可以理解的是,已转化科技成果文档,是已经有了对应的成果需求方的科技成果文档。
115.其中,基于该科技成果文档的二维统计数据,筛选与该科技成果文档相似的、已转化科技成果文档,可以包括:
116.根据该科技成果文档的二维统计数据以及每个已转化科技成果文档的二维统计数据,计算该两个文档的相似程度;然后,筛选出相似程度高于预设阈值的已转化科技成果文档。
117.在实际应用中,可以将二维统计数据变换为向量形式,然后利用计算向量相似度
的方式来计算两个文档的相似程度。
118.或者,可以将二维统计数据可视化为直方图,然后用opencv中提供的cv2.comparehist()函数来计算两个直方图的匹配分数,从而利用该匹配分数指代两个文档的相似程度。其中,opencv是一个跨平台计算机视觉和机器学习软件库。可选地,在得到两个直方图的匹配分数并对其进行输出的同时,还可以进一步如图3所示的,将两个直方图叠加可视化显示,两个直方图分别使用不同的颜色,从而使用户直观地看到两个科技成果文档具体是如何相似的。
119.(2)将筛选出的已转化科技成果文档的成果需求方作为与该科技成果文档匹配的成果需求方。
120.可以理解的是,将与科技成果文档相似的已转化科技成果文档的成果需求方匹配给该科技成果文档,可以增加该科技成果文档被该成果需求方选中的机会,从而提高转化概率。
121.另外,为了减少计算量,还可以结合技术领域,先筛选与该科技成果文档属于同一领域的已转化科技成果文档;然后,从初步筛选的已转化科技成果文档中,进一步筛选与该科技成果文档相似的已转化科技成果文档。
122.在一个实施例中,本发明实施例提供的科技成果管理方法,还可以包括:
123.(1)接收目标方输入的至少一个成果检索词;该目标方包括成果需求方、成果提供方或第三方。
124.科技成果管理平台的软件界面中可以设置有检索框,由此成果需求方、成果提供方以及第三方中的任何一方可以向该检索框中输入一个或多个成果检索词,以检索想要的科技成果文档。科技成果管理平台中可以为这三种角色提供不同的用户权限,并给他们均开通检索权限。
125.(2)利用预设的神经网络模型预测这些成果检索词所属的技术领域。
126.其中,该神经网络模型优选使用卷积神经网络(cnn),例如kim-cnn、lenc-cnn或者xml-cnn等,它们都可以实现基于多标签的文本分类。在具体的模型训练过程中,不同的技术领域都可构建大量的多标签样本;每个多标签样本都被构建为一个样本向量,每个样本向量都唯一对应一个技术领域。将构建的多标签样本依次输入到神经网络模型中进行训练,由该神经网络模型预测该多标签样本对应的技术领域;由此,按照此训练过程对神经网络模型进行训练,训练完成的神经网络模型便可以预测未知的多标签文本的技术领域,即预测未知的至少一个成果检索词所属的技术领域。
127.(3)向目标方推荐成果检索词所属的技术领域内的科技成果文档。
128.由此,本发明实施例不仅可以自动为科技成果文档匹配成果需求方,还可以为成果需求方、成果提供方以及第三方中的任何一方提供成果检索服务,从而为成果转化的三方架设桥梁,增加科技成果文档的转化概率。
129.在实际应用中,可以随机地将成果检索词所属的技术领域内的科技成果文档推荐给目标方,或者还可以进一步对该技术领域内的科技成果文档进行排序后,将排序靠前的科技成果文档推荐给目标方。其中,排序规则可以根据科技成果文档的价值度、细分领域和/或公开时间等多种因素进行制定,这都是可以的。
130.可选地,在向目标方推荐所述需求类关键词所属的技术领域内的科技成果文档之
后,若目标方收藏或查看了其中的一个或多个所推荐的目标科技成果文档,则可以进一步基于该目标科技成果文档的二维统计数据对推荐列表进行重新排序,以重点推荐与目标科技成果文档相似的科技成果文档。
131.可以理解的是,基于目标科技成果文档的二维统计数据对推荐列表进行重新排序,即是基于目标科技成果文档与推荐列表中的每个文档双方的二维统计数据的相似度,来对该推荐列表进行排序,具体的相似度计算方式在上文中已经进行过阐述说明,此处不再赘述。
132.可选地,在一种实现方式中,基于二维统计数据对科技成果文档进行的管理,还可以包括:
133.根据二维统计数据,提取出现频次超出预设门限的关键词作为科技成果文档的技术标签,以在展示科技成果文档的简介时展示技术标签。
134.参见图4所示,出现频次超出阈值的关键词有“卷积层”、“卷积核”以及“卷积”,故可以将“卷积层”、“卷积核”以及“卷积”作为科技成果文档的技术标签。
135.可以理解的是,技术标签或者词云均为一种技术摘要信息,将它们进行展示均能够使科技成果管理平台的用户快速获取到科技成果文档的信息。
136.在另一种实现方式中,基于二维统计数据对科技成果文档进行的管理,还可以包括:
137.基于科技成果文档的二维统计数据,生成科技成果文档的词云,以在展示科技成果文档的成果简介时展示该词云。
138.在一个实施例中,本发明实施提供的科技成果管理方法还可以包括:
139.(1)接收目标方输入的至少一个成果检索词;该目标方同样可以包括成果需求方、成果提供方或第三方;
140.(2)根据技术词典确定每个成果检索词的第二近义词;
141.可以理解的是,成果检索词的第二近义词即指的是成果检索词的近义词。因此,这里确定成果检索词的第二近义词的方式,与步骤s2中确定关键词的第一近义词的方式是相同的。
142.(3)筛选关键词含有成果检索词和/或第二近义词的所有科技成果文档。
143.这里,筛选关键词含有检索词和/或第二近义词的所有科技成果文档,包括:筛选关键词含有检索词的科技成果文档、筛选关键词含有一个或多个第二近义词的科技成果文档,以及筛选关键词同时含有检索词以及一个或多个第二近义词的科技成果文档。
144.具体筛选时,针对平台已记录的所有科技成果文档中的每个文档,根据该文档的二维统计数据,即可确定该文档中是否含有检索词和/或第二近义词;如果有,则筛选该文档,否则继续对下个文档执行相同的操作。
145.(4)根据多种排序因素对所筛选的科技成果文档进行综合排序,并展示排序结果。
146.其中,所提到的多种排序因素至少包括:由成果检索词命中的关键词在该关键词所属的二维统计数据中对应的出现频次,以及由第二近义词命中的关键词在该关键词所属的二维统计数据中对应的出现频次。
147.优选地,在按照上述多种排序因素进行排序时,由检索词命中的关键词在所属二维统计数据中对应的出现频次可以作为首要排序因素,称为第一排序因素,由第二近义词
命中的关键词在所属二维统计数据中对应的出现频次可以作为次要排序因素,称为第二排序因素。
148.例如,假设关键词“期望”在文档a的二维统计数据中对应的出现频次为5,关键词“期望”在文档b的二维统计数据中对应的出现频次为8,第二近义词“均值”在文档c的二维统计数据中对应的出现频次为4,第二近义词“平均值”在文档d的二维统计数据中对应的出现频次为3;那么,根据“期望”的出现频次,文档b(频次为8)应排在第一位,文档a(频次为5)应排在第二位;根据其余第二近义词的出现频次,文档3(频次为4)排在第三位,文档4(频次为3)排在第四位。另外,若在几个文档间出现了第二近义词的出现频次相等的情况,则可以将这几个文档随机排序,或者增加新的排序因素对它们进行再次排序。可选地,新增加的排序因素可以包括:上传科技成果文档时为文档设置的价制度、领域热门程度以及词语拼音首字母等,并不局限于此。
149.此外,在按照上述过程排序完成后,还可以在平台的显示界面中提供筛选标签以及人工选择排序规则的功能选项,以便用户对界面展示的排序结果进行二次筛选或排序。
150.在一个实施例中,在基于维统计数据确定了科技成果文档的技术领域之后,基于二维统计数据对科技成果文档能够进行的管理,还可以包括:
151.(1)获取科技成果文档所属的技术领域内的所有同类科技成果文档。
152.(2)针对每个同类科技成果文档,根据该同类科技成果文档的二维统计数据以及科技成果文档的二维统计数据,比较该两个科技成果文档的相似程度。
153.这里,比较相似度的方式在上文中已经进行过阐述说明,此处不再赘述。
154.(3)根据比较结果,确定并展示该科技成果文档的技术价值。
155.举例而言,可以根据与该科技成果文档最为相似的同类科技成果文档与该科技成果文档的相似度,确定该科技成果文档的技术价值。具体的,可参照下表1所示的相似度区间来确定该科技成果文档的技术价值。
156.表1
[0157][0158]
需要说明的是,该表1中所示出的相似度区间以及评价结果仅仅作为示例,并不构成对本发明实施例的限定;实际中可参考技术评审专家的意见对该表1进行调整。
[0159]
或者,也可以从与该科技成果文档相似的同类科技成果文档的数量这一角度来评价该科技成果文档的技术价值。
[0160]
具体而言,预先设定一参考相似度,若计算的相似度高于该参考相似度,则认为两个文档相似,否则认为不相似;这样,可以统计出该科技成果文档相似的同类科技成果文档的数量;然后,将该科技成果文档的技术价值初始化为一个相对居中的分数或等级;若相似的同类科技成果文档较多,则该科技成果的技术价值减分或降级,若相似的同类科技成果文档较多,则该科技成果的技术价值加分或升级;并且,还可以根据相似的各个同类科技成果文档的技术价值继续调整该科技成果的技术价值:同类科技成果文档的技术价值高则为该科技成果文档的技术价值加分或升级,同类科技成果文档的技术价值低则为该科技成果文档的技术价值减分或降级;由此,便可以计算出该科技成果最终的技术价值。
[0161]
在实际中,构建科技成果管理平台时,可以预先聘请技术专家对已有的大量科技成果文档进行技术价值的评定;后续将该科技成果管理平台投入使用后,便可以按照上文所示的,通过比较科技成果文档与其同科技成果文档的相似度的方式来评价该科技成果文档的技术价值。
[0162]
相应于上述的科技成果管理方法,本发明实施例还提供了一种科技成果管理平台,如图5所示,该平台包括:
[0163]
第一接收模块10,用于接收成果供给方或第三方从成果上传入口所上传的科技成果文档;
[0164]
关键词提取模块20,用于在该科技成果文档为非专利文本时,对该科技成果文档
进行全文关键词的提取,在该科技成果文档为专利文本时,对该专利文本的具体实施方式进行全文关键词的提取;
[0165]
近义词扩展模块30,用于根据预设的技术词典确定每个关键词的第一近义词,并将第一近义词添加至该科技成果文档的关键词中;
[0166]
统计模块40,用于根据该科技成果文档的关键词的出现频次以及该科技成果文档的关键词在该技术词典中的位置信息,生成该科技成果文档的二维统计数据;
[0167]
管理模块50,用于基于该二维统计数据对该科技成果文档进行管理,该管理至少包括:为该科技成果文档自动匹配成果需求方。
[0168]
可选地,该管理模块50执行的管理还包括:
[0169]
利用预设的分类器对该二维统计数据进行分类,得到的分类结果作为该科技成果文档所属的技术领域,并为该科技成果文档添加领域标签;
[0170]
该管理模块50为该科技成果文档自动匹配成果需求方的方式,包括:
[0171]
基于该科技成果文档所属的技术领域,为该科技成果文档自动匹配成果需求方。
[0172]
可选地,该装置还包括:第二接收模块、预测模块以及推荐模块;
[0173]
该第二接收模块,用于接收目标方输入的至少一个成果检索词;该目标方包括成果需求方、成果提供方或第三方;
[0174]
该预测模块,用于利用预设的神经网络模型预测成果检索词所属的技术领域;
[0175]
该推荐模块,用于向该目标方推荐成果检索词所属的技术领域内的科技成果文档。
[0176]
可选地,该管理模块50,基于二维统计数据对该科技成果文档进行管理,包括:
[0177]
在向目标方推荐需求类关键词所属的技术领域内的科技成果文档之后,响应于目标方收藏了一个或多个所推荐的目标科技成果文档,基于目标科技成果文档的二维统计数据对推荐列表进行重新排序,以重点推荐与目标科技成果文档相似的科技成果文档。
[0178]
可选地,该装置还包括:第二接收模块、文档筛选模块和排序展示模块;
[0179]
该第二接收模块,用于接收目标方输入的至少一个成果检索词;目标方包括成果需求方、成果提供方或第三方;
[0180]
该近义词扩展模块30,还用于根据技术词典确定每个成果检索词的第二近义词;
[0181]
该文档筛选模块,还用于筛选关键词含有成果检索词和/或第二近义词的所有科技成果文档;
[0182]
该排序展示模块,还用于根据多种排序因素对所筛选的科技成果文档进行综合排序,并展示排序结果;
[0183]
其中,该多种排序因素至少包括:由成果检索词命中的关键词在该关键词所属的二维统计数据中对应的出现频次,以及由该第二近义词命中的关键词在该关键词所属的二维统计数据中对应的出现频次。
[0184]
可选地,该管理模块50执行的管理还包括:
[0185]
获取该科技成果文档所属的技术领域内的所有同类科技成果文档;
[0186]
针对每个同类科技成果文档,根据该同类科技成果文档的二维统计数据以及该科技成果文档的二维统计数据,比较该两个科技成果文档的相似程度;
[0187]
根据比较结果,确定并展示该科技成果文档的技术价值。
[0188]
可选地,该管理模块50执行的管理还包括:
[0189]
根据二维统计数据,提取出现频次超出预设门限的关键词作为该科技成果文档的技术标签,以在展示该科技成果文档的成果简介时展示该技术标签。
[0190]
可选地,该管理模块50执行的管理还包括:
[0191]
基于该科技成果文档的二维统计数据,生成该科技成果文档的词云,以在展示该科技成果文档的成果简介时展示该词云。
[0192]
本发明实施例提供的科技成果管理平台,对科技成果文档进行全文关键词的提取;根据预设的技术词典确定每个关键词的第一近义词,并将第一近义词添加至科技成果文档的关键词中;根据科技成果文档的关键词的出现频次以及科技成果文档的关键词在所述技术词典中的位置信息,生成科技成果文档对应的二维统计数据;基于二维统计数据对科技成果文档进行管理。由于不同科技成果文档的二维统计数据完全重合的概率极低,故而二维统计数据相当于是从科技成果文档中所加工提取的特征,且该特征是一个统计特征,由此使得基于该统计特征可以直接获取到整个科技成果文档的关键信息,从而可以基于这些关键信息对科技成果文档进行更深度的管理,如机器分类、检索以及匹配等。另外,相较于现有技术依赖人工理解、提取摘要信息的管理方式而言,本发明实施例提供的科技成果管理平台不依赖人工便可提取整个文档的关键信息,效率较高。并且,该平台对科技成果文档进行管理所依赖的二维统计数据的产生方式稳定、唯一,减少了人工因素带来的管理效果的差异性。
[0193]
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
[0194]
存储器603,用于存放计算机程序;
[0195]
处理器601,用于执行存储器603上所存放的程序时,实现上文所述的任一种科技成果管理方法。
[0196]
上述电子设备提到的通信总线可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0197]
通信接口用于上述电子设备与其他设备之间的通信。
[0198]
存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non-volatile memory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0199]
上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0200]
对于科技成果管理平台/电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0201]
应用本发明实施例所提供的电子设备,可以展示专有名词和/或固定词组供用户选择,进而减少用户输入时间,提高用户体验。
[0202]
该终端设备以多种形式存在,包括但不限于:
[0203]
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iphone)、多媒体手机、功能性手机,以及低端手机等。
[0204]
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:pda、mid和umpc设备等,例如ipad。
[0205]
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如ipod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
[0206]
(4)其他具有数据交互功能的电子装置。
[0207]
术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0208]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。此外,本领域的技术人员可以将本说明书中描述的不同实施例或示例进行接合和组合。
[0209]
尽管在此结合各实施例对本技术进行了描述,然而,在实施所要求保护的本技术过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在说明书中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。相互不同的实施例中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
[0210]
本领域技术人员应明白,本技术的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式,这里将它们都统称为“模块”或“系统”。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中,与其它硬件一起提供或作为硬件的一部分,也可以采用其他分布形式,如通过internet或其它有线或无线电信系统。
[0211]
本技术是参照本技术实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0212]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0213]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0214]
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献