一种基于多源数据融合计算的领域引擎技术识别方法与流程

2023-03-20 09:20:09 来源：中国专利 TAG：

技术特征：
1.一种基于多源数据融合计算的领域引擎技术识别方法，其特征在于，包括以下步骤：s1：基于数据库中海量多源异构数据，获取对应技术的指标参数信息；s2：构建所述技术具有可计算的量化识别指标体系，将步骤s1中的指标参数进行量化；s3：对步骤s2中指标参数的计算结果进行标准化处理；s4：将标准化处理后的指标参数，通过建立的引擎技术识别模型，对指标参数进行分配权重，从而获得输出值，由输出值判断所述技术是否为引擎技术。2.根据权利要求1所述一种基于多源数据融合计算的领域引擎技术识别方法，其特征在于，根据所述步骤s1中所述技术的指标参数信息包括：技术新闻数量：通过新闻媒体平台等发布所述技术的新闻数量；平均技术专利数量：所述技术所在的技术领域在一定时间段内每年相关专利平均授权数量；专利市场价值覆盖范围专利被引率：所述技术所在技术领域内相关专利被引用的频率；专利转化率是指所述技术所在的技术领域下的相关专利发生转移的情况；技术成熟度是指所述技术在未来的发展潜力；相关专利新颖度：所述技术所在技术领域的技术类别分布判断技术的成长性；专利市场价值覆盖范围：所述技术所在技术领域下相关专利在我国gdp与发达国家gdp的比值；创新度技术成长率：所述技术在一定时间段内申请积累量和授权积累量的比例；横纵向项目数量：通过所述技术所获国家或企业基金项目数量；论文平均被引次数：采用所述技术撰写的论文被引从次数；产学研合作比率：校企合作的论文占所有采用所述技术撰写论文的比例；技术领域覆盖范围：所述技术主题下的相关专利技术领域分布数量；行业拓展程度：通过所述技术专利数量增长速度，反映技术拓展速度。3.根据权利要求1所述一种基于多源数据融合计算的领域引擎技术识别方法，其特征在于，所述步骤s2中构建三级量化识别指标体系，具体包括以下步骤：根据近三年内关于所述技术新闻数量，计算技术新闻增长率量化指标n，其计算公式为：其中，n
a
为当年发布所述技术相关的新闻数量，n
a-1
为前一年发布所述技术相关的新闻数量，n
a-2
为前两年发布所述技术相关的新闻数量，该指标反应技术的市场关注程度；根据近三年涉及所述技术的相关专利数量，计算平均技术专利数量量化指标zcs，其计算公式如下：其中，zcs
t
为近三年所述技术相关专利数量，zcs
p
为所述技术在指定时段下专利数量；专利市场价值覆盖范围量化指标zgdp
m
计算公式如下：
其中，gdp
i
为所述技术在近三年内在第i个国家指定年度下的生产总值，为所述技术在近三年内在i个国家指定年度下的生产总值，gdp
a
为中国在制定年度下的生产总值；该指标值越大说明所述技术的市场价值越高；专利被引率量化指标pcs计算公式如下：其中，pcs
a
为所述技术在近三年内被专利引用的数量统计，pcs
n
为指定时段下所述技术专利申请总量；专利转化率pts量化指标计算公式如下：其中，ptsn为近三年所述技术相关专利发生专利转移的专利数量，tsn为指定时段内所述技术相关许可专利数量；技术成熟度量化指标zs具体计算公式为：其中，m
a
为所述技术在当年申请相关发明专利数量，m
b
为所述技术在当年申请相关实用新型专利数量，该指标越高，成熟度越低；相关专利新颖度量化指标zn具体计算公式为：其中，c＝{1,2,
……
，i}，1≤i；具体为，c为所述技术发展的所有年度数学集合，i表示在集合c的第i年度，y
i
为所述技术在第i年度内申请的相关专利的数量，n为所述技术在所有年度相关专利的总数，该指标越大，新颖度越高；其中创新度量化指标zo具体计算公式为：其中，b
j
为该专利在近三年内引用的专利属于技术类别的数量与总引用数量的比例，s
b
为所述技术下的引用专利类别的数学集合，该指标越大，创新度越高；技术成长率量化指标tg具体计算公式为其中，tn为所述技术在当年专利申请数量，ta为所述技术在近三年专利申请数量；项目数量增长率量化指标具体计算公式为：
其中，tc
a
为所述技术在当年获得横纵向项目数量，tc
a-1
为所述技术在前一年获得横纵向项目数量，tc
a-2
为所述技术在前两年获得横纵向项目数量，该指标越大，说明产业优势性越高；论文平均被引次数pci
p
量化指标计算公式为：其中，pc为所述技术在近三年内科技论文中被引次数，n为指定时段下所述技术的相关论文被引次数，该指标值越大，说明所述技术的科学研究创新性越高；相关论文数量增长率pgr量化指标具体计算公式为：其中，pgr
a
为所述技术在当年相关科技论文的分布总数，pgr
a-1
为所述技术在前一年相关科技论文的分布总数，pgr
a-2
为所述技术在前两年相关科技论文的分布总数；产学研合作比率trcr量化指标计算公式为：其中，trcn是所述技术在相关论文中作者单位出现企业和高校研究所的数量，pr是所述技术在指定时段下相关科技论文总数量；行业拓展程度为技术领域增长率tfgr量化指标具体计算公式为：其中，tfgr
a
为所述技术在当年相关专利在各技术领域的数量，tfgr
a-1
为所述技术前一年相关专利在各技术领域的数量，tfgr
a-2
为所述技术前两年相关专利在各技术领域的数量。4.根据权利要求1所述一种基于多源数据融合计算的领域引擎技术识别方法，其特征在于，所述步骤s3中指标数据标准化处理，具体包括：s31：当指标数据为0-1型数据：0-1型数据由于结果本身已映射在0,1区间内，不需要进一步进行标准化处理；s32：当指标数据为区间型[-∞, ∞]数据：由于区间型[-∞, ∞]数据不在区间范围[0,1]内，需要进行标准化处理。公式中x
i
为对应数据类型的原始值，p
i
为标准化后的输出值；s33：当指标数据为占比型数据：占比型数据不严格落在[0,1]标准化区间范围内，需进行标准化处理：
公式中x
i
为对应数据类型的原始值，p
i
为标准化后的输出值，为该量化数据指标的平均数值；s34：当指标数据为绝对数值指标：绝对数值类型指标处理分为两部分，平均技术专利数量横纵向项目数量、项目数量增长率、论文平均被引次数以平均值参考值进行标准化处理，步骤如下：公式中x
i
为对应数据类型的原始值，p
i
为标准化后的输出值，为该量化数据指标的平均数值；s35：专利市场价值覆盖范围数据指标和技术领域覆盖范围不适合平均值进行标准化，需单独划设阈值进行标准化处理：专利市场价值覆盖范围量化数据指标标准化处理如下：公式中x
i
为对应数据类型的原始值，p
i
为标准化后的输出值；s36：技术领域覆盖范围量化数据指标标准化处理如下：公式中x
i
为对应数据类型的原始值，p
i
为标准化后的输出值。5.根据权利要求1所述一种基于多源数据融合计算的领域引擎技术识别方法，其特征在于，所述步骤s4包括以下步骤：s41：建立引擎技术识别输出模型；通过输出函数确定所述技术的输出值，具体输出函数如下所示：式中,k指代具体某类具体所述技术，所述技术中对应标准化指标参数为c
jk
，j指代具体某类具体所述技术可量化识别指标对应的标号，该标号对应的标准化指标参数的指标权重为h
jk
，s42：明确步骤s2中可计算性的量化识别指标体系下的各指标数据类型，并通过量化指
标体系进行计算，通过指标数据类型对其重新分类，一一映射在对应到步骤s41中，确定j的分类，并将对应的指标数据对应导入c
jk
；s43：基于主观赋权法思想，使用层次分析法，确定在所述技术在预测领域范畴下的引擎识别技术指标的权重，对权重计算结果进行标准化取值，一一映射在对应到步骤s41中h
jk
的值；s44：通过步骤s42和步骤s43确定指标数据c
jk
和对应指标数据的权重h
jk
，在由输出函数计算可得最终的输出值，对输出值建立不同区间识别结果作为参考标准，根据输出值匹配识别。6.根据权利要求5所述一种基于多源数据融合计算的领域引擎技术识别方法，其特征在于，所述步骤s44中对输出值建立的识别区间，具体为：当输出值m＝(0.6,1.0]；则说明所述技术为引擎技术；当输出值m＝(0.4,0.6]；则不确定所述技术是否为引擎技术；当输出值m＝[0,0.4]；则说明所述技术为非引擎技术。

技术总结
本发明涉及引擎技术识别技术领域，具体为一种基于多源数据融合计算的领域引擎技术识别方法，包括如下步骤：基于数据库中海量多源异构数据，获取对应技术的指标参数信息；构建所述技术具有可计算的量化识别指标体系，将指标参数进行量化；对量化的指标参数的计算结果进行标准化处理；将标准化处理后的指标参数，通过建立的引擎技术识别模型，对指标参数进行分配权重，从而获得输出值，由输出值判断所述技术是否为引擎技术。本发明实现了利用融合计算思想，对多源异构数据环境下引擎技术进行准确识别，对在多源异构的复杂数据环境下识别具有强关联带动性和产业影响力的引擎技术方面具有一定的指导及借鉴意义。具有一定的指导及借鉴意义。具有一定的指导及借鉴意义。

技术研发人员：李海坤杨璐绮
受保护的技术使用者：烽火乾坤科技（南京）有限公司
技术研发日：2022.12.21
技术公布日：2023/3/10

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种基于线程的程序执行过程剖析方法和系统与流程

一种基于多源数据融合计算的领域引擎技术识别方法与流程

相关文献

最热文献