基于机器学习的用户定制型专利文献自动分类方法、装置及系统与流程

2021-11-27 02:43:00 来源：中国专利 TAG：

1.本说明书提出一种用于学习用户的专利文献分类模式并构建分类模型，利用构建的分类模型对专利文献自动分类的方法及用于其的系统/装置。

背景技术：

2.近来，可用于各种领域的机器学习(machine learning)取得了很大发展。这种机器学习作为人工智能的一个领域，根据其类型分为监督学习(supervised learning)、非监督学习(unsupervised learning)、强化学习(reinforcement learning)等，已经开发出了人工神经网络(artificial neural network)、推进(boosting)、决策树(decision tree)、支持向量机(support vector machine)、随机森林(random forests)等多种方式的算法。
3.人工神经网络包括输入层(input layer)、隐藏层(hidden layer)及输出层(output layer)，根据堆积隐藏层的方法分为浅层神经网络(shallow neural network)与深度神经网络(deep neural network)。并且，深度神经网络中作为更加改进的人工神经网络开发出了卷积神经网络(convolutional neural network，
‘
convnet’)、循环神经网络(recurrent neural network)、深度信念网络(deep belief network)、深层q神经网络(deep q
‑
network)等，这些人工神经网络(包括深度神经网络)的机器学习方式通常被称为深度学习(deep learning)。即，深度学习是利用与脑神经元相似的信息输入输出层对数据进行学习，是指通过多种非线性变换技术的组合尝试高层次的抽象化的机器学习。

技术实现要素：

4.技术问题
5.近来随着基于专利的多种业务/项目非常活跃，对专利按技术进行分类的作业非常多。各国专利局按专利文献指定技术分类码(ipc，cpc等)进行技术分类，但这种技术分类码是任意指定的，与实际专利文献公开的技术不匹配的情况非常多，不仅与实际产业及产品的匹配程度低，而且由于与用户要分类的基准不符，因此实际上并不怎么用于实际分类作业。其结果，用户需要亲自了解所有分类对象专利并进行分类作业，因此存在需要消耗大量时间及费用/人工的问题。
6.并且，存在专利持有人(个人/公司)仅根据自己的专利战略按技术区别设置存续期限的情况。该情况下，专利持有人需要亲自算出终止的专利文献的各种技术的存续/终止平均期限，需要对还未决的专利文献按技术分类后适用之前算出的各种技术的存续期限。这不仅消耗大量时间与费用/人工，而且持有的专利多的情况下还存在其存续期限管理非常困难的问题。
7.技术方案
8.根据本发明的一个实施例，可包括：通过机器学习技术学习存储在专利数据库的专利文献，基于所述专利文献之间的近似度确立第一分类基准，基于所述第一分类基准生
成对所述专利文献进行分类的基本分类模型的步骤；根据用户的检索及/或选择输入生成包括多个专利文献的专利池的步骤；接收所述用户的分类输入，并根据所述分类输入对包含在所述专利池的多个专利文献进行分类的步骤；根据分类的所述专利文献之间的近似度预测所述用户对所述多个专利文献进行分类的第二分类基准的步骤；以及根据所述基本分类模型及所述第二分类基准对所述专利池中还未分类的其余专利文献进行分类的步骤。
9.技术效果
10.根据本发明的一个实施例，学习用户的分类基准并预测用户期望的分类基准后自动地对专利文献进行分类，因此具有能够显著节省用户对专利文献进行分类所消耗的时间/努力/费用/不便的效果。
11.并且，根据本发明的一个实施例，按技术学习用户曾持有的专利权的终止模式并按技术预测用户期望的各种技术的存续期限，预测当前未决的专利权的终止期限，因此具有用户更容易、高效地管理当前持有的专利的存续期限的效果。
12.此外还存在本发明的多种实施例的效果，以下参见各附图对此进行说明。
附图说明
13.图1为例示本发明的一个实施例的专利检索引擎的专利文献检索结果画面的例示图；
14.图2为例示本发明的一个实施例的滑动视图画面的示意图；
15.图3为例示本发明的一个实施例的专利文献分类系统的专利文献分类方法的流程图；
16.图4为例示本发明的一个实施例的基于用户的分类输入的专利文献分类方法的示意图；
17.图5为例示本发明的一个实施例的文件夹设定ui的示意图；
18.图6为例示根据本发明的一个实施例进行文件夹设置时专利文献的代表信息表示方法的示意图；
19.图7为例示本发明的一个实施例的基于用户的分类输入的专利文献分类方法的示意图；
20.图8为例示本发明的一个实施例的分类历史窗的示意图；
21.图9为例示本发明的一个实施例的多文件夹存储方式的示意图；
22.图10为例示根据本发明的一个实施例预测专利文献的终止期限的实施例的流程图；
23.图11为例示本发明的一个实施例的专利终止推荐列表的示意图；
24.图12为示出本发明的一个实施例的专利文献分类系统的框图；
25.图13为示出本发明的一个实施例的专利文献分类系统的框图。
具体实施方式
26.可对以下说明的技术施加多种变更且可以具有多种实施例，在图中例示特定实施例且进行详细说明。然而，目的并非将以下说明的技术限定于特定的实施方式，应理解为包括以下说明的技术的思想及技术范围所包括的所有变更、均等物乃至替代物。
27.第一、第二、a、b等术语可用于说明多种构成要素，但这些构成要素不限于所述术语，使用目的只是使得一个构成要素区分于其他构成要素。例如，在不超出以下说明的技术的权利范围的情况下第一构成要素可被命名为第二构成要素，类似地，第二构成要素也可以被命名为第一构成要素。术语“及/或”包括多个相关记载的项目的组合或多个相关记载项目中的任意一个项目。
28.本说明书中使用的术语中单数表述在文中无其他明确解释的情况下应理解为包括多数表述，“包括”等术语是用于表示存在所述的特征、个数、步骤、动作、构成要素、部件或其组合，并不排除一个或多个其他特征或个数、步骤、构成要素、部件或其组合的存在或附加可能性。
29.在对附图进行详细说明之前，首先声明本说明书中构成部的区分是按各构成部所起到的主要功能进行区分的。即，以下要说明的两个以上构成部可合成为一个构成部或一个构成部按照更细化的功能分化成两个以上。并且，以下要说明的各构成部除了自己负责的主要功能之外还可以进一步地执行其他构成部负责的功能中的一部分或全部功能，各构成部负责的主要功能中一部分功能可以由其他构成部专门负责执行。
30.并且，在执行方法或动作方法方面，构成所述方法的各过程在文中未明确记载特定顺序的情况下，还可以按照与明确记载的顺序不同的顺序执行。即，各过程可按照与明确记载的顺序相同的顺序执行，可以实质上同时执行，也可以按照相反顺序执行。
31.本发明基于提供专利检索引擎的网页/服务器(或通过这种网页/服务器实现专利检索功能的计算机程序/应用程序)。因此，本说明书中记载的实施例可通过网页服务器、应用程序服务器及/或客户端设备执行，可将其包括的系统统称为
‘
专利文献分类系统’。
32.以下为了便于说明，按执行实施例的主体为
‘
专利检索引擎’或
‘
专利文献分类系统’进行说明，但可替代成网页服务器、应用程序服务器及/或客户端设备进行说明。并且，以下为了便于说明，基于通过网页提供的专利检索引擎进行说明，但不限于此，还可以适用于通过应用程序提供的专利检索引擎，这是显而易见的。
33.首先，介绍作为本发明的基础的专利检索引擎的基本功能及图形用户界面(graphic user interface，gui)后，对专利文献自动分类方法进行详细说明。
34.图1为例示本发明的一个实施例的专利检索引擎的专利文献检索结果画面的示意图。
35.本发明的专利检索引擎可在一个画面上提供根据用户的检索输入检索到的关于专利的多种信息。
36.例如，如图1所示，专利检索引擎为专利文献检索结果，可提供按国家/按状态检索到的专利文献数130与所有或按国家检索到的专利文献列表140等。尤其，专利检索引擎在提供专利文献列表140时，可以一并提供关于各专利文献的著录信息(申请国家、申请/授权号、种类、申请日期、当前状态(申请/公开/授权等)、发明名称等)。
37.并且，专利检索引擎可提供用于用户对检索到的专利文献进行多种附加作业的运行键标签120。例如，如图1所示，专利检索引擎可提供滑动视图110、包括用于work存储、图像引擎、下载及列表输出作业的运行键的运行键标签120。
38.其中，滑动视图110提供将代表各专利文献的信息(例如，摘要附图、摘要信息、独立权利要求等)简要构成为一个画面编制目录使得用户能够更容易了解检索到的专利文献
的功能，用户通过该功能能够更容易了解专利文献。以下参见图2对此进行更详细的说明。
39.work存储用于提供将专利文献存储到特定文件夹的功能，可用于在本说明书中提出的专利文献分类作业。图像引擎用于提供汇集用户选择的专利文献并按照用户期望的基准生成图表或算出统计的功能。下载用于提供下载专利文献的功能，列表输出用于提供输出检索的专利文献的列表、摘要信息等的功能。
40.此外，专利检索引擎能够提供用于指示利用专利文献的多种附加作业的运行键，不限于上述实施例。
41.图2为例示本发明的一个实施例的滑动视图画面的示意图。
42.参见图2，滑动视图画面大致可以由高亮窗210、项目窗220、摘要附图窗230、专利文献代表内容窗250、专利列表窗240构成。
43.高亮窗210提供在各专利文献强调表示用户输入的特定关键字/检索词的功能。项目窗220是能够管理(生成及编辑等)用户生成的多种上位/下位文件夹的项目窗。用户可通过将专利文献存储到期望的文件夹对专利文献进行分类，可按文件夹管理专利文献。
44.摘要附图窗230用于提供显示对象专利文献的摘要附图的功能，专利文献代表内容窗250执行简要提供了解对象专利文献所需的代表性的信息的功能。用户可通过这种摘要附图窗230及专利文献代表内容窗250一并轻易了解对象专利文献的特征及技术内容。
45.专利列表窗240是用于提供用户欲通过滑动视图查看而所选择的专利文献的列表的窗。通过这种专利列表窗230，用户可了解当前池中含有哪些专利文献、含有多少，而且还可以知道其中当前用户正在查看的专利文献是什么文献。
46.以上对作为本发明的基础的专利检索引擎做了简单说明。以下所述的本发明的实施例可基于这种专利检索引擎执行/提供，尤其专利分类系统及方法可作为滑动视图画面内的一个功能提供。但是，本发明并不是限定性地适用于上述专利检索引擎，还可以相同/类似地适用于各种专利检索引擎/网页，这是显而易见的。
47.图3为例示本发明的一个实施例的专利文献分类系统的专利文献分类方法的流程图。
48.参见图3，首先，专利文献分类系统可通过机器学习(machine learning)技术对存储在专利数据库的部分或所有专利文献进行学习。并且，专利文献分类系统可根据基于机器学习技术学习的专利文献之间的近似度确立第一分类基准，按照确立的第一分类基准生成对专利文献进行分类的基本分类模型(s301)。
49.专利文献分类系统可利用多种机器学习技术学习专利文献。作为机器学习技术的一个实施例可采用循环神经网络(recurrent neural networks，rnns)技术、深度神经网络(deep neural networks，dnns)及/或卷积神经网络(convolutional neural networks，cnns)等。rnns(recurrent neural networks)技术是从字、遗传基因、手写字、语音信号、传感器感测的数据、文本、股价等具有一定排列(sequence或时间序列数据)形态的数据中识别模式的人工神经网络。在rnns技术中，同时考虑当前输入的数据与过去输入的数据，排列的信息存储到rnns的隐藏层，存储到隐藏层的信息可在一定时间后接收到需要存储的信息的输入的情况下再次被利用。dnns表示具有两个以上这种隐藏层的学习方法。在dnns中计算机可通过反复执行自主制成分类表且扭曲空间并区分数据的过程导出最佳的区分线。cnns技术是应用这种dnns的算法，后续在s306步骤中对此进行更具体的说明。
50.专利文献分类系统在学习专利文献之前，可利用翻译引擎将专利文献翻译成共同的一种语言(例如，韩文或英文)，可用统一的一种语言学习专利文献。但不限于此，专利文献分类系统也可以利用翻译引擎翻译成最多两种语言并学习专利文献。
51.专利文献分类系统在判断专利文献之间的近似度时，可基于各专利文献的同族专利文献、专利分类码(例如，ipc、cpc等)、现有专利文献、审查阶段引用的专利文献、其他专利文献的审查过程中被引用的专利文献、(通过文本挖掘提取的)关键字及/或文本数据等进行判断。此时，可利用word emdedding、word2vec之类的算法对文本数据矢量化。
52.专利文献分类系统为了算出专利文献之间的近似度，可采用余弦系数(cosine coefficient)、杰卡德系数(jaccard coefficient)、骰子数(dice coefficient)、欧几里得距离(euclidean distance)、向量内积(vector inner product)等。根据实施例，可能会存在需要按照分类(或聚类)技术利用特定近似度测定方法的情况，例如，利用欧几里得距离测定文献之间的距离的ward技术与通过内积计算近似度的组平均技术等相当于所述技术，采用不同的近似度测定方法的情况下属于各分类(或簇)的专利文献(或成分)可能会不同。
53.之后，专利文献分类系统可根据用户的检索及/或选择输入生成包括多个专利文献的专利池(pool)(s302)。专利池中包括的多个专利文献可成为以下说明的用户的分类对象文献。
54.之后，专利文献分类系统可接收用户的分类输入(s303)，根据分类输入对专利池中包括的多个专利文献进行分类(s304)。专利文献分类系统可根据用户的文件夹生成输入生成至少一个文件夹，根据用户的分类输入将专利池的专利文献分别存储到各文件夹(或移动到文件夹)进行分类作业。分类输入为用于用户对专利文献进行分类的各种用户输入，可以有多个实施例，作为一个实施例，用户可通过执行向文件夹侧拖放专利文献的动作/触摸输入简单地进行分类作业。作为另一实施例，分类输入可相当于对专利文献分类系统提供的立即存储键的用户输入。其中，立即存储键可相当于由专利文献分类系统提供的用户能够将专利文献立即存储到自己所需的文件夹进行分类的ui。可以对于每个专利文献提供立即存储键。作为又一实施例，分类输入为用于以切换(toggling)方式对对象专利文献进行分类的输入，例如，可相当于对o或x的用户输入。用户可通过对对象专利文献选择/输入o或x以分类成两种分类(例如，o或x)。分类项(o或x)为由用户直接设定或由网页/应用程序服务器作为预设项提供。后续将参见图4及图7对分类输入的实施例进行更详细的说明。
55.之后，专利文献分类系统可根据分类的专利文献之间的近似度预测用户对专利文献进行分类的第二分类基准(s305)。基于近似度的第二分类基准的预测方法可以与以近似度为基准确立第一分类基准的方式相同/相似地执行。
56.之后，专利文献分类系统可根据基本分类模型及第二分类基准对专利池中还未分类的其余专利文献进行分类(s306)。
57.更具体来讲，作为一个实施例，专利文献分类系统可将预测到的第二分类基准结合到基本分类模型构建用户定制型分类模型。用户定制型分类模型可基于迁移学习(transfer learning)构建得到。迁移学习可主要利用预先学习的模型(pre
‑
trained model)，预先学习的模型是指已经用具有解决相似的课题的目的且尺寸大的数据学习完的模型。尤其，在本说明书中用于迁移学习的预先学习模型具有卷积神经网络
(convolutional neural networks；cnns)结构。这种cnn由如下两种部分构成。
58.‑
卷积基础(convolutional base)：卷积层与池化层叠成多层的部分。convolutional base的目标是从数据有效提取特征(feature extraction)。
59.‑
分类器(classifier)：主要由全连接层(fully connected layer)构成。全连接层是指所有层的神经元与上一层的输出节点一个不漏地全部连接的层。classifier的最终目标是好好学习所提取到的特征以将数据分类成相符的类别(image classification)。
60.专利文献分类系统可利用这两种部分构建用户定制型分类模型，尤其，可采用固定convolutional base只新学习classifier的战略构建用户定制型分类模型。这种战略在计算运算能力不足或数据组过小时，及/或我要解决的问题与预先学习模型已经学习的数据组非常相近时可有效利用。
61.将其适用于本实施例的情况下，专利文献分类系统可将基本分类模型作为convolutionalbase固定后将第二分类基准作为classifier新学习以构建用户定制型分类模型。其中，所谓固定基本分类模型，可解释为固定根据基本分类模型的第一分类基准将专利池的专利文献预分类为用户生成的文件夹数的特征/基准。因此，基于第一分类基准的预分类特征/基准被固定，将基于第二分类基准的分类特征/基准作为classifier新学习以构建用户定制型分类模型。
62.作为另一实施例，专利文献分类系统也可以不像所述实施例学习用户分类的专利文献，而是只利用基本模型对专利文献进行分类。该情况下，专利文献分类系统可根据基本分类模型算出用户分类的专利文献之间的技术距离，根据算出的技术距离预测第二分类基准(即，不需要学习)。专利文献分类系统可以如上根据基于基本分类模型预测的所述第二分类基准对其余专利文献进行分类。例如，用户将专利池中部分专利文献分类为四个分类的情况下，专利文献分类系统可根据基本分类模型提取属于四个分类的专利群的特征，可根据这样提取的基本分类模型中各专利群的特征对其余专利文献自动分类。根据本实施例，可以最终将第二分类基准解释为根据用户分类特征对第一分类基准的分类进行分组以缩减所有分类种类/个数的形态。例如，假设根据第一分类基准可分类的技术分类为1000个的情况下，第二分类基准可被确立为根据用户分类模式/基准对近似度高的分类进行聚类/分组，以此将1000个技术分类区分为50个技术分类。
63.并且，专利文献分类系统可输出用于指示对其余专利文献自动分类的输入键(例如，分类开始键)。接收到对输入键的用户输入的情况下，专利文献分类系统可利用用户定制型分类模型对其余专利文献进行分类。更具体来讲，专利文献分类系统在接收到用户对输入键的输入时，可利用用户定制型分类模型对其余专利文献进行分类自动存储到与分类特性相符的各文件夹，以此对其余专利文献进行分类。
64.即，本流程图可以如以下实施例适用。
65.用户可检索1000个专利设为专利池，生成四个文件夹。专利文献分类系统可利用基本分类模型将1000个专利预分类到四个文件夹。用户可以将1000个中前100个专利分类存储到四个文件夹，专利文献分类系统可从这种用户的分类信息预测用户的分类基准/特征。专利文献分类系统可生成在预分类基准/特征(即，第一分类基准)增加用户的分类基准/特征的模型，以此将其余900个专利分类到四个文件夹进行存储。
66.另外，虽然本流程图中未示出，但专利文献分类系统可实时算出自动分类的准确
度(第一准确度)，输出实时表示第一准确度的指标。
67.作为一个实施例，第一准确度可根据专利池中包含的专利文献的个数、由用户设定/指定的分类个数及/或由用户到当前完成分类的专利文献的个数算出得到。更具体来讲，专利文献分类系统有些情况下会学习基本分类模型后作为数据预先算出/导出基于分类对象专利文献的总个数(第一因子)、分类个数(第二因子)及/或各分类中包含的专利文献的个数(第三因子)的第二准确度。例如，专利文献分类系统经过学习基本分类模型，可以预先算出/导出分类对象专利文献为1000个、分类个数为三个、各分类中包含的专利文献的个数为100个的情况下具有80％的分类准确度这一统计数据。该情况下，专利文献分类系统可以向这种统计数据导入用户的分类模式/基准作为因子以导出第一准确度。即，第一准确度可相当于被用户包含在专利池的多个专利文献的个数、基于第二分类基准分类的个数及/或各分类中包含的专利文献的个数作为第一至第三因子依次适用于所述统计数据时预先算出的第二准确度。因此如果用户使得专利池中包括1000个专利文献，在三个文件夹分别分类100个专利文献的情况下，若按照以上例子，导出的用户的分类准确度(即，第一准确度)为80％。进一步地，专利文献分类系统还可以进一步地考虑被用户包含于各分类的专利文献之间的距离的接近程度的概率(间接验证用户是否按照分类合理放入)导出/显示第一准确度。
68.当基于上述内容时，用于导出最大准确度的第一至第三因子在基于基本分类模型导出的统计数据内可被固定。该情况下，专利文献分类系统判断认为导出的第一准确度低于最大准确度的情况下，可输出用于引导用户进一步分类的提示窗。例如，将包括1000个分类对象专利文献的专利池中的专利文献分类为三个分类的情况下，为了导出最大准确度80％每个文件夹至少应被分类的专利文献的个数可能已被设为100个。因此，为了使得用户为了达到最大准确度即80％而使得各文件夹分别包括至少100个专利文献，专利文献分类系统可输出用于对此进行引导的提示窗。例如，专利文献分类系统可输出
‘
由于当前分类准确度为60％，因此请分类更多的专利。’或
‘
xx文件夹的分类准确度低，因此请向xx文件夹分类更多的专利。’之类的提示窗。
69.作为另一实施例，第一准确度可相当于按第一分类基准分类的结果与按第二分类基准分类的结果之间的匹配程度。
70.专利文献分类系统可按文件夹及/或专利池算出自动分类的准确度，可按文件夹及/或专利池输出表示准确度的指标。
71.图4为例示本发明的一个实施例的基于用户的分类输入的专利文献分类方法的示意图。
72.如上所述，用户可通过将专利文献拖放到要分类的文件夹以简单地执行分类作业。
73.根据滑动视图画面的构成，例如，如图4所示，专利文献分类系统可在专利文献代表内容窗输出能够将该专利文献拖放到文件夹的图标450。用户为了进行分类而生成的文件夹420可提供于滑动视图的项目窗410内，用户可通过向期望的文件夹410侧拖放输入430所述图标450以执行向文件夹410分类及存储的作业。
74.并且，专利文献分类系统可提供设定ui 440使得用户能够对于各文件夹410直接设定等级及/或技术主题/关键字，后续将参见图5及图6对此进行说明。
75.图5为例示本发明的一个实施例的文件夹设定ui的附图，图6为例示根据本发明的一个实施例进行文件夹设置时专利文献的代表信息显示方法的示意图。
76.专利文献分类系统可按文件夹提供用户能够直接输入附加信息的设定ui 520。例如，如图5所示，专利文献分类系统可输出能够设定各文件夹510等级及/或关键字/主题的设定ui 520。用户可在选择欲设定的文件夹510后，直接设定所选择的文件夹510的重要等级及/或关键字/主题以按文件夹510更轻松地管理专利文献。
77.关于属于/存储于利用设定ui 520输入/设定附加信息的文件夹的专利文献，设定/输入的附加信息可作为代表信息显示提供给用户。
78.例如，如图5及图6所示，b文件夹的等级被设为a，关键字/主题被设为#摄像头的情况下，可以存储于b文件夹的专利文献的等级均被设为a，关键字/主题均被设为#摄像头作为代表信息610显示。因此，用户无需按各专利文献分别设定等级/关键字/主题等，可利用文件夹的设定ui 520以文件夹为单位进行设定，因此用户可按文件夹更轻松地管理专利文献。
79.图7为例示本发明的一个实施例的基于用户的分类输入的专利文献分类方法的示意图。
80.如上所述，用户可对与专利文献一起输出的立即存储键710执行用户输入以简单地执行分类作业。
81.根据滑动视图画面构成，例如，如图7所示，专利文献分类系统可在专利文献代表内容窗输出能够执行将该专利文献立即存储到文件夹的功能的立即存储键710。用户可通过触摸/选择(720)立即存储键将该专利文献立即存储到文件夹。如果可存储的文件夹有多个，专利文献分类系统在接收到对立即存储键的用户输入时，可提供能够选择可存储的文件夹的选择ui(730)。用户可选择输入选择ui(730)显示的文件夹中欲存储对象专利文献的文件夹，以此将对象专利文献立即存储到该文件夹。
82.图8为本发明的一个实施例的分类历史窗的示意图。
83.参见图8，专利文献分类系统可记录用户的最近分类历史，并向用户提供显示该记录信息的窗(即，分类历史窗)810。
84.在分类历史窗810中用户最近分类的专利文献可按被分类的顺序编制目录，同时还可以提供关于各专利文献的简单的分类信息(例如，分类的专利文献的申请/授权号、存储的文件夹等)。并且，分类历史窗810可按分类的专利文献一并提供
‘
取消运行’图标820。
‘
取消运行’图标820相当于用于取消运行对象专利文献的分类作业的图标。因此，接收到对取消运行图标820的用户输入时，专利文献分类系统可取消运行对接收到取消运行输入的对象专利文献的分类作业，对象专利文献将回到存储于/属于该文件夹之前(即，分类前)状态。
85.图9为例示本发明的一个实施例的多文件夹存储方式的示意图。
86.专利文献分类系统支持多文件夹存储方式，其结果，一个专利文献可同时存储到多个文件夹。例如，对象专利文献可同时存储到a及b文件夹。
87.专利文献分类系统可提供用于显示存储/分类对象专利文献的文件夹的信息的图标910。例如，如图9所示，对象专利文献存储于/分类于a及b文件夹的情况下，专利文献分类系统可提供指示文件夹数量2的文件夹图标910，用户触摸/选择文件夹图标910的情况下可
提供存储有当前对象专利文献的文件夹的列表信息(a及b文件夹)920。
88.随着专利文献分类系统支持多文件夹存储方式，各专利文献可被分配可最多被分配相当于当前生成的所有文件夹数量的等级及/或关键字/主题(因为可按文件夹设定等级及/或关键字/主题)。
89.虽然本图中没有示出，但完成自动分类的专利文献分类系统可按各文件夹提供用于用户能够直接确认及修改分类内容的再分类ui。
90.再分类ui可提供用于用户对已分类到各文件夹的专利文献重新进行再分类的再分类对象显示键及用于命令对再分类对象专利文献进行再分类的再分类键等。因此，用户可利用
‘
再分类对象显示键’显示不适合分类到该文件夹的对象专利文献，为了将通过再分类对象显示键显示的专利文献从该文件夹删除或移动到其他文件夹而可利用
‘
再分类键’。再分类对象可作为多种实施例显示，例如，可利用网页/应用程序服务器提供的(或用户直接设定的)标签或颜色显示。该情况下，用户可以以各专利文献为对象选择输入(例如，触摸/点击输入)由网页/应用程序服务器提供的标签或颜色以指定需要再分类的专利文献。
91.专利文献分类系统可对用户如上再分类的内容也进行数据化，根据基本分类模型学习再分类数据以自主进化。
92.以上介绍了基于机器学习(或深度学习)构建用户定制型分类模型，利用其对专利文献自动分类的方法。如上将用户分类模式/习惯作为特征/基准结合到现有模型构建新的模型的方式可适用于多种用户定制型专利管理实施例。例如，利用所述方式还可以进行专利权的终止期限、各专利要保持的权利要求个数、权利转让可能性(许可)、各发明人专利保持方法、基于专利评价的专利保持方法等的预测/推荐。
93.例如，在预测专利权的终止期限方面适用本发明的方式的情况下，专利文献分类系统可按技术对用户持有专利进行分类(此时可使用基本分类模型)，可按分类的技术领域学习专利终止模式并生成用户定制型模型。通过此，专利文献分类系统可以按照用户的现有专利管理(终止等)模式/特征在用户期望的周期按技术领域自动推荐专利终止预测期限。
94.例如，当韩国生命研究院具有对干细胞相关专利保持15年以上而不使之终止的特征，而度化合物或制造工程专利有均在五年内终止的特征/模式的情况下，尤其专利文献分类系统可掌握这种终止特征/模式并推荐韩国生命研究院当前保持的干细胞技术领域专利保持15年以上，引导/推荐化合物、制造工程专利在5年内终止。
95.后续将参见图10对本实施例进行更详细的说明。
96.图10为例示根据本发明的一个实施例预测专利文献的终止期限的实施例的流程图。
97.本实施例为了便于说明而写成了在图3的实施例之后执行的实施例，但不限于此，还可以作为独立于图3的实施例的实施例执行，这是显而易见的。
98.首先，专利文献分类系统可按分类算出针对专利数据库(data base；db)中包括的专利文献利用基本分类模型以第一分类基准分类的专利文献的申请日或授权日到终止日的第一平均期限(s1001)。
99.之后，专利文献分类系统可按照第一或第二分类基准对专利池中包括的多个文献进行分类(s1002)，按分类算出从多个专利文献的申请日或授权日到终止日的第二平均期
限(s1003)。其中，专利池中包括的多个文献可相当于(包含)用户当前持有或曾持有但当前已终止的专利文献。通过本步骤，专利文献分类系统能够预测用户对各类技术的平均专利终止期限/模式/特征。
100.最后，专利文献分类系统可考虑第一及第二平均期限预测特定专利文献的终止期限(s1004)。其中，特定专利文献可相当于(包含)用户当前持有而未终止的专利及/或根据用户的输入而特定的专利文献。
101.专利文献分类系统为了预测终止期限，首先可按照第一及/或第二分类基准分类特定专利文献。之后，专利文献分类系统可根据特定专利文献的基于第一及/或第二分类基准的分类按预设比例结合第一及/或第二平均期限以算出特定专利文献的终止期限。例如，可以假设第一特定专利文献根据第一分类基准属于
‘
生物’分类，
‘
生物’分类的平均存续期限在整个专利数据库中为五年的情况。并且，可以假设第一特定专利文献根据第二分类基准属于
‘
生物节律’分类，
‘
生物节律’分类的平均存续期限在用户终止专利内为10年的情况。第一及第二分类基准之间的预设比例被设为3：7的情况下，可导出5*0.3 10*0.7＝8.5这一期限作为评价指数。即，可预测出第一特定专利文献的预计存续期限为8年6个月。
102.预设比例可根据多种实施例自由设定/变更，从用户定制型模型这一方面来讲可设成第二分类基准的比例高于第一分类基准。
103.图11为例示本发明的一个实施例的专利终止推荐列表的示意图。
104.参见图11，专利文献分类系统可将按特定专利文献预测的终止期限编制目录成评价指数1120以包含在专利终止推荐列表1110进行输出。
105.可设定输出专利终止推荐列表1110的时间点为从终止预测时间点到预设时间点以前(例如，6个月或1年前)，可以由用户自由设定。
106.用户可通过这种专利终止推荐列表1110预测当前持有的专利权的终止期限，可预先判断要保持还是终止权利以有效管理各专利权的存续期限。
107.图12为示出本发明的一个实施例的专利文献分类系统的框图。
108.参见图12，专利文献分类系统大致可以由网页服务器(或应用程序服务器)及客户端设备构成。
109.网页服务器(或应用程序服务器)1200可包括处理器1210、存储器单元1220及/或通信单元1230，客户端设备1300可包括处理器1240、传感器单元1250、通信单元1260及/或显示单元1270。可根据实施例排除构成要素中至少一个或包括新的构成要素。并且，各单元为了执行以下所述的功能而可具有硬件形态的回路/装置等，可实现为一个芯片或多个芯片。
110.存储器单元1220可存储视频、音频、照片、录像、计算机程序、应用程序等多种数字数据。存储器单元1220可相当于闪存、硬盘驱动器(hard disk drive，hdd)、固态硬盘(solid state drive，ssd)等多种数字数据存储空间。尤其，网页服务器(或应用程序服务器)1200的存储器单元1220可相当于专利数据库，可存储有全世界的各种专利文献。
111.通信单元1230、1260可使用至少一个通信协议执行通信、收发各种数据。尤其，对客户端设备1300的用户输入可通过通信单元1230、1260传输到网页服务器(或应用程序服务器)1200，网页服务器(或应用程序服务器)1200的各种输出/反馈数据/信息也可以通过通信单元1260传输到客户端设备1300。
112.传感器单元1250为上述各种感测机构的统称，可感测用户的各种输入及/或客户端设备1300的环境。尤其，传感器单元1250可感测用户的各种输入(例如，触摸/动作/选择/检索输入等)，并将感测结果发送到处理器。作为一个实施例，传感器单元1250可包括重力(gravity)传感器、地磁传感器、动作传感器、陀螺仪传感器、加速度传感器、红外线传感器、倾斜(inclination)传感器、亮度传感器、高度传感器、嗅觉传感器、温度传感器、深度传感器、压力传感器、弯曲传感器、音频传感器、视频传感器、gps(global positioning system)传感器、触摸传感器及抓地力传感器等各种感测机构中至少任意一个。上述传感器可作为另外的元件包含于设备，或者集成为至少一个元件包含于设备。
113.显示单元1270可显示各种图像/影像。尤其，客户端设备1300的显示单元1270可显示网页服务器提供的各种网页/ui，应用程序服务器提供的各种应用程序画面/ui等。
114.处理器1210、1240可通过控制至少一个其他构成单元执行本说明书中提出的各种实施例。因此，本说明书中提出的实施例的执行主体可替代为处理器进行说明。处理器1210、1240可运行存储于存储器单元1220的各种程序/应用程序，处理服务器/设备内部的数据/信息。处理器1210、1240可构成为包括中央处理器(central processing unit，cpu)、微处理器单元(micro processor unit，mpu)、微控制器单元(micro controller unit，mcu)、应用处理器(application processor，ap)、ap(application processor)或本发明的技术领域公知形态的处理器中至少一个。处理器可执行用于执行本发明的实施例的方法的至少一个应用程序或程序的运算。
115.图13为示出本发明的一个实施例的专利文献分类系统的框图。
116.本图中的构成要素可利用图12所示的构成要素中至少一个实现。例如，加载部可通过处理器与存储器单元、文件夹生成部实现，专利文献显示部及文件夹显示部可通过处理器与显示单元实现，存储部可通过存储器单元实现。
117.加载部1310可执行加载用户请求的至少一个专利文献的作用。加载部1310与存储各种数据、命令及/或信息的存储空间连接，可存储用于获得所提供的本发明的实施例的专利分类服务提供方法的一个以上的应用程序。加载部1310还能够存储通过通信单元接收或者通过用户输入来输入的各种信息。
118.存储部1350可临时或非临时存储从外部装置传输过来的数据等。存储部1350可构成为包括只读存储器(read only memory，rom)、可擦可编程只读存储器(erasable programmable rom，eprom)、电可擦可编程只读存储器(electrically erasable programmable rom，eeprom)、闪速存储器等非易失性存储器、硬盘、可移动磁盘或本发明所属技术领域公知的任意形态的计算机可读存储介质。
119.文件夹生成部1320可起到生成用于存储或分类专利文献的文件夹的作用。
120.专利文献显示部1330起到将专利文献内区分项目中至少一个显示在信息区域的作用，文件夹显示部1340起到将文件夹显示在文件夹区域的作用。优选的是信息区域与文件夹区域为分离的区域。
121.并且，存储部1350将信息区域中至少一部分设为可拖动区域，将文件夹区域中至少一部分设为可拖动区域，根据用户的拖放(drag and drop)输入将专利文献存储到文件夹的作用。
122.本发明的实施例可通过各种机构，例如，硬件、固件(firmware)、软件或其组合等
实现。通过硬件实现的情况下，本发明的一个实施例可通过一个或多个专用集成电路(application specific integrated circuits，asics)、数字信号处理器(digital signal processors，dsps)、数字信号处理器件(digital signal processing devices，dspds)、可编程逻辑器件(programmable logic devices，plds)、现场可编程门阵列(field programmable gate arrays，fpgas)、处理器、控制器、微控制器、微处理器等实现。
123.并且，通过固件或软件实现的情况下，本发明的一个实施例可实现为可执行以上说明的功能或动作的模块、步骤、函数等形态实现，存储在可通过各种计算机机构读取的存储介质。其中，存储介质可包括程序命令、数据文件，数据结构等中的一个或其组合。存储于存储介质的程序命令可以是为了本发明而专门设计构成的，或者是计算机软件技术人员公知使用的。例如，存储介质例包括磁盘、软盘及磁带之类的磁介质(magnetic media)、cd
‑
rom(compact disk read only memory)、dvd(digital videodisk)之类的光记录介质(optical media)、软盘(floptical disk)之类的磁
‑
光介质(magneto
‑
optical media)及rom、ram、闪存等专门构件的用于存储和执行程序命令的硬件装置。程序命令的例子不仅包括通过编译器得到的机械代码，还包括利用解释器等由计算机执行的高级语言代码。可以将这种硬件装置构成为为了执行本发明的工作而以一个以上的软件模块工作。反之相同。
124.并且，本发明的装置或中断可通过使一个以上的处理器执行以上所述功能与过程的命令驱动。例如这种命令例如可包括javascript或ecmascript命令等脚本命令之类的被解释的命令或可运行代码或计算机可读介质中存储的其他命令。并且，本发明的装置可以像服务器群(server farm)分散在网络实现为分散型，或还可以在一个计算机装置实现。
125.并且，搭载在本发明的装置且运行本发明的方法的计算机程序(还已知为程序、软件、软件应用程序、脚本或代码)还可以编写成包括编译或解释语言或先验或过程语言的编程语言的任意形态，可包括独立型程序或模块、组件、子程序或适合在计算机环境使用的其他单元以部署成任意形态。计算机程序文件不一定对应于文件系统的文件。程序可存储在提供给所请求的程序的一个文件内、或多个交互的文件(例如，一个以上的模块、存储下位程序或代码的一部分的文件)内、或持有其他程序或数据文件的一部分(例如，存储在标记语言文档中的一个以上的脚步)内。计算机程序可部署为位于一个网页或分散在多个网页在通过通信网络相互连接的多个计算机或一个计算机上运行。
126.虽然为了便于说明而对各图分开进行了说明，但也可以设计成合并各附图中记载的实施例实现新的实施例。并且，本发明的如上说明的实施例的构成与方法并不是可限定性地适用的，为了能够对上述实施例进行各种变形，可选择性地组合各实施例的全部或一部分构成。
127.并且，以上虽然示出优选实施例并进行了说明，但本说明书不限于上述特定实施例，在不超出权利要求范围记载的主旨的前提下本领域普通技术人员可进行各种变形实施，不应脱离本说明书的技术思想或前景理解这些变形实施例。
128.工业应用性
129.本发明可适用于各种专利检索引擎技术领域及/或机器学习技术领域。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：用于确定身体量度和提供服装尺码推荐的方法和系统与流程

基于机器学习的用户定制型专利文献自动分类方法、装置及系统与流程

相关文献

最热文献