一种利益冲突检索的方法与流程

2022-06-11 23:22:25 来源：中国专利 TAG：

1.本发明涉及一种检索方法领域，尤其涉及一种利益冲突检索的方法。
背景技术：
：：2.利益冲突是指本律师事务所代理的委托事项与本所其他委托事项的委托人之间有利益上的冲突，继续代理会直接影响到相关委托人的利益的情形。3.为规范律师事务所的业务活动和律师执业行为，防止执业过程中，因涉及当事人利益冲突而给当事人和律师事务所造成权益损害，切实保障当事人合法权益和律师执业权利。律师均应严格遵照相关法律法规执行。4.为了解决这样的利益冲突，现在部分律师所都有一定的办公软件，每个律师在立案登记的时候都要先进行利益冲突的检索，目前律所管理办公软件能检索出一部分的利益冲突，但是存在两个问题，导致不能全部检索出利益冲突，一、功能过于简单，多次手工检索，人工进行结果合并以及判断；二、不支持复杂业务扩展，部分法律事务是非常复杂。5.目前业务的律所办公软件，针对律师法律事务的立案登记环节发起的利益冲突检索流程只是简单的根据当前委托人，对方当事人的信息，在利益冲突业务库中按照名称等条件匹配的方式人工逐个检索来判断，当前的立案是否存在利益冲突，能否承接案件。这样检索出来的利益冲突有一定的作用，但是存在不完整性，不准确性(存在检索出来很多无用的利益冲突，以及应该算利益冲突的反而没检索出来的情况发生)，以及检索效率不高。6.上述方式存在的问题：a、如果委托人，对方当事人等存在工商信息变更，不能及时更新，会导致一部分利益冲突检索不呈现；比如企业更名，新的名字发起的利益冲突跟历史案件的历史名称需要做检索，需要精准检索到。7.b、对于没有统一社会信用代码的企业(国外的企业)或者没有证件号码个人身份委托人等，只能根据委托人名称进行简单匹配，检索不精确。8.c、对于复杂的法律事务不能用简单的检索去匹配(比如某个委托人历史案件中有被政府，银行等告过，但是本次承接以他为委托人，原则上是允许的)，目前的系统扩展性不好。9.d、对于部分大的律所都有自身维护重要客户群，这些客户群的案件在利益冲突的时候，不管以前有没承办过，都不允许接重要客户被告的案件，目前的系统在这方面扩展性不好。10.e、对于大集团客户，利益冲突原则上需要检索他的下级，下下级单位，需要检索到他的下级所有单位的利益冲突，目前的系统在这方面扩展性不好；只能检索到一层，或者手工去展开多层检索。11.例如，一种在中国专利文献上公开的“一种事务所管理系统”，其公告号cn107944823a，包括存储单元、输入单元、管理端及用户端，包括收案请示、收案审批，收案审批的审批条件包括利益冲突审查机制，对用户端输入的收案信息与存储单元所存储的案件信息进行重合性筛选；所述存储单元被构造为存储已批准收案的案件信息；所述收案请示被构造为用户端通过输入单元输入收案信息；所述收案审批被构造为管理端对通过网络传输的案件参考审批条件结果进行审批。12.该方案并没有公开具体的利益冲突检索过程，无法解决目前利益冲突检索不完整、不准确以及检索效率不高的问题。技术实现要素：13.本发明主要解决现有技术的利益冲突检索不完整、不准确以及检索效率不高的问题，提供一种利益冲突检索的方法。14.本发明的上述技术问题主要是通过下述技术方案得以解决的：一种利益冲突检索的方法，包括以下步骤：s1：立案阶段，用户发起利益冲突检索请求；s2：根据检索请求，在工商信息库中读取待检索对象的历史工商信息；历史工商信息包括历史名称和从属关联企业；s3：通过利益冲突关键字截取器自动截取利益冲突检索需求关键字，进行检索数据源参数整理；s4：根据预设的利益冲突检索规则生成检索任务，分别在利益冲突业务库、利益冲突重点客户及关联企业库和利益冲突敏感库三个检索数据库中并行进行正向、反向、同向和异向利益冲突的组合检索，并分别合并检索结果后输出；s5：将三个检索数据库输出的检索结果合并后返回。15.本方案引入工商信息库解决工商信息变更带来的多次查询问题，根据预设的利益冲突检索规则，解决人为判断不同业务场景下利益冲突规则的不同，实用利益冲突检索关键字截取器，解决利益冲突多种搜索方式下自动完成检索，引入三个利益冲突检索单元，并行检索，提升检索效率，自动汇总多个利益冲突检索单元返回的数据以及呈现利益冲突返回数据，整体上提升了利益冲突的准确性，完整性和提高效率。16.作为优选，所述的利益冲突关键字截取器的截取和自学习过程如下：a1：创建初始语料库；a2：从初始语料库以及利用历史利益冲突检索处理结果中划分训练集、验证集，构建截取模型；a3：使用条件随机场算法，以待检索对象名称x作为输入，以利益冲突关键词y作为输出，计算线性链条件随机场p(y|x)；a4：采用维特比算法，获取所有结果准确性最大化的输出利益冲突关键词y。17.建立利益冲突检索关键字截取器，使利益冲突更加完整和精确。进行自学习，使关键字截取更加准确。18.作为优选，在给定x的取值x的情况下，随机变量y取值为y的条件概率表达为：z(x)＝∑ψx(r)其中，z(x)为归一化因子；ψx为势函数，通常定义为指数函数，r为随机变量；i表示当前位置下标；tk()表示相邻两个输出间的关系，是转移特征函数，取值{0，1}，1为满足特征，0为不满足特征；sl()表示当前位置的特征，是状态特征函数，取值{0，1}；γk为特征函数tk()对应的权值；μl为特征函数sl()对应的权值；k表示转移特征t的个数；l表示状态特征s的个数。19.通过计算输出结果的概率自学习优化关键词截取器作为优选，所述的维特比算法表示为：其中，f(y，x)为模型特征向量，ω为权值向量：fi(yi-1，yi，x)＝(f1(yi-1，yi，x，i)，f2(yi-1，yi，x，i)，...，fk(yi-1，yi，x，i))t。20.因为满足马尔科夫性，所以每个位置的结果只受上一个位置结果的影响，以此来完善训练模型。21.作为优选，在利益冲突业务库中进行同向利益冲突检索和异向利益冲突，并合并检索结果。22.在利益冲突重点客户及关联企业库中进行正向同向利益冲突检索、正向异向利益冲突检索、反向同向利益冲突检索和反向异向利益冲突检索，并合并检索结果。23.在利益冲突敏感库中进行正向同向利益冲突检索、正向异向利益冲突检索、反向同向利益冲突检索和反向异向利益冲突检索，并合并检索结果。24.将需要检索的数据作为a，待检测的数据源作为b(包括业务库、重要客户库、敏感库)，正向检索为在b中找出和a匹配的数据，作为冲突结果数据，反向检索为在a中找出和b匹配的数据，作为冲突结果数据。25.作为优选，利益冲突的检索逻辑具体为：b1：为利益冲突的三个检索库进行分词，依次进行建立分词、建立分词向量和建立索引字典；b2：使用向量检索，对于给定的向量q，其在数据集上的k近邻为n，通过检索召回的k近邻集合为m，则b3：根据利益冲突检索规则器中预设的利益冲突检索规则内容进行匹配检索；b4：使用dfp校正优化算法，利用数据的关联关系，计算支持度、可信度，得到频繁项集，进而对于数据匹配逻辑进行优化；b5：在三个检索数据库中并行进行正向、反向、同向和异向利益冲突的组合检索。26.先使用向量检索，确定近邻，之后的检索不需要从头开始检索，加快检索的速度。27.作为优选，所述的b1具体包括以下过程：b101：利用利益冲突关键字截取器的截取逻辑，对关键字段进行分词；b102：将分词结果对应实际数据，使用hashtable集合存储；b103：将上述集合进行数据缓存。28.方便后续多线程使用。29.作为优选，所述的b3具体包括以下过程：b301：读取利益冲突检索规则器中预设的利益冲突检索规则内容；b302：根据内容匹配，将不同的利益冲突的检索库分为不同的线程进行匹配；b303：对待检索内容使用快速排序算法进行排序。30.提升检索速度。31.作为优选，所述的b4包括以下过程：b401：设置匹配结果数据与匹配库数据的关联规则；b402：计算数据支持度s：支持度表示的是项集x，y存在冲突的频繁程度；其中，n为数据集体量；b403：计算数据可信度，可信度为y出现在包含x的力矩中的频繁程度c：b404：计算得出频繁项集；频繁项集为支持度超过设定的阈值的项集，对数据集进行遍历，得出结果作为数据频繁项集t；b405：设bk为原始值，δgk向量变化值，bk 1为结果值，对称正定矩阵a；给定初始值b0开始，k做累加循环，确定搜索方向：dk＝-bksk其中sk为：bk对应的梯度向量；令yk＝λkdk；其中λk为步长；b406：根据上述推导，对称正定矩阵a的矩阵更新表达为：b407：使用上述公式，对匹配逻辑进行优化。32.对与每天变化的数据库，相同的输入检索出来的结果会因为其差值而有所差距，故此对差值再次进行如步骤b401～b404的过程，优化匹配逻辑。33.作为优选，对于利益冲突业务库的检索结果r1、利益冲突重点客户及关联企业库的检索结果r2和利益冲突敏感库的检索结果r3进行合并，合并后的检索结果r为：r＝r1∪r2∪r3将合并的检索结果r返回展示数据给用户。34.自动汇总利益冲突检索单元返回的数据以及呈现，更加直观。35.本发明的有益效果是：1.建立利益冲突检索规则库，配置不同场景下的利益冲突规则，解决人为判断不同业务场景下利益冲突规则的不同的问题。36.2.利益冲突检索关键字截取器，使利益冲突更加完整和精确。37.3.建立工商信息库，针对工商信息变更的利益冲突检索更加完整。38.4.建立三个利益冲突检索单元，多线程检索，对检索库增加分词分量，增加正向，反向检索，优化检索算法，提升检索效率。39.5.自动汇总利益冲突检索单元返回的数据以及呈现，更加直观。附图说明40.图1是本发明的利益冲突检索方法流程图。41.图2是本发明的利益冲突检索时序图。具体实施方式42.下面通过实施例，并结合附图，对本发明的技术方案作进一步具体的说明。43.实施例：本实施例的一种利益冲突检索的方法，如图1所示，包括以下步骤：s1：立案阶段，用户发起利益冲突检索请求。44.用户在客户端的浏览器，立案登记环节发起利益冲突检索请求，客户端网页浏览器向网页服务器发送相应的检索请求，网页服务器接收到所述利益冲突检索请求，并执行下述利益冲突检索流程。45.s2：根据检索请求，在工商信息库中读取待检索对象的历史工商信息。历史工商信息包括历史名称和从属关联企业。46.读取工商信息库把当前需要检索的数据的历史工商信息全部读出来做检索，具体比如：当前客户的历史客户名称(企业工商更名)，以便后面利益冲突检索单元检索的时候可以检索出历史客户名称的案件作为利益冲突结果返回数据。47.企业发生工商信息变更会自动把历史工商信息，当前正式工商信息进入到工商信息库。48.工商信息库中还包括各公司总公司、子公司、分公司等从属关联企业的信息。49.s3：通过利益冲突关键字截取器自动截取利益冲突检索需求关键字，进行检索数据源参数整理。50.利益冲突关键字截取器，用于利益冲突检索关键字匹配，祛除一些冗余信息，让检索更加精确。51.具体比如：当前客户的检索项中的部分冗余信息按照优先级截取，比如：有限公司，分公司，集团公司等等，这样在后续检索单元中，把总公司和分公司可以归属为有效利益冲突。利益冲突关键字截取器支持可以自主学习，比较灵活。52.在一案源立案利益冲突检索发起时刻，先根据当前案件的委托人，对方当事人，调用工商信息库，获取工商信息，包括历史工商信息等，根据工商信息，调用利益冲突关键字截取器获取截取后的利益冲突检索关键字，如表1所示。53.表1截取后的利益冲突检索关键字表利益冲突关键字截取器的截取和自学习过程如下：a1：创建初始语料库。54.利用不同企业截取规则大数据，为客户数据创建初始语料库。初始的预料库中利用大数据统计截取，包括截取例如有限公司、分公司、集团公司和股份有限公司等无关词汇。55.a2：从初始语料库以及利用历史利益冲突检索处理结果中划分训练集、验证集，构建截取模型。56.a3：使用条件随机场算法，以待检索对象名称x作为输入，以利益冲突关键词y作为输出，计算线性链条件随机场p(y|x)。57.在给定x的取值x的情况下，随机变量y取值为y的条件概率表达为：z(x)＝∑ψx(r)其中，z(x)为归一化因子；ψx为势函数，通常定义为指数函数，r为随机变量；i表示当前位置下标；tk()表示相邻两个输出间的关系，是转移特征函数，取值{0，1}，1为满足特征，0为不满足特征；sl()表示当前位置的特征，是状态特征函数，取值{0，1}；γk为特征函数tk()对应的权值；μl为特征函数sl()对应的权值；k表示转移特征t的个数；l表示状态特征s的个数。58.a4：采用维特比算法，获取所有结果准确性最大化的输出利益冲突关键词y。59.维特比算法是一种动态规划算法，目标是找到使所有结果(y1...yn)准确性最大化的y，注意下式就是去掉了标准p(y|x)的分子z(x)和分母上的exp函数部分，其最终结果是不受影响的。60.维特比算法表示为：其中，f(y，x)为模型特征向量，ω为权值向量：fi(yi-1，yi，x)＝(f1(yi-1，yi，x，i)，f2(yi-1，yi，x，i)，...，fk(yi-1，yi，x，i))t。61.因为满足马尔科夫性，所以每个位置的结果只受上一个位置结果的影响，以此来完善训练模型。62.s4：根据预设的利益冲突检索规则生成检索任务，分别在利益冲突业务库、利益冲突重点客户及关联企业库和利益冲突敏感库三个检索数据库中并行进行正向、反向、同向和异向利益冲突的组合检索，并分别合并检索结果后输出。63.将利益冲突被检索数据库分为三大库，做横向业务扩展，分为利益冲突业务库、利益冲突重点客户及关联企业库和利益冲突敏感库。64.如表2所示，利益冲突业务库为已经发生的案源，案件信息库，包括预备期业务、正在进行中的业务、已经结束的业务(还在利益冲突规定的保护期内)。65.表2利益冲突业务库表如表3所示，利益冲突重点客户库指律所法律业务中业务金额达到一定额度的，需要vip保护的客户以及这类客户的子集团，分子公司等。重点客户一般可以根据业务发生金额或者企业合作规模角度去考虑，比如年法律合作业务金额达到1000万的。66.表3利益冲突重点客户及关联企业库如表4所示，利益冲突敏感库指利益冲突特定的机构单位，比如政府、律所、证券公司和会计事务所等。67.表4利益冲突敏感库利益冲突敏感库类型关键字xx市政府地方性政府xx，市政府中**t证券证券公司中**t利益冲突类型分同向利益冲突和异向利益冲突。同向利益冲突是指利益冲突检索申请方委托人与利益冲突数据库中的委托人是同一客户。同向利益冲突对外不是利益冲突，而是不同合伙人之间对于同一客户的冲突，主要为同一客户服务的不同合伙人进行业务提醒。68.异向利益冲突是指利益冲突检索申请方委托人与利益冲突数据库中的对方当事人是同一人，或申请方对方当事人与利益冲突数据库中的委托方是同一人。异向利益冲突主要是遵守行业规定及保护客户的权益。69.利益冲突检索分为正向检索和反向检索，将需要检索的数据作为a，待检测的数据源作为b(包括业务库、重点客户及重要关联企业库、敏感库)，正向检索为在b中找出和a匹配的数据，作为冲突结果数据，反向检索为在a中找出和b匹配的数据，作为冲突结果数据。70.利益冲突的检索逻辑具体为：b1：为利益冲突的三个检索库进行分词，依次进行建立分词、建立分词向量和建立索引字典。71.b101：利用利益冲突关键字截取器的截取逻辑，对关键字段进行分词。72.利益冲突关键字截取器的截取逻辑如表5所示，按照截取逻辑获得的数据样例如表6所示。73.表5利益冲突关键字截取器的截取逻辑表6关键词截取后数据样例表关键词截取后数据样例表b102：将分词结果对应实际数据，使用hashtable集合存储。74.b103：将上述集合进行数据缓存。方便后续多线程使用。75.b2：使用向量检索，对于给定的向量q，其在数据集上的k个近邻为n，通过检索召回的k个近邻集合为m，则其中k为数据集上的标记，在多次匹配过程中获取近邻，先使用向量检索，从近邻开始检索，加快检索速度。76.b3：根据利益冲突检索规则器中预设的利益冲突检索规则内容进行匹配检索。77.读取利益冲突检索规则器中预设的利益冲突检索规则，生成检索任务，具体比如：开启利益冲突业务库利益冲突中的一般性企业利益冲突，事业单位企业利益冲突，分支机构利益冲突，国外企业利益冲突等等。78.b301：读取利益冲突检索规则器中预设的利益冲突检索规则内容。79.b302：根据内容匹配，将不同的利益冲突的检索库分为不同的线程进行匹配。80.b303：对待检索内容使用快速排序算法进行排序，提升检索速度。81.快速排序算法包括：1)在数组中选一个基准数(通常为数组第一个)；2)将数组中小于基准数的数据移到基准数左边，大于基准数的移到右边；3)对于基准数左、右两边的数组，不断重复以上两个过程，直到每个子集只有一个元素，即为全部有序。82.b4：使用dfp校正优化算法，利用数据的关联关系，计算支持度、可信度，得到频繁项集，进而对于数据匹配逻辑进行优化。83.b401：设置匹配结果数据与匹配库数据的关联规则。84.关联规则是形如x→y的表达式，x和y是两个不相交的项集，这里的项集指的是客户数据的集合。x为匹配结果数据集，y为匹配库数据集。85.b402：计算数据支持度s：支持度s表示的是项集x，y存在冲突的频繁程度。86.其中，n为数据集体量。87.b403：计算数据可信度，即一个数据出现后，另一个数据出现的概率，或者说数据的条件概率，可信度为y出现在包含x的力矩中的频繁程度c：b404：计算得出频繁项集；频繁项集为支持度超过设定的阈值的项集，对数据集进行遍历，得出结果作为数据频繁项集t。88.在本实施例中，设定支持度阈值0.8，可信度阈值0.8。后续将利用频繁项集t来进行数据匹配计算优化。89.b405：设bk为原始值，δgk向量变化值，bk 1为结果值，对称正定矩阵a；给定初始值b0开始，k做累加循环，确定搜索方向：dk＝-bksk其中sk为：bk对应的梯度向量；令yk＝λkdk；其中λk为步长。90.b406：根据上述推导，对称正定矩阵a的矩阵更新表达为：b407：使用上述公式，对匹配逻辑进行优化。91.b5：在三个检索数据库中并行进行正向、反向、同向和异向利益冲突的组合检索。92.在利益冲突业务库中进行同向利益冲突检索和异向利益冲突检索，并合并检索结果。输出利益冲突业务库的检索结果r1。93.根据表1的数据进行利益冲突业务库的检索，按照工商信息和关键字进行同向利益冲突，异向利益冲突检索，此处因为加上了关键字截取规则后的检索，可以检索出一个有效利益冲突(表1中的案源d，虽然是承接了【成都轨***fz分公司】的案源，跟此次的【成都轨***fz集团有限公司】名称和工商信息上存在差异，但是关键字上都是【成都轨***fz】，这样等于把所有分子公司的案件利益冲突全部可以用此利益冲突方案检索出来)，并且清洗数据。如表7所示：表7利益冲突业务库的检索结果表在利益冲突重点客户及关联企业库中进行正向同向利益冲突检索、正向异向利益冲突检索、反向同向利益冲突检索和反向异向利益冲突检索，并合并检索结果。输出利益冲突重点客户及关联企业库的检索结果r2。94.根据表1的数据进行利益冲突重点客户及关联企业库的正向，反向检索，按照工商信息和关键字进行正向检索，按照利益冲突重点库以及关联企业库的关键字进行反向利益冲突检索，并且清洗数据，得到利益冲突结果如表8所示：表8利益冲突重点客户及关联企业库检索结果表在利益冲突敏感库中进行正向同向利益冲突检索、正向异向利益冲突检索、反向同向利益冲突检索和反向异向利益冲突检索，并合并检索结果。输出利益冲突敏感库的检索结果r3。95.根据表1的数据进行利益冲突敏感库的正向，反向检索，按照工商信息和关键字进行正向检索，按照利益冲突敏感库的关键字进行反向利益冲突检索，并且清洗数据，得到利益冲突结果如表9所示：表9利益冲突敏感库检索结果表s5：将三个检索数据库输出的检索结果合并后返回。96.对于利益冲突业务库的检索结果r1、利益冲突重点客户及关联企业库的检索结果r2和利益冲突敏感库的检索结果r3进行合并，合并后的检索结果r为：r＝r1∪r2∪r3将合并的检索结果r返回展示数据给用户。97.将三个检索数据库输出的检索结果合并，得到完整的利益冲突结果数据，如表10所示：表10利益冲突结果数据表三个检索单元任务均包含有用于指示当前检索状态的标志位。例如：所述标志位可以是数值0和1，1表示已经得到检索结果，0表示未得到检索结果。98.上述进行的数据检索的流程中，对于利益冲突业务库检索、利益冲突重点客户及关联企业库检索和利益冲突敏感库的检索可以同时进行，三个检索过程相互独立，分别进行，耗时可能会存在差异。99.具体流程时序如图2所示，t1为三个检索过程开始时间，t2为利益冲突业务库检索结束时间，t3为利益冲突重点客户及关联企业库检索结束时间，t4为利益冲突敏感库检索结束时间，三个检索过程同时进行，利益冲突业务库、利益冲突重点客户及关联企业库和利益冲突敏感库的检索时间依次增加，三者独立进行。100.按照测试的数据以100万条案源，案件信息为例，现有技术需要平均在10-15分钟完成利益冲突检索(人工系统)，数据还不一定准确和完整，用了本本方案的利益冲突检索方法和系统，基本控制平均在10-20秒范围内完成精确完整的利益冲突返回数据，提升效率达40-60倍之多。101.本方案引入工商信息库解决工商信息变更带来的多次查询问题，根据预设的利益冲突检索规则，解决人为判断不同业务场景下利益冲突规则的不同，实用利益冲突检索关键字截取器，解决利益冲突多种搜索方式下自动完成检索，引入三个利益冲突检索单元，并行检索，提升检索效率，自动汇总多个利益冲突检索单元返回的数据以及呈现利益冲突返回数据，整体上提升了利益冲突的准确性，完整性和提高效率。102.应理解，实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本技术所附权利要求书所限定的范围。当前第1页12当前第1页12

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于特征金字塔的图像检测模型的训练方法、介质和设备

一种利益冲突检索的方法与流程

相关文献

最热文献