一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

使用计算机自动过滤地图注记和兴趣点的方法和装置与流程

2022-11-30 14:48:07 来源:中国专利 TAG:


1.本发明涉及领域,尤其是涉及使用计算机自动过滤地图注记和兴趣点的方法和装置。


背景技术:

2.目前,对地图注记的识别完全以人工的方式进行。对兴趣点的识别主要通过计算机进行关键词过滤和人工识别两种并行的方法。
3.通过确定关键词库,利用计算机编写程序将含有关键词库中关键词的兴趣点从海量的兴趣点中过滤出来,再通过人工识别判断兴趣点可否表示,得出最终的识别结果。
4.上述识别过程中,由于主要依靠人工识别,导致识别标准不统一,识别结果不一致;当工作人员工作量大时,无法保证时效性。


技术实现要素:

5.有鉴于此,本发明的目的在于提供使用计算机自动过滤地图注记和兴趣点的方法和装置,可以提高识别的准确率和识别效率。
6.第一方面,本发明实施例提供了使用计算机自动过滤地图注记和兴趣点的方法,所述方法包括:
7.构建白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组;
8.获取识别内容;
9.依次通过所述白名单库、所述黑名单词库和所述黑名单词库组、所述关键词库和所述关键词库组、所述反向关键词库和所述反向关键词库组对所述识别内容进行过滤,得到过滤结果。
10.第二方面,本发明实施例提供了使用计算机自动过滤地图注记和兴趣点的装置,所述装置包括:
11.构建模块,用于构建白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组;
12.获取模块,用于获取识别内容;
13.过滤模块,用于依次通过所述白名单库、所述黑名单词库和所述黑名单词库组、所述关键词库和所述关键词库组、所述反向关键词库和所述反向关键词库组对所述识别内容进行过滤,得到过滤结果。
14.第三方面,本发明实施例提供了电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的方法。
15.第四方面,本发明实施例提供了具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行如上所述的方法。
16.本发明实施例提供了使用计算机自动过滤地图注记和兴趣点的方法和装置,包括:构建白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组;获取识别内容;依次通过白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组对识别内容进行过滤,得到过滤结果;可以提高识别的准确率和识别效率。
17.本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
18.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
19.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
20.图1为本发明实施例一提供的使用计算机自动过滤地图注记和兴趣点的方法流程图;
21.图2为本发明实施例二提供的使用计算机自动过滤地图注记和兴趣点的装置示意图。
22.图标:
23.1-构建模块;2-获取模块;3-过滤模块。
具体实施方式
24.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.为便于对本实施例进行理解,下面对本发明实施例进行详细介绍。
26.实施例一:
27.图1为本发明实施例一提供的使用计算机自动过滤地图注记和兴趣点的方法流程图。
28.参照图1,该方法包括以下步骤:
29.步骤s101,构建白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组;
30.步骤s102,获取识别内容;
31.步骤s103,依次通过白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组对识别内容进行过滤,得到过滤结果。
32.这里,通过白名单库对识别内容进行过滤,得到第一过滤结果;当第一过滤结果为
疑似时,通过黑名单词库和黑名单词库组对识别内容进行过滤,得到第二过滤结果;当第二过滤结果为疑似时,通过关键词库和关键词库组对识别内容进行过滤,得到第三过滤结果;当第三过滤结果为疑似时,通过反向关键词库和反向关键词库组对识别内容进行过滤,得到第四过滤结果。如果第四过滤结果为疑似,则需要通过人工识别。
33.进一步的,黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组均包括词语类别和出现位置;词语类别包括单关键词和组合关键词,出现位置包括开始、中间和结尾;其中,单关键词是独立的词语,组合关键词是通过3个或3个以上同类型关键词库中的词任意组合而成。
34.具体地,白名单库指人工识别的可允许表示的识别内容。其中,白名单库需要根据人工识别结果逐步扩充,且最初构建白名单库时,该库为空。
35.构建黑名单词库和黑名单词库组,且每个关键词包括词语类别、出现位置2个属性。
36.词语类别。分为单关键词、组合关键词两类。单关键词表示该关键词是一个独立的词语;组合关键词由3个或以上同类型关键词库中的词任意组合而成。其中,同类型关键词库由同一类型的所有词语汇总而成,包括数字类型库、化学元素类型库等。根据关键词出现在识别内容的特定位置,分为开始、中间、结尾三类。
37.构建关键词库和关键词库组,且每个关键词包括词语类别、出现位置2个属性。
38.构建反向关键词库和反向关键词库组,且每个关键词包括词语类别、出现位置2个属性。其中,识别内容,通常指单个词或者多个词组成的组合词。例如,单个词为省军区,多个词组成的组合词为省军区医院东门。
39.关于词语类别和出现位置在黑名单词库和黑名单词库组中已经说明,在此不作赘述。
40.进一步的,步骤s103包括:
41.依次通过白名单库的过滤规则、黑名单词库和黑名单词库组的过滤规则、关键词库和关键词库组的过滤规则、反向关键词库和反向关键词库组的过滤规则,对识别内容进行过滤,得到过滤结果。
42.具体地,1)通过白名单库的过滤规则对识别内容进行过滤,具体参照表1:
43.表1
[0044][0045]
其中,w表示待过滤的识别内容,如果第一过滤结果为疑似,仅表示识别内容有可能被判定为错误,不表示已经被判定为错误。第二步和第三步的过滤结果同理。
[0046]
2)将识别内容与黑名单词库和黑名单词库组中的词逐一比对,采用黑名单词库的过滤规则如表2所示:
[0047]
表2
[0048]
[0049][0050]
其中,w表示待过滤的识别内容,l
黑名单词
指黑名单词出现在识别内容的位置;l
规定位置
指黑名单词库中规定的黑名单词在识别内容中的指定位置。当黑名单词库中的任一黑名单词∈w且l
黑名单词
=l
规定位置
,即认为第二步的过滤结果为错误。
[0051]
使用黑名单词库组的过滤规则如表3所示:
[0052]
表3
[0053][0054]
其中,黑名单词n指黑名单词组的第n个黑名单词;l
黑名单词n
指第n个黑名单词出现在第二识别内容的位置;l
规定位置n
指黑名单词组第n个黑名单词在第二识别内容中的指定位置。
[0055]
当任一黑名单词组中的n个黑名单词必须全部满足黑名单词n∈w且l
黑名单词n
=l
规定位置n
,时,可认为第二步的过滤结果为错误。
[0056]
如果第二步的过滤结果为错误,表示识别内容不允许表示。
[0057]
3)将识别内容与关键词库和关键词库组中的词逐一比对,采用关键词库的过滤规则如表4所示:
[0058]
表4
[0059][0060]
其中,l
关键词
指关键词出现在识别内容的位置;l
规定位置
指关键词库中规定的关键词在识别内容中的指定位置。当关键词库中的任一关键词∈w且l
关键词
=l
规定位置
,即认为第三步的过滤结果为疑似。采用关键词库组的过滤规则如表5所示:
[0061]
表5
[0062][0063]
其中,关键词n指关键词组的第n个关键词;l
关键词n
指第n个关键词出现在识别内容的位置;l
规定位置n
指关键词组第n个关键词在识别内容中的指定位置。
[0064]
当任一关键词组中的n个关键词必须全部满足关键词n∈w且l
关键词n
=l
规定位置n
时,可认为第三步的过滤结果为疑似;如果第三步的过滤结果为正确,表示识别内容允许表示。
[0065]
4)将识别内容与反向关键词库和反向关键词库组中的词逐一比对,采用反向关键词库的过滤规则如表6所示:
[0066]
表6
[0067][0068]
其中,l
反向关键词
指反向关键词出现在识别内容的位置;l
规定位置
指反向关键词库中规定
的反向关键词在识别内容中的指定位置。
[0069]
当反向关键词库中的任一反向关键词∈w且l
反向关键词
=l
规定位置
,即认为第四步的过滤结果为正确。
[0070]
采用反向关键词库组的过滤规则如表7所示:
[0071]
表7
[0072][0073]
其中,反向关键词n指反向关键词组的第n个反向关键词;l
反向关键词n
指第n个反向关键词出现在识别内容的位置;l
规定位置n
指反向关键词组第n个反向关键词在识别内容中的指定位置。
[0074]
当任一反向关键词组中的n个反向关键词必须全部满足反向关键词n∈w且l
反向关键词n
=l
规定位置n
时,可认为第四步的过滤结果为正确。
[0075]
如果第四步的过滤结果为正确,表示识别内容允许表示。
[0076]
进一步的,该方法还包括以下步骤:
[0077]
步骤s201,如果过滤结果为疑似,则通过人工过滤的方法进行识别得到识别结果;
[0078]
步骤s202,如果识别结果为正确,则将识别结果存储到白名单库中。
[0079]
具体地,如果通过上述方法过滤识别内容后,仍存在过滤结果为疑似的识别内容,则人工判定识别内容是否可表示。对判定结果为正确的识别内容纳入白名单库,避免识别内容在下次过滤过程中进入人工过滤步骤。同时,根据人工过滤的结果对上述各库修改完善。
[0080]
本发明实施例提供了使用计算机自动过滤地图注记和兴趣点的方法,包括:构建白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组;获取识别内容;依次通过白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组对识别内容进行过滤,得到过滤结果;可以提高识别的准确率和识别效率。
[0081]
实施例二:
[0082]
图2为本发明实施例二提供的使用计算机自动过滤地图注记和兴趣点的装置示意图。
[0083]
参照图2,该装置包括:
[0084]
构建模块1,用于构建白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组;
[0085]
获取模块2,用于获取识别内容;
[0086]
过滤模块3,用于依次通过白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组对识别内容进行过滤,得到过滤结果。
[0087]
进一步的,过滤模块3具体用于:
[0088]
依次通过白名单库的过滤规则、黑名单词库和黑名单词库组的过滤规则、关键词库和关键词库组的过滤规则、反向关键词库和反向关键词库组的过滤规则,对识别内容进行过滤,得到过滤结果。
[0089]
进一步的,黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组均包括词语类别和出现位置;
[0090]
词语类别包括单关键词和组合关键词,出现位置包括开始、中间和结尾;
[0091]
其中,单关键词是独立的词语,组合关键词是通过3个或3个以上同类型关键词库中的词任意组合而成。
[0092]
进一步的,该装置还包括:
[0093]
识别模块(未示出),用于在过滤结果为疑似的情况下,通过人工过滤的方法进行识别得到识别结果;
[0094]
存储模块(未示出),用于在识别结果为正确的情况下,将识别结果存储到白名单库中。
[0095]
本发明实施例提供了使用计算机自动过滤地图注记和兴趣点的装置,包括:构建白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组;获取识别内容;依次通过白名单库、黑名单词库和黑名单词库组、关键词库和关键词库组、反向关键词库和反向关键词库组对识别内容进行过滤,得到过滤结果;可以提高识别的准确率和识别效率。
[0096]
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例提供的使用计算机自动过滤地图注记和兴趣点的方法的步骤。
[0097]
本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,计算机可读介质上存储有计算机程序,计算机程序被处理器运行时执行上述实施例的使用计算机自动过滤地图注记和兴趣点的方法的步骤。
[0098]
本发明实施例所提供的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
[0099]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0100]
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0101]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0102]
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0103]
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献