一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

标注组件、标注方法、装置、设备及存储介质与流程

2021-12-17 21:05:00 来源:中国专利 TAG:


1.本发明属于计算机领域,尤其涉及一种标注组件、标注方法、装置、 设备及存储介质。


背景技术:

2.随着机器学习技术的迅速发展,机器学习模型如今已被广泛地应用于 各行各业。在使用机器学习模型进行预测之前,先利用训练样本对机器学 习模型进行训练。而为了得到训练样本,需要由工作人员对文本序列中的 文本进行标注。比如,对文本序列中的人名、地名和时间等进行标注。具 有标注的文本序列形成了训练样本。
3.相关技术中的文本标注方法是:用户在显示的文本序列中选取需要标 注的实体;然后系统将该需要标注的实体包裹在一个实体标签内,使用该 实体标签替换文本序列中该需要标注的实体。
4.可见,每当用户对文本序列中的实体进行标注时,文本序列都发生了 变化。由于文本序列发生了变化,所以需要重新渲染文本序列。而每次重 新渲染文本序列都需要消耗资源,如果文本序列过长,那么很有可能出现 在渲染时卡顿的现象。


技术实现要素:

5.本发明实施例提供一种标注组件、标注方法、装置、设备及存储介质, 能够解决每次对文本序列中的实体进行标注时需要重新渲染文本序列,导 致渲染时出现卡顿的问题。
6.第一方面,本发明实施例提供一种标注组件,包括:文本层和标签层;
7.所述文本层,包括:
8.第一文本节点,用于展示目标文本序列;
9.以及,
10.第二文本节点,用于将所述目标文本序列的每一个字符拆分为单个的 超文本标记语言html文本节点进行展示,以及,接收用户的交互动作; 其中,所述交互动作用于在所述目标文本序列的html文本节点中选择至 少一个html文本节点,并为所述至少一个html文本节点对应的第一标 注文本添加第一dom元素;
11.所述标签层用于渲染所述第一dom元素,并展示渲染后的所述第一 dom元素。
12.第二方面,本发明实施例提供了一种标注方法,使用第一方面所述的 标注组件进行标注,所述方法包括:
13.利用所述第一文本节点展示目标文本序列,以及利用所述第二文本节 点将所述目标文本序列的每一个字符拆分为单个的html文本节点进行展 示;
14.利用所述第二文本节点接收用户对所述目标文本序列的交互动作,其 中,所述交互动作用于在所述目标文本序列的html文本节点中选择至少 一个html文本节点,并为所述至少一个html文本节点对应的第一标注 文本添加第一dom元素;
15.利用所述标签层渲染所述第一dom元素,并展示渲染后的所述第一 dom元素。
16.第三方面,本发明实施例提供了一种标注装置,使用第一方面所述的 标注组件进行标注,所述装置包括:
17.第一展示模块,用于利用所述第一文本节点展示目标文本序列,以及 利用所述第二文本节点将所述目标文本序列的每一个字符作为单个的 html文本节点进行展示;
18.动作接收模块,用于利用所述第二文本节点接收用户对所述目标文本 序列的交互动作,其中,所述交互动作用于在所述目标文本序列的html 文本节点中选择至少一个html文本节点,并为所述至少一个html文本 节点对应的第一标注文本添加第一dom元素;
19.第一渲染模块,用于利用所述标签层渲染所述第一dom元素;
20.第二展示模块,用于展示渲染后的所述第一dom元素。
21.第四方面,本发明实施例提供了一种标注设备,所述设备包括:处理 器以及存储有计算机程序指令的存储器;
22.所述处理器执行所述计算机程序指令时实现第二方面所述的标注方法。
23.第五方面,本发明实施例提供了一种计算机存储介质,计算机存储介 质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第二方 面所述的标注方法。
24.本发明实施例的标注组件、标注方法、装置、设备及存储介质,通过 第一文本节点展示目标文本序列,通过第二文本节点将目标文本序列的每 一个字符拆分为单个的html文本节点进行展示。由此,用户可以通过第 二文本节点选择至少一个html文本节点,并为选择的至少一个html文 本节点对应的第一标注文本添加第一dom元素。在标签层上渲染并展示 第一dom元素。可见,本发明实施例将目标文本序列和第一dom元素展 示在不同层上,使得目标文本序列和第一dom元素的渲染互不影响。因 此,在增加第一dom元素的情况下,在标签层上渲染第一dom元素即 可,不需要重新渲染目标文本序列,避免在渲染时出现卡顿的问题。
附图说明
25.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例 中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不 付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
26.图1示出了本发明提供的一个实施例的标注组件的结构示意图;
27.图2示出了本发明提供的另一个实施例的标注组件的结构示意图;
28.图3示出了本发明提供的一个实施例的标注结果的示意图;
29.图4为本技术实施例提供的一种标注方法的流程示意图;
30.图5示出了本发明提供的又一个实施例的标注组件的结构示意图;
31.图6示出了本发明提供的再一个实施例的标注组件的结构示意图;
32.图7为本技术实施例提供的另一种标注方法的流程示意图;
33.图8示出了本发明提供的一个实施例的将两个标注文本进行关联的流 程示意图;
34.图9示出了本发明提供的一个实施例的标注装置的结构示意图;
35.图10示出了本发明实施例提供的标注设备的硬件结构示意图。
具体实施方式
36.下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本 发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例, 对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配 置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说, 本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实 施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
37.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用 来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者 暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语
ꢀ“
包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而 使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而 且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物 品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”ꢀ
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在 另外的相同要素。
38.下面首先对本发明实施例中涉及的专业术语进行说明。
39.文本序列标注:包括分词、命名实体识别、词性标注等。具体包括对 一个文本序列中的至少一个词元(比如字或词)w,标注其在特定标签集的标签a。因此,对给定的文本序列w可得到其在标签集上的标签序列 a。实现文本序列w到标签序列a的序列标注任务。
40.文本实体抽取:即命名实体识别,具体是为文本序列中的实体标注标 签集的某一个或多个标签。标注有标签的至少一个词元(即标注文本) 称为实体。
41.文本关系抽取:对于给定的文本序列及其上的实体集合e,标记出符 合给定关系标签集r的实体元组(e1,e2)及其所属关系标签r,称(r,e1,e2)为 一个关系。本发明实施例中所提及的关系可以指二元关系,即两个实体之 间的关系。
42.可缩放矢量图形(scalable vector graphics,svg):一种用可扩展标 记语言(extensible markup language,xml)定义的语言,用来描述可缩 放的矢量图形。svg图形在浏览器中表现良好,使用方便,适用于web端 的数据可视化。
43.以上是本发明实施例中涉及的专业术语的说明,下面对本发明实施例 的相关技术进行说明。
44.自然语言处理(natural language processing,nlp)自学习平台支持 多种nlp基础算法模型能力的输出,如文本实体抽取、文本关系抽取和文 本分类等。这些能力在nlp自学习平台中也将开放给用户,用户需要通过 标注文本序列来训练模型,以适应不同领域内容的实体抽取、关系抽取和 分类等。因此,作为一站式数据管理、模型训练、部署、迭代的平台,需 要在nlp自学习平台中提供简洁易用的标注工具,供用户进行标注。
45.相关技术中的一个标注方法是:用户在显示的文本序列中选取需要标 注的实体;然后系统将该需要标注的实体包裹在一个实体标签内,使用该 实体标签替换文本序列中该需要标注的实体。
46.相关技术中的另一个文本标注方法是:基于前端框架如react的双向 数据绑定,以实现文本标注。具体是将文本序列进行分词,或按字符级拆 分;将标注结果绑定在相关的字符元素上。
47.而在上述的两个标注方法中,每当用户对文本序列中的实体进行标注 时,文本序列都发生了变化。由于文本序列发生了变化,所以需要重新渲 染文本序列。而每次重新渲染文本序列都需要消耗资源。实际上,在用户 使用标注工具进行标注的过程中发现,用户经常会上传比较长的文本序列。 如果文本序列过长,那么很有可能出现在渲染文本序列时卡顿的现象。
48.针对上述技术问题,本发明实施例提供了一种标注组件,该标注组件 包括文本层和标签层。
49.文本层包括:第一文本节点和第二文本节点。
50.第一文本节点用于展示目标文本序列。
51.第二文本节点用于将目标文本序列的每一个字符拆分为单个的超文本 标记语言(hypertext markup language,html)文本节点进行展示,以 及,接收用户的交互动作;其中,交互动作用于在目标文本序列的html 文本节点中选择至少一个html文本节点,并为至少一个html文本节点 对应的第一标注文本添加第一dom(document object model,文档对象模 型)元素。
52.标签层用于渲染第一dom元素,并展示渲染后的第一dom元素。
53.需要说明的是,第一文本节点和第二文本节点的层位置可以互换。比 如,第一文本节点在第二文本节点的上面,或者第二文本节点在第一文本 节点的上面。
54.另外,如果目标文本序列中的除第一标注文本之外的其他文本已标注 有dom元素,则在标签层上渲染第一标注文本的第一dom元素的同时, 还需要在标签层上重新渲染其他标注文本的dom元素。这样,本技术实 施例中的渲染成本与标签层上的dom元素个数相关,与目标文本序列的 长度无关。而由于标签层上dom元素个数有限,使得本发明实施例的渲 染成本远低于渲染整个目标文本序列的成本。
55.下面结合图1说明本技术实施例的标注组件。
56.参考图1,将目标文本序列分别展示在第一文本节点和第二文本节点 上。第一文本节点上的“2014年05月21日”是一个html文本节点。第 二文本节点上的目标文本序列中的每个字符以单个的html文本节点进行 展示。即“2”、“0”、“1”、“4”、“年”“0”、“5”、“月”、
ꢀ“
2”、“1”、“日”分别为单个html文本节点。
57.通过第二文本节点接收用户的交互动作,该交互动作用于在目标文本 序列的html文本节点中选择“2014年05月21日”的文本节点,并为该 文本节点对应的第一标注文本添加第一dom元素“日期”。将第一dom 元素“日期”展示在标签层上。由此,实现了用户对目标文本序列中的文 本进行标注。
58.在本发明实施例中,通过第一文本节点展示目标文本序列,通过第二 文本节点将目标文本序列的每一个字符拆分为单个的html文本节点进行 展示。由此,用户可以通过第二文本节点选择至少一个html文本节点, 并为选择的至少一个html文本节点对应的第一标注文本添加第一dom 元素。在标签层上渲染并展示第一dom元素。可见,本发明实施例将目 标文本序列和第一dom元素展示在不同层上,使得目标文本序列和第一 dom元素的渲染互不影响。因此,在增加第一dom元素的情况下,在标 签层上渲染第一dom元素即可,不需要重新渲染目标文本序列,避免在 渲染时出现卡顿的问题。
59.除此之外,由于第一文本节点用于展示目标文本序列,第二文本节点 用于供用户
选取标注文本,即第一文本节点和第二文本节点的分工不同, 这样避免用户选取标注文本时对目标文本序列的展示造成影响,保证了目 标文本序列的正常显示。
60.另外,由于面向的领域较为多样化,一个标注文本的dom元素并不 具有唯一性,有些标注文本很可能会标记为多个不同的dom元素。因此, 需要对文本序列进行交叉或重合抽取,并进行标注。比如,需要标注
ꢀ“
2014年05月21日18时”的dom元素为时间,标注“2014年05月21 日”的dom元素为日期,即“2014年05月21日”是交叉抽取的部分。 但是,在相关技术中,是将需要标注的标注文本包裹在一个标注文本 dom元素内,使用该标注文本dom元素替换文本序列中该需要标注的标 注文本。由于一个标注文本只能替换一次标注文本dom元素,可见,相 关技术无法支持对文本序列进行交叉或重合抽取。
61.而在本技术实施例中,由于目标文本序列中的每个字符作为单个超文 本标记语言文本节点展示在第二文本节点上,因此,在用户从第二文本节 点上选取一个或多个html文本节点,并对所选取的html文本节点对应 的第一标注文本进行标注之后,还可以选择之前已选的html文本节点进 行标注,不需要包裹实体标签,从而支持标注文本交叉或重合抽取。
62.本发明实施例对目标文本序列的长度不敏感,可以支持标注数万字的 目标文本序列。渲染性能与标注结果数量相关,但在增量更新策略下,性 能较基于前端框架的双向数据绑定方案好。经过实践证明,在实际应用环 境下,利用相关技术中的双向数据绑定的标注组件,在目标文本序列的长 度达到5000字以上时性能消耗已较大,存在明显卡顿;在目标文本序列的 长度达到10000字时基本不可用。利用本发明实施例的标注组件,在40000 字的目标文本序列上进行标注,对超过500个实体(实体即上述的标注文 本)进行标注时仍可保证可用。
63.在本技术的一个或多个实施例中,标注组件还包括:图形层。
64.图形层用于渲染第一标注文本的图形元素,并展示渲染后的图形元素。
65.可选地,图形层可以为svg层。
66.在本技术的一个或多个实施例中,图形元素包括以下至少一项:第一 标注文本的背景色块,用于表示第一标注文本与第二标注文本之间具有关 联关系的连接线。
67.下面结合图2说明本技术实施例。
68.如图2所示,在为第一标注文本“2014年05月21日”添加第一dom 元素“日期”的情况下,在标签层上渲染“2014年05月21日”的第一 dom元素“日期”;在图形层上渲染“2014年05月21日”的背景色块。
69.在图2中,图形层位于标签层和文本层之下。其中,标签层和文本层 的位置可以互换。比如,标签层、文本层和图形层从上到下依次排列;或 者,文本层、标签层和图形层从上到下依次排列。
70.另外,图形元素还可以包括用于表示第一标注文本与第二标注文本之 间具有关联关系的连接线。比如,参考图3,第一标注文本为“张三”, 第二标注文本为“**市**路**小区”,通过图形层展示“张三”与“**市 **路**小区”之间的连接线。由于“张三”与“**市**路**小区”在同一 行,那么“张三”与“**市**路**小区”之间的连接线为同行连接线。
71.再比如,继续参考图3,第一标注文本为“张三”,第二标注文本为
ꢀ“
电话136*********”,通过图形层展示“张三”与“电话136*********
”ꢀ
之间的连接线。由于“张
三”与“电话136*********”不在同一行,那么
ꢀ“
张三”与“电话136*********”之间的连接线为跨行连接线。
72.在本技术实施例中,用户可能需要与第一标注文本的第一dom元素 进行交互,比如,修改第一dom元素,而用户不需要与第一标注文本的 图形元素进行交互。基于用户是否需要交互,将第一标注文本的第一 dom元素和图形元素分别渲染在不同的层上,避免用户在与第一dom元 素交互时而对图形元素的显示造成影响。
73.另外,将不存在与用户交互的图形元素展示在图形层上,使得图形元 素、dom元素和目标文本序列分别展示在不同层上。因此,在修改图形 元素(比如增加或删除图形元素)的情况下,避免在渲染修改后的图形元 素时重新渲染目标文本序列和dom元素,从而避免了由于重新渲染目标 文本序列和dom元素而导致的卡顿问题。
74.在本技术的一个或多个实施例中,标签层还用于,检测第一dom元 素与第二dom元素在标签层上展示时是否产生重叠,并在第一dom元素 与第二dom元素产生重叠的情况下,调节第一dom元素和/或第二dom 元素在标签层上的位置,以使第一dom元素和第二dom元素在标签层上 展示时没有重叠;其中,第二dom元素为在标签层上展示的除第一dom 元素之外的任意一个dom元素。
75.在本技术实施例中,通过检测第一dom元素是否与标签层上展示的 其他第二dom元素产生重叠,并在两者产生重叠的情况下,调整两者的 位置,使得两者不产生重叠,避免影响标签层上dom元素的展示效果。
76.在本技术的一个或多个实施例中,第一文本节点与第二文本节点分别 展示的目标文本序列的内容相同,且目标文本序列中的同一个字符在第一 文本节点与第二文本节点上的位置重合。
77.在本技术实施例中,第一文本节点与第二文本节点上展示的目标文本 序列重合,避免展示出的目标文本序列出现重影而影响显示效果。
78.在本技术的一个或多个实施例中,第一dom元素包括dom标签和关 联关系中的至少一项;其中,关联关系为第一标注文本与第二标注文本之 间关联关系;其中,第二标注文本为目标文本序列中的任意一个标注文本。
79.由于用户可能需要与dom标签和关联关系进行交互,比如,修改关 联关系。因此,在标签层上展示关联关系。
80.比如,继续参考图3,在标签层上渲染“张三”和“**市**路**小区
”ꢀ
之间的关联关系为“居民”关系,在标签层上渲染“张三”和“电话136*********”之间的关联关系为“电话”关系。
81.基于上述标注组件,本技术提供一种标注方法,该标注方法使用上述 的标注组件进行标注。图4为本技术实施例提供的一种标注方法的流程示 意图。如图4所示,标注方法包括:
82.s101,利用第一文本节点展示目标文本序列,以及利用第二文本节点 将目标文本序列的每一个字符拆分为单个的html文本节点进行展示;
83.s102,利用第二文本节点接收用户对目标文本序列的交互动作,其中, 交互动作用于在目标文本序列的html文本节点中选择至少一个html文 本节点,并为至少一个html文本节点对应的第一标注文本添加第一 dom元素;
84.s103,利用标签层渲染第一dom元素,并展示渲染后的第一dom元 素。
85.在本技术实施例中,利用第一文本节点展示目标文本序列,利用第二 文本节点将目标文本序列的每一个字符拆分为单个的html文本节点进行 展示。由此,用户可以通过第二文本节点选择至少一个html文本节点, 并为选择的至少一个html文本节点对应的第一标注文本添加第一dom 元素。利用标签层渲染并展示第一dom元素。可见,本发明实施例将目 标文本序列和第一dom元素展示在不同层上,使得目标文本序列和第一 dom元素的渲染互不影响。因此,在增加第一dom元素的情况下,在标 签层上渲染第一dom元素即可,不需要重新渲染目标文本序列,避免在 渲染时出现卡顿的问题。
86.在本技术的一个或多个实施例中,利用第二文本节点接收用户对目标 文本序列的交互动作之后,标注方法还包括:
87.利用图形层渲染第一标注文本的图形元素,并展示渲染后的图形元素。
88.由于上述已经说明图形层渲染并展示第一标注文本的图形元素,在此 不再重复赘述。
89.在本技术的一个或多个实施例中,在所述图形元素包括所述第一标注 文本的背景色块,第一标注文本包括多个字符的情况下,利用图形层渲染 所述第一标注文本的图形元素之前,标注方法还包括:
90.判断第一标注文本的多个字符是否渲染在第二文本节点的同一行或同 一列。其中,有如下两种判断结果:
91.1、第一标注文本的多个字符渲染在第二文本节点的同一行或同一列
92.在此情况下,获取多个字符中的首字符在第二文本节点上的第一起始 位置和多个字符中的最后一个字符在第二文本节点上的第一结束位置;在 图形层上获取对应第一起始位置的第一目标位置和对应第一结束位置的第 二目标位置;将图形层上从第一目标位置到第二目标位置之间的区域作为 目标区域。
93.展示渲染后的所述图形元素,具体包括:在图形层的目标区域展示渲 染后的背景色块。
94.比如,参考图5,“2014年05月21日”渲染在第二文本节点的同一 行,获取多个字符中的首字符“2”在第二文本节点上的第一起始位置202 和最后一个字符“日”在第二文本节点上的第一结束位置203;在图形层 上获取对应第一起始位置202的第一目标位置204和对应第一结束位置203 的第二目标位置205。图形层上目标区域的顶部位置206和底部位置207是 预定的,图形层上第一目标位置204、第二目标位置205、顶部位置206和 底部位置207形成了目标区域208。
95.2、第一标注文本的多个字符未渲染在第二文本节点上的同一行或同 一列
96.在此情况下,获取多个字符被渲染在n行或n列上的n个字符片段, n为大于或等于2的整数;在图形层上获取每个字符片段分别对应的目标 区域。
97.展示渲染后的所述图形元素,具体包括:在图形层的目标区域展示渲 染后的背景色块。
98.其中,在图形层上获取一个字符片段对应的目标区域,具体包括:
99.获取字符片段的首字符在文本层上的第二起始位置和字符片段的最后 一个字符在文本层上的第二结束位置;
100.在图形层上获取对应第二起始位置的第三目标位置和对应第二结束位 置的第四目标位置;
101.将图形层上从第三目标位置到第四目标位置之间的区域作为字符片段 对应的目标区域。
102.比如,参考图6,第一标注文本为“2014年05月21日”,其中的
ꢀ“
2014年05月”位于第一行的最后位置,“21日”位于第二行的起始位 置。针对其中一个字符片段“2014年05月”,获取该字符片段的首字符
ꢀ“
2”在文本层上的起始位置209和该字符片段的最后一个字符“月”在文 本层上的结束位置210。在图形层上获取对应起始位置209的目标位置211 和对应结束位置210的目标位置212。由于图形层上“2014年05月”对应 行的顶部位置和底部位置是预先设定的,因此,可以将图形层上“2014年 05月”对应行上的从目标位置211到目标位置212之间的区域作为“2014 年05月”对应的目标区域213。在该目标区域213内展示渲染后的一部分 背景色块。
103.同理,对于另一个字符片段“21日”,在图形层上获取对应该字符片 段的首字符“2”起始位置的目标位置214,以及对应该字符片段的最后一 个字符“日”结束位置的目标位置215。将图形层上“21日”对应行上的 从目标位置214到目标位置215之间的区域作为“21日”对应的目标区域 216。在该目标区域216内展示渲染后的另一部分背景色块。由此,实现了 在图形层上展示“2014年05月21日”的背景色块,达到图6中217所示 的效果。
104.本发明实施例中,通过判断第一标注文本的多个字符是否渲染在第二 文本节点的同一行或同一列。如果第一标注文本的多个字符渲染在第二文 本节点上的同一行或同一列,那么在图形层上确定一个目标区域,并在目 标区域内展示第一标注文本的背景色块。如果第一标注文本的多个字符未 渲染在第二文本节点上的同一行或同一列,那么在图形层上确定多个目标 区域,并分别在每个目标区域内展示背景色块。由此,实现了在图形层上 展示第一标注文本的背景色块。
105.在本技术的一个或多个实施例中,展示渲染后的第一dom元素之前, 标注方法还包括:
106.利用标签层检测第一dom元素与第二dom元素在标签层上展示时是 否产生重叠;
107.在第一dom元素与第二dom元素产生重叠的情况下,利用标签层调 节第一dom元素和/或第二dom元素在标签层上的位置,以使第一dom 元素和第二dom元素在标签层上展示时不存在重叠;
108.其中,第二dom元素为在标签层上展示的任意一个dom元素。
109.在本技术实施例中,通过检测第一dom元素是否与标签层上展示的 其他第二dom元素产生重叠,并在两者产生重叠的情况下,调整两者的 位置,使得两者不产生重叠,避免影响标签层上dom元素的展示效果。
110.下面通过图7对上述实施例进一步地说明。图7示出了本发明提供的 另一个实施例的标注方法的流程示意图。如图7所示,标注方法包括:
111.s301,接收用户上传的目标文本序列。
112.s302,初始化目标文本序列。具体是利用所述第一文本节点展示目标 文本序列,以及利用所述第二文本节点将所述目标文本序列的每一个字符 拆分为单个的html文本节点进行展示。
113.s303,渲染目标文本序列中各实体已有的标注结果。具体是在dom 标签层上渲染目标文本序列中各实体的dom元素,在图形层渲染各实体 的背景色块。
114.s304,利用第二文本节点接收用户对目标文本序列的交互动作。该交 互动作用于在所述目标文本序列的html文本节点中选择至少一个html 文本节点,并为所述至少一个html文本节点对应的第一标注文本添加第 一dom元素。
115.s305,判断第一标注文本的多个字符是否在同一行。在判断第一标注 文本的多个字符在同一行的情况下,执行s306;在判断第一标注文本的多 个字符不在同一行的情况下,执行s307。
116.s306,获取第一标注文本在目标文本序列中的位置。该位置包括第一 标注文本的首字母的位置和第一标注文本的最后一个字母的位置。
117.s307,确定断行位置。该断行位置指第一标注文本的多个字符被分离 的位置。比如,从第一标注文本的首字符至第一标注文本中的字符a在同 一行,从第一标注文本的字符b至第一标注文本中的最后一个字符在另一 行,字符a与字符b相邻。那么,断行位置包括字符a的结束位置和字符 b的起始位置。
118.s308,绘制第一标注文本的第一dom元素和背景色块。其中,在图 形层上的目标区域内绘制背景色块。上述已经详细说明如何得到目标区域, 在此不再重复赘述。
119.s309,利用标签层渲染所述第一dom元素,并展示渲染后的所述第 一dom元素,利用图形层渲染所述第一标注文本的背景色块,并展示渲 染后的背景色块。
120.在本发明的一个或多个实施例中,s103之后,标注方法还包括:
121.接收用户将目标文本序列中的第一标注文本与第二标注文本进行关联 的动作;
122.响应于该关联的动作,获取第一标注文本在第二文本节点上的第五目 标位置和第二标注文本在第二文本节点上的第六目标位置;其中,第五目 标位置可以是第一标注文本中的第一目标字符在第二文本节点上的起始位 置、结束位置或中间的任意位置。第六目标位置可以是第二标注文本中的 第二目标字符在第二文本节点上的起始位置、结束位置或中间的任意位置。 第一目标字符可以是第一标注文本中的首字符、最后一个字符或者中间的 任意一个字符。第二目标字符可以是第二标注文本中的首字符、最后一个 字符或者中间的任意一个字符。
123.在标签层上获取对应第五目标位置的第七目标位置以及对应第六目标 位置的第八目标位置;
124.根据第七目标位置和第八目标位置,在图形层上渲染用于表示第一标 注文本与第二标注文本之间关联关系的连接线,并在图形层上展示该连接 线。
125.在本发明的一个或多个实施例中,根据第七目标位置和第八目标位置, 在图形层上渲染用于表示第一标注文本与第二标注文本之间关联关系的连 接线,包括:
126.判断第一标注文本与第二标注文本是否渲染在第二文本节点的同一行 或同一列;
127.在第一标注文本与第二标注文本渲染在第二文本节点上的同一行或同 一列的情况下,在图形层上渲染从第七目标位置到第八目标位置的连接线;
128.在第一标注文本与第二标注文本未渲染在第二文本节点上的同一行或 同一列的情况下,在图形层上渲染从第七目标位置到第一标注文本对应行 或列的结束位置的连接
线,以及从第二标注文本所在行或列的起始位置到 第八目标位置的连接线。
129.下面通过图8对上述实施例进一步地说明。图8示出了本发明提供的 一个实施例的将两个标注文本进行关联的流程示意图。如图8所示,将两 个标注文本进行关联可以包括:
130.s401,接收用户将目标文本序列中的第一标注文本与第二标注文本进 行关联的动作。
131.s402,判断第一标注文本与第二标注文本是否渲染在第二文本节点的 同一行。在判断第一标注文本与第二标注文本渲染在第二文本节点的同一 行的情况下,执行s403。在判断第一标注文本与第二标注文本渲染不在第 二文本节点的同一行的情况下,执行s405。
132.s403,获取第一标注文本和第二标注文本在第二文本节点上的位置。 比如,该位置包括第一标注文本的结束字符在第二文本节点上的结束位置 和第二标注文本的首字符在第二文本节点上的起始位置。
133.s404,根据第一标注文本和第二标注文本在第二文本节点上的位置, 在图形层上绘制从第一标注文本到第二标注文本的行内连接线。
134.s405,确定连接线断行位置。该连接线断行位置包括第一标注文本在 第二文本节点上所在行的结束位置和第二标注文本在第二文本节点上所在 行的起始位置。
135.s406,获取第一标注文本和第二标注文本在目标文本序列中的位置。 比如,该位置包括第一标注文本的结束字符在第二文本节点上的结束位置 和第二标注文本的首字符在第二文本节点上的起始位置。
136.s407,根据第一标注文本和第二标注文本在第二文本节点上的位置以 及连接线断行位置,在图形层上绘制跨行连接线。
137.s408,在图形层上渲染并展示第一标注文本和第二标注文本之间的连 接线。
138.以上便是本发明实施例中将两个实体进行关联的具体实现过程。
139.与本发明实施例的标注方法对应地,本发明实施例提供一种标注装置, 该装置使用上述任意一项所述的标注组件进行标注。图9示出了本发明提 供的一个实施例的标注装置的结构示意图。如图9所示,标注装置包括:
140.第一展示模块501,用于利用所述第一文本节点展示目标文本序列, 以及利用所述第二文本节点将所述目标文本序列的每一个字符作为单个的 html文本节点进行展示;
141.动作接收模块502,用于利用所述第二文本节点接收用户对所述目标 文本序列的交互动作,其中,所述交互动作用于在所述目标文本序列的 html文本节点中选择至少一个html文本节点,并为所述至少一个 html文本节点对应的第一标注文本添加第一dom元素;
142.第一渲染模块503,用于利用所述标签层渲染所述第一dom元素;
143.第二展示模块504,用于展示渲染后的所述第一dom元素。
144.在本发明的一个或多个实施例中,标注装置还包括:
145.第二渲染模块,用于利用图形层渲染所述第一标注文本的图形元素;
146.第三展示模块,用于展示渲染后的所述图形元素。
147.在本发明的一个或多个实施例中,标注装置还包括:
148.检测模块,用于利用所述标签层检测所述第一dom元素与第二dom 元素在所述标签层上展示时是否产生重叠;
149.位置条件模块,用于在所述第一dom元素与所述第二dom元素产生 重叠的情况下,利用所述标签层调节所述第一dom元素和/或所述第二 dom元素在所述标签层上的位置,以使所述第一dom元素和所述第二 dom元素在所述标签层上展示时不存在重叠;
150.其中,所述第二dom元素为在所述标签层上展示的任意一个dom元 素。
151.图10示出了本发明实施例提供的标注设备的硬件结构示意图。
152.标注设备可以包括处理器601以及存储有计算机程序指令的存储器602。
153.具体地,上述处理器601可以包括中央处理器(cpu),或者特定集 成电路(application specific integrated circuit,asic),或者可以被配置 成实施本发明实施例的一个或多个集成电路。
154.存储器602可以包括用于数据或指令的大容量存储器。举例来说而非 限制,存储器602可包括硬盘驱动器(hard disk drive,hdd)、软盘驱 动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus, usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储 器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储 器602可在综合网关容灾设备的内部或外部。在特定实施例中,存储器602 是非易失性固态存储器。在特定实施例中,存储器602包括只读存储器 (rom)。在合适的情况下,该rom可以是掩模编程的rom、可编程 rom(prom)、可擦除prom(eprom)、电可擦除prom (eeprom)、电可改写rom(earom)或闪存或者两个或更多个以上 这些的组合。
155.处理器601通过读取并执行存储器602中存储的计算机程序指令,以 实现上述实施例中的任意一种标注方法。
156.在一个示例中,标注设备还可包括通信接口603和总线610。其中, 如图10所示,处理器601、存储器602、通信接口603通过总线610连接 并完成相互间的通信。
157.通信接口603,主要用于实现本发明实施例中各模块、装置、单元和/ 或设备之间的通信。
158.总线610包括硬件、软件或两者,将标注设备的部件彼此耦接在一起。 举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、 增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、 工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存 储器总线、多信道架构(mca)总线、外围组件互连(pci)总线、pci
-ꢀ
express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准 协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组 合。在合适的情况下,总线610可包括一个或多个总线。尽管本发明实施 例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
159.该标注设备可以执行本发明实施例中的标注方法,从而实现结合图4、 图7、图8和图9描述的标注方法和装置。
160.另外,结合上述实施例中的标注方法,本发明实施例可提供一种计算 机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算 机程序指令被处理器执行时实现上述实施例中的任意一种标注方法。
161.需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配 置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实 施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过 程并不限于所描述和示出的具体步骤,本领
域的技术人员可以在领会本发 明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
162.以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或 者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成 电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时, 本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段 可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质 或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的 任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、 闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、 射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机 网络被下载。
163.还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤 或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序, 也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例 中的顺序,或者若干步骤同时执行。
164.以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清 楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具 体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应 理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员 在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修 改或替换都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献