一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种文档辅助编辑的方法和系统与流程

2022-03-16 02:46:22 来源:中国专利 TAG:

一种文档辅助编辑的方法和系统
分案说明
1.本技术是2020年09月14日提交的题为“一种文档辅助编辑的方法和系统”的中国专利申请cn202010963770.1的分案申请。
技术领域
2.本技术涉及信息处理技术领域,特别涉及一种文档辅助编辑方法和系统。


背景技术:

3.随着科学技术的迅速发展和知识的快速更新,需要通过大量的文档进行技术交流和知识传播。部分技术人员由于写作水平和编辑时间的限制,导致编辑文档的效率不高和质量欠佳。
4.因此,亟需一种文档辅助编辑的方法和系统,提高文档编辑的效率和质量。


技术实现要素:

5.本说明书实施例的一个方面提供一种文档辅助编辑的方法,应用于客户端,包括:接收并显示服务器基于第一文本获取的第二文本的文本结构;所述第一文本包括至少一条论述,每条所述论述包括至少一个关键点;所述第二文本的文本结构为树形结构,包括与所述至少一条论述或/和所述至少一个关键点对应的至少一个结构节点,所述结构节点通过人工输入生成,或者通过结构节点生成模型生成;所述结构节点生成模型为机器学习模型,输入特征包括所述结构节点的上级结构节点的内容特征和平级结构节点的内容特征;所述第二文本还包括与所述至少一个结构节点对应的至少一个文本单元,所述至少一个文本单元用于说明所述第一文本;检测到所述结构节点被触发时,生成所述结构节点对应的目标文本单元的获取请求,并将所述获取请求发送给所述服务器;接收并显示所述服务器获取的所述目标文本单元。
6.本说明书实施例的另一个方面提供一种文档辅助编辑的系统,包括:文本结构接收模块,用于接收并显示服务器基于第一文本获取的第二文本的文本结构;所述第一文本包括至少一条论述,每条所述论述包括至少一个关键点;所述第二文本的文本结构为树形结构,包括与所述至少一条论述或/和所述至少一个关键点对应的至少一个结构节点,所述结构节点通过人工输入生成,或者通过结构节点生成模型生成;所述结构节点生成模型为机器学习模型,输入特征包括所述结构节点的上级结构节点和平级结构节点的内容特征;所述第二文本还包括与所述至少一个结构节点对应的至少一个文本单元,所述至少一个文本单元用于说明所述第一文本;文本单元请求模块,用于检测到所述结构节点被触发时,生成所述结构节点对应的目标文本单元的获取请求,并将所述获取请求发送给所述服务器;文本单元显示模块,用于接收并显示所述服务器获取的所述目标文本单元。
7.本说明书实施例的一个方面提供一种文档辅助编辑的方法,应用于服务器,包括:获取第一文本,所述第一文本包括一条或多条论述,每条所述论述包括一个或多个关键点;
基于所述第一文本,获取第二文本的文本结构;所述第二文本的文本结构为树形结构,包括与所述至少一条论述或/和所述至少一个关键点对应的至少一个结构节点,所述结构节点通过人工输入生成,或者通过结构节点生成模型生成;所述结构节点生成模型为机器学习模型,输入特征包括所述结构节点的上级结构节点的内容特征和平级结构节点的内容特征;所述第二文本还包括与所述至少一个结构节点对应的至少一个文本单元,所述至少一个文本单元用于说明所述第一文本;向客户端发送所述第二文本的文本结构;接收所述客户端生成的所述结构节点对应的目标文本单元的获取请求;响应于所述获取请求,获取所述目标文本单元并发送给所述客户端。
8.本说明书实施例的另一个方面提供一种文档辅助编辑的系统,包括:第一文本获取模块,用于获取第一文本,所述第一文本包括一条或多条论述,每条所述论述包括一个或多个关键点;文本结构生成模块,用于基于所述第一文本,获取第二文本的文本结构;所述第二文本的文本结构为树形结构,包括与所述至少一条论述或/和所述至少一个关键点对应的至少一个结构节点,所述结构节点通过人工输入生成,或者通过结构节点生成模型生成;所述结构节点生成模型为机器学习模型,输入特征包括所述结构节点的上级结构节点的内容特征和平级结构节点的内容特征;所述第二文本还包括与所述至少一个结构节点对应的至少一个文本单元,所述至少一个文本单元用于说明所述第一文本;文本结构发送模块,用于向客户端发送所述第二文本的文本结构;请求接收模块,用于接收所述客户端生成的所述结构节点对应的目标文本单元的获取请求;文本单元发送模块,用于响应于所述获取请求,获取所述目标文本单元并发送给所述客户端。
9.本说明书实施例的另一个方面提供一种计算机可读存储介质,其特征在于,所述存储介质存储计算机指令,当所述计算机指令被处理器执行时实现文档辅助编辑的方法。
附图说明
10.本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
11.图1是根据本说明书一些实施例所示的文档辅助编辑系统的应用场景示意图;
12.图2是根据本说明书一些实施例所示的应用于服务器的文档辅助编辑的方法示例性流程图;
13.图3是根据本说明书一些实施例所示的应用于客户端的文档辅助编辑的方法示例性流程图;
14.图4是根据本说明书一些实施例所示的文档辅助编辑的示意图;
15.图5是根据本说明书一些实施例所示的结构节点生成模型生成结构节点的方法示意图;
16.图6是根据本说明书一些实施例所示的编辑文本单元的方法的示例性流程图;
17.图7a是根据本说明书一些实施例所示的编辑文本单元的示意图;
18.图7b是根据本说明书一些实施例所示的显示文本结构的版本差异的示意图;
19.图7c据本说明书一些实施例所示的显示文本单元的版本差异的示意图。
具体实施方式
20.为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
21.应当理解,本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
22.如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
23.本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
24.图1是根据本说明书一些实施例所示的文档辅助编辑系统的应用场景示意图。
25.文档辅助编辑的系统可以基于文档的第一文本,生成文档的第二文本的文本结构,并辅助用户编辑第二文本的文本单元。例如,文档辅助编辑系统可以基于专利申请文件的权利要求书,生成说明书提纲,并辅助用户编辑说明书内容。又例如文档辅助编辑系统可以基于企业分析报告的分析结论,生成分析说明提纲,并辅助用户编辑分析说明内容。
26.如图1所示,文档辅助编辑系统的应用场景图100可以包括服务器110、网络120、客户端130和数据库140。服务器110可以包含处理设备112。
27.在一些实施例中,服务器110可以用于处理与数据处理相关的信息和/或数据。在一些实施例中,服务器110可以通过网络120访问储存于客户端130和数据库140中的信息和/或资料。例如,服务器110可以通过网络120获取数据库140中的第一文本。又例如,服务器可以通过网络120接收用户在客户端130输入的第一文本。在一些实施例中,服务器110可以直接与客户端130和/或数据库140连接以访问存储于其中的信息和/或资料。例如,服务器110可以接收客户端生成的结构节点对应的目标文本单元的获取请求。服务器110可以是独立的服务器或者服务器组。该服务器组可以是集中式的或者分布式的(如:服务器110可以是分布系统)。在一些实施例中,服务器110可以是区域的或者远程的。在一些实施例中,服务器110可在云平台上执行。例如,该云平台可包括私有云、公共云、混合云、社区云、分散式云、内部云等中的一种或其任意组合。
28.在一些实施例中,服务器110可包含处理设备112。该处理设备112可处理数据和/或信息以执行一个或多个本技术中描述的功能。例如,处理设备112可以基于已完成的文档获取多组样本数据,完成结构节点生成模型的训练。又例如,处理设备112可以通过训练好的结构节点生成模型,基于第一文本,获取第二文本的文本结构。再例如,处理设备112可以响应于获取请求,获取目标文本单元并发送给客户端130。在一些实施例中,处理设备112可
包含一个或多个子处理设备(例如,单芯处理设备或多核多芯处理设备)。仅仅作为范例,处理设备112可包含中央处理器(cpu)、专用集成电路(asic)、专用指令处理器(asip)、图形处理器(gpu)、物理处理器(ppu)、数字信号处理器(dsp)、现场可编程门阵列(fpga)、可编辑逻辑电路(pld)、控制器、微控制器单元、精简指令集电脑(risc)、微处理器等或以上任意组合。
29.在一些实施例中,网络120可促进数据和/或信息的交换,数据或信息可以包括第一文本、文本单元类型、文本单元要求和第二文本等。在一些实施例中,场景图100中的一个或多个组件(例如,服务器110、客户端130、数据库140)可通过网络120发送数据和/或信息给场景图100中的其他组件。在一些实施例中,网络120可是任意类型的有线或无线网络。例如,网络120可包括缆线网络、有线网络、光纤网络、电信网络、内部网络、网际网络、区域网络(lan)、广域网络(wan)、无线区域网络(wlan)、都会区域网络(man)、公共电话交换网络(pstn)、蓝牙网络、zigbee网络、近场通讯(nfc)网络等或以上任意组合。在一些实施例中,网络120可包括一个或多个网络进出点。例如,网络120可包含有线或无线网络进出点,如基站和/或网际网络交换点120-1、120-2、

,通过这些进出点,场景图100的一个或多个组件可连接到网络120上以交换数据和/或信息。
30.在一些实施例中,客户端130可以是一台计算设备或计算设备组。在一些实施例中,客户端130具有输入的功能,可以用于用户输入数据。例如,输入第一文本。又例如,输入第二文本的文本单元内容。计算设备可以包括手机130-1、平板电脑130-2、笔记本电脑130-3、台式计算机130-4等中的一种或其任意组合。计算设备组可以是集中式或分布式的。在一些实施例中,客户端130可以将输入的第一文本发送到服务器110。相应地,服务器110可以基于输入的第一文本确定第二文本的文本结构发送到客户端130。在一些实施例中,客户端130具有显示的功能,可以用于显示服务器获取的第二文本的文本结构和目标文本单元。
31.在一些实施例中,文档辅助编辑系统中包括:文本结构接收模块、文本单元请求模块、文本单元显示模块和第二文本发送模块。
32.文本结构接收模块,用于接收并显示服务器基于第一文本获取的第二文本的文本结构;第一文本包括至少一条论述,每条论述包括至少一个关键点。
33.在一些实施例中,第二文本的文本结构为树形结构,包括与至少一条论述或/和至少一个关键点对应的至少一个结构节点,结构节点通过人工输入生成,或者通过结构节点生成模型生成;结构节点生成模型为机器学习模型,输入特征包括结构节点的上级结构节点和平级结构节点的内容特征。在一些实施例中,上级结构节点的内容特征或平级结构节点的内容特征包括上级结构节点或平级结构节点的以下一种或多种特征:对应的论述、对应的关键点、对应的文本单元的类型和对对应的文本单元的相关要求。在一些实施例中,内容特征还包括关键点的关键点类型特征;结构节点生成模型为神经网络模型,通过训练生成。在一些实施例中,关键点类型特征通过关键点类型判别模型获得;关键点类型判别模型为机器学习模型,包括嵌入子模型和分类子模型;嵌入子模型基于关键点文本生成关键点文本表示向量;分类子模型基于关键点文本表示向量生成关键点类型特征。
34.在一些实施例中,第二文本还包括与至少一个结构节点对应的至少一个文本单元,至少一个文本单元用于说明第一文本。
35.文本单元请求模块,用于检测到结构节点被触发时,生成结构节点对应的目标文
本单元的获取请求,并将获取请求发送给服务器。
36.文本单元显示模块,用于接收并显示服务器获取的目标文本单元。在一些实施例中,文本单元显示模块还用于显示目标文本单元的多个相邻文本单元;获取对目标文本单元的修改指令;执行修改指令后,显示更新后的目标文本单元。在一些实施例中,文本单元显示模块还用于显示服务器提供的多个第二文本的文本结构的版本差异;显示服务器提供的多个第二文本的文本单元的版本差异。
37.第二文本发送模块,用于基于保存的触发条件,向服务器发送当前第二文本的版本。
38.在一些实施例中,文档辅助编辑系统可以包括:第一文本获取模块、文本结构生成模块、文本结构发送模块、请求接收模块、文本单元发送模块、第二文本获取模块和版本差异确定模块。
39.第一文本获取模块,用于获取第一文本,第一文本包括一条或多条论述,每条论述包括一个或多个关键点。
40.文本结构生成模块,用于基于第一文本,获取第二文本的文本结构。
41.在一些实施例中,第二文本的文本结构为树形结构,包括与至少一条论述或/和至少一个关键点对应的至少一个结构节点,结构节点通过人工输入生成,或者通过结构节点生成模型生成;结构节点生成模型为机器学习模型,输入特征包括结构节点的上级结构节点的内容特征和平级结构节点的内容特征。
42.在一些实施例中,第二文本还包括与至少一个结构节点对应的至少一个文本单元,至少一个文本单元用于说明第一文本。
43.文本结构发送模块,用于向客户端发送第二文本的文本结构。
44.请求接收模块,用于接收客户端生成的结构节点对应的目标文本单元的获取请求。
45.文本单元发送模块,用于响应于获取请求,获取目标文本单元并发送给客户端。
46.第二文本获取模块,用于从客户端接收当前第二文本的版本。
47.版本差异确定模块,用于确定多个第二文本的文本结构的版本差异并发送给客户端;以及用于确定多个第二文本的文本单元的版本差异并发送给客户端。
48.图2是根据本说明书一些实施例所示的应用于服务器的文档辅助编辑的方法示例性流程图。
49.文档是描述分析结果和/或研究成果的文字集合。在一些实施例中,文档可以是分析规律和现象的报告。例如,企业分析报告、市场分析报告、经济形势分析报告和社会问题分析报告等。在一些实施例中,文档也可以是解决技术问题的方案。例如,产品设计方案、工程技术方案、经营管理方案等。在一些实施例中,文档还可以是学术研究成果的总结。例如,学术论文、专利申请文本等。
50.在一些实施例中,文档可以包括第一文本和第二文本。其中,第一文本可以是文档的总结、结论和/或论点等,第二文本可以是文档的阐述、说明和/或论证等。例如,文档是企业分析报告,则第一文本是分析结论,第二文本是分析说明。又例如,文档是专利申请文本,则第一文本是权利要求书,第二文本是说明书。
51.如图2所示,所述应用于服务器的文档的辅助编辑方法200可以包括:
52.步骤210,获取第一文本。具体地,步骤210可以由第一文本获取模块执行。
53.如前所述,第一文本可以是文档的总结、结论和/或论点等。
54.在一些实施例中,第一文本可以包括一条或多条论述。每条论述可以表征第一文本的一个方面。在一些实施例中,每条论述包括一个或多个关键点。关键点是论述的主要内容,每个关键点可以表征论述的一个要点。
55.示例性地,继续以企业分析报告为例,第一文本是分析结论,包括3条论述:论述1为企业经营状况分析结论,论述2为企业财务状况分析结论,论述3为企业价值评估结论;其中,论述1包括2个关键点:关键点1为企业的产量,关键点2为企业的销售业绩。
56.又一示例性地,继续以专利申请文本为例,第一文本是权利要求书,包括3条论述,分别为权利要求1、权利要求2和权利要求3;其中,权利要求1包括2个关键点,即2个不同的技术特征。
57.在一些实施例中,服务器可以从用户在客户端的输入获取第一文本,也可以通过读取存储数据、调用相关接口或其他方式获取。
58.步骤220,基于第一文本,获取第二文本的文本结构。具体的,步骤220可以由文本结构生成模块执行。
59.如前所述,第一文本可以是文档的总结、结论和/或论点等,第二文本可以是文档的阐述、说明和/或论证等。可以理解,第二文本可以用于说明第一文本。例如,企业分析报告的分析说明可以用于说明分析结论。又例如,专利申请文本的说明书可以用于说明权利要求书。
60.文本结构是指第二文本的布局,例如,内容提纲和标题等。在一些实施例中,文本结构可以包括第二文本的内容提要和位置层次。在一些实施例中,文本结构为树形结构,包括与至少一条论述或/和至少一个关键点对应的至少一个结构节点。
61.其中,结构节点可以表征第二文本的内容提要。示例地,以图4为例,结构节点1.1“步骤210”可以表征第二文本要对“步骤210”进行说明。在一些实施例中,结构节点和第一文本的论述和/或关键点对应。示例地,继续以图4的专利申请文本为例,结构节点1“概述”对应权利要求书(即第一文本)中的权利要求1(即论述1),结构节点1.1“步骤210”对应权利要求书(即第一文本)中权利要求1(即论述1)的技术特征1(即关键点1),表征第二文本要对第一文本的论述1和关键点1进行说明。
62.树形结构是第二文本的位置层次,同时可以表征对应第二文本的位置层次。如图4所示的树形结构,结构节点1.1“步骤210”、结构节点1.2“步骤220”和结构节点1.3“步骤230”均为结构节点1“概述”的子节点,因此,结构节点1.1、结构节点1.2和结构节点1.3的位置在同一层次,为平级结构节点,对应的第二文本“步骤210内容”、“步骤220内容”和“步骤230内容”的位置相应也在同一层次;结构节点1“概述”的位置在上一个层次,为结构节点1.1、结构节点1.2和结构节点1.3的上级结构节点,对应的第二文本“概述内容”也在上一个层次。在一些实施例中,结构节点的平级结构节点包括该结构节点。例如,结构节点1.1平级结构节点不仅包括结构节点1.2和结构节点1.3,还包括结构节点1.1。
63.在一些实施例中,结构节点通过获取人工输入生成。具体地,可以基于第一文本的论述和/或关键点,人工输入对应的结构节点及其位置层次。
64.在一些实施例中,结构节点可以通过结构节点生成模型生成。结构节点生成模型
为机器学习模型,输入特征包括结构节点的上级结构节点和平级结构节点的内容特征。可以理解,当结构节点为一级结构节点,没有对应的上级结构节点时,输入特征仅包括平级结构节点的内容特征。结构节点生成模型生成结构节点的相关描述参见图4,在此不再赘述。
65.在一些实施例中,第二文本还包括与至少一个结构节点对应的至少一个文本单元。文本单元是第二文本的组成元素,第二文本可以按照不同的内容划分成不同的文本单元。可以理解,每一个文本单元对应一个结构节点。第二文本的文本单元可以用于说明第一文本,即第二文本可以用于说明第一文本。关于文本单元的详细描述可以参见步骤320,在此不再赘述。
66.步骤230,向客户端发送第二文本的文本结构。具体的,步骤230可以由文本结构发送模块执行。
67.在一些实施例中,服务器可以向客户端发送第二文本的文本结构,包括结构节点和树形结构。
68.步骤240,接收客户端生成的结构节点对应的目标文本单元的获取请求。具体的,步骤240可以由请求接收模块执行。
69.结构节点对应的目标文本单元即用户在客户端的用户界面触发的结构节点所对应的文本单元。详细描述参见步骤320,在此不再赘述。
70.在一些实施例中,服务器可以接收客户端发送的获取请求。例如,服务器接收到客户端发送的目标文本单元“步骤220内容”的获取请求。
71.步骤250,响应于获取请求,获取目标文本单元并发送给客户端。具体的,步骤250可以由文本单元发送模块执行。
72.在一些实施例中,服务器可以响应于获取请求,通过读取数据库存储数据、调用相关接口或其他方式获取目标文本单元。
73.可以理解,数据库中存储的目标文本单元可以是服务器生成的空白文本单元,也可以是用户编辑后保存的文本单元。在一些实施例中,服务器通过步骤220基于第一文本,获取第二文本的文本结构后,同时生成与文本结构中每个结构节点对应的空白文本单元,并将文本结构和空白的文本单元存储在数据库中。在一些实施例中,服务器还可以从客户端获取用户编辑后保存的第二文本的文本单元,并将编辑后保存的文本单元存储在数据库中。
74.进一步地,服务器将目标文本单元发送给客户端。
75.图3是根据本说明书一些实施例所示的应用于客户端的文档辅助编辑的方法示例性流程图。如图3所示,所述文档的辅助编辑方法300用于客户端可以包括:
76.步骤310,接收并显示服务器基于第一文本获取的第二文本的文本结构。具体的,步骤310可以由文本结构接收模块执行。
77.在一些实施例中,客户端可以接收服务器基于第一文本获取的第二文本的文本结构。服务器基于第一文本获取第二文本的详细描述参见步骤220,在此不再赘述。
78.在一些实施例中,客户端可以在用户界面显示接收的文本结构,包括结构节点和树形结构。在一些实施例中,用户界面可以基于用户的操作,显示文本结构的全部或一部分。例如,操作可以包括折叠(用
“‑”
表示)、展开(用“ ”表示)、滚动(用双向箭头表示)和缩放等。
79.在一些实施例中,第二文本还包括与至少一个结构节点对应的至少一个文本单元。文本单元是第二文本的组成元素,第二文本可以按照不同的内容划分成不同的文本单元。图4所示的专利申请文本,为了进一步说明文本单元1对应的权利要求1,可以按照“步骤210内容”、“步骤220内容”和“步骤230内容”将第二文本中的内容划分为三个文本单元:文本单元1.1、文本单元1.2和文本单元1.3,分别用于说明权要求1的3个技术特征。
80.在一些实施例中,每一个文本单元对应一个结构节点。如图4所示,文本单元1.1“步骤210内容”对应结构节点1.1“步骤210”,文本单元1.2“步骤220内容”对应结构节点1.2“步骤220”,文本单元1.3“步骤230内容”对应结构节点1.3“步骤230”。
81.第二文本的文本单元可以用于说明第一文本,即第二文本可以用于说明第一文本。可以理解,结构节点对应的文本单元用于说明该结构节点对应的第一文本的论述和/或关键点。示例地,继续以图4的专利申请文本为例,结构节点1“概述”对应权利要求书(即第一文本)中的权利要求1(即论述1),则对应的文本单元1“概述内容”可以用于说明权利要求1(论述1);结构节点1.1“步骤210”对应权利要求书(即第一文本)中权利要求1(即论述1)的技术特征1(即关键点1),则对应的文本单元1,1“步骤210内容”可以用于说明技术特征1(即关键点1)。
82.步骤320,检测到结构节点被触发时,生成结构节点对应的目标文本单元的获取请求,并将获取请求发送给服务器。具体的,步骤320可以由文本单元请求模块执行。
83.如前所述,结构节点可以表征第二文本的内容提要。结构节点的详细描述可以参见步骤220,在此不再赘述。
84.结构节点对应的目标文本单元是被触发的结构节点所对应的文本单元。在一些实施例中,客户端可以检测用户是否对用户界面显示的结构节点进行了触发的操作行为。在一些实施例中,触发的操作行为可以包括但不限于:单击、双击、框选、触摸和手势输入等。具体地,用户对用户界面显示的结构节点进行操作时,客户端可以检测到用户界面上的触发,则生成结构节点对应的目标文本单元的获取请求。
85.在一些实施例中,客户端可以将获取请求发送给服务器。
86.例如,用户单击用户界面显示的结构节点“步骤220”时,客户端检测到用户界面结构节点“步骤220”被触发,则生成目标文本单元“步骤220内容”的获取请求,并将请求发送给服务器。
87.步骤330,接收并显示服务器获取的目标文本单元。具体的,步骤330可以由文本单元显示模块执行。
88.在一些实施例中,客户端可以接收服务器获取的目标文本单元。其中,服务器获取的目标文本单元的相关描述参见步骤250,在此不再赘述。
89.进一步地,客户端接收目标文本单元后,可以在用户界面显示目标文本单元,以便用户可以在用户界面编辑文本单元的内容。如图7a所示,用户在客户端的用户界面单击结构节点“步骤220”,客户端检测到“单击”的触发操作,从服务器获取结构节点“步骤220”对应的目标文本单元“步骤220内容”的内容,并在用户界面显示目标文本单元。其中,目标文本单元的内容可以是已编辑的内容,也可以是未编辑的空白内容。
90.编辑文本单元的内容的相关描述参见图6,在此不再描述。
91.上述实施例至少具备以下有益效果:基于文本结构编辑文本单元,能够使第二文
本具有结构化的特点,明确每一结构节点所对应的文本单元的特性,方便灵活调整文本的结构。进而,基于明确的数据结构,才能够通过机器学习模型辅助生成结构节点,提高撰写效率和文档的质量。
92.图5是根据本说明书一些实施例所示的结构节点生成模型生成结构节点的方法示意图。
93.结构节点生成模型可以生成结构节点。如前所述,在一些实施例中,为了基于结构节点生成模型生成结构节点,输入包括结构节点的上级结构节点的内容特征和平级结构节点的内容特征,输出为结构节点。
94.其中,上级结构节点是结构节点的父节点,平级结构节点和结构节点有共同的父节点。示例地,继续以图4为例,假设为了生成结构节点1.2“步骤220”,如前所述,则输入包括:上级结构节点:结构节点1的内容特征,平级结构节点:结构节点1.1的内容特征、结构节点1.2的内容特征和结构节点1.3的内容特征。
95.结构节点的内容特征是指结构节点内容来源的基础。在一些实施例中,内容特征包括结构节点的以下一种或多种特征:结构节点对应的论述、结构节点对应的关键点、结构节点对应的文本单元的类型和对结构节点对应的文本单元的相关要求。可以理解的,平级结构节点的内容特征为平级结构节点对应的上述特征内容,上级结构节点的内容特征为上级结构节点对应的上述特征内容。
96.如前所述,结构节点和第一文本的论述和/或关键点对应,其中,每条论述可以表征第一文本的一个方面,每个关键点可以表征论述的一个要点。如图4所示,上级结构节点1和第一文本(即权利要求书)的论述1(即权利要求1)对应,平级结构节点1.1和论述1(即权利要求1)的关键点1(即技术特征1)对应,平级结构节点1.2和论述1(即权利要求1)的关键点2(即技术特征2)对应,平级结构节点1.3和论述1(即权利要求1)的关键点3(即技术特征3)对应。
97.如前所述,每一个结构节点对应一个文本单元。其中,文本单元的类型是指文本单元内容的形式。例如,图号说明、附图说明、概述、定义、操作、示例、扩展、有益效果、公式、标准表述和其他等。如图4所示,上级结构节点1对应的文本单元1“概述内容”(未示出)的类型是【概述】,平级结构节点1.1对应的文本单元1.1“步骤210内容”的类型是【操作】,平级结构节点1.2和平级结构节点1.3对应的文本单元1.2和文本单元1.3的类型是【算法】。在一些实施例中,文本单元的类型可以通过人工输入或人工选择获取,也可以基于结构节点通过分类模型获取。
98.文本单元的相关要求是指文本单元内容的提示性和注释性文本。例如,详略程度、注意事项和参考内容等。例如,上级结构节点1对应的文本单元1“概述内容”的相关要求是【简略说明】,平级结构节点1.1对应的文本单元“步骤210内容”的相关要求是【详细描述】,平级结构节点1.2和平级结构节点1.3对应的文本单元1.2和文本单元1.3的相关要求也是【详细描述】。在一些实施例中,文本单元的相关要求可以通过人工输入获取。
99.在一些实施例中,结构节点的内容特征还包括关键点类型特征。
100.关键点类型特征是指关键点类型的属性。例如,前述企业分析报告的关键点1“企业的产量”和关键点2“企业的销售业绩”的类型特征是数据。又例如,专利申请文件的关键点是技术特征,则技术特征类型的特征可以包括模型结构、算法、材料、成分和结构等。
101.在一些实施例中,关键点类型特征可以通过关键点类型判别模型获得。在一些实施例中,关键点类型判别模型为机器学习模型。
102.在一些实施例中,关键点类型判别模型包括嵌入子模型和分类子模型。
103.在一些实施例中,嵌入子模型可以基于关键点生成关键点文本表示向量。具体地,嵌入子模型可以先将关键点文本中的词向量化,得到词向量,再基于得到的词向量确定关键点文本表示向量。在一些实施例中,嵌入子模型可以包括但不限于:word2vec模型、词频-逆向文件频率模型(term frequency

inverse document frequency,tf-idf)、sswe-c(skip-gram based combined-sentiment word embedding)模型和神经网络模型等。
104.在一些实施例中,分类子模型可以基于关键点文本表示向量生成关键点类型特征。具体地,分类子模型可以将输入的关键点文本表示向量映射成数值或概率,再基于数值或概率得到关键点类型特征。在一些实施例中,分类子模型可以是但不限于logistic回归模型、朴素贝叶斯分类模型、高斯分布贝叶斯分类模型、决策树模型、随机森林模型、knn分类模型、神经网络模型等。
105.如前所述,结构节点生成模型的输入包括待生成结构节点的上级结构节点和平级结构节点的内容特征,输出为结构节点。具体地,结构节点生成模型可以先将内容特征向量化,再对向量化后的内容特征进行编码,得到融合了内容特征的语义向量,再基于该语义向量获取结构节点。
106.如图4所示,上级结构节点1与论述对应,因此没有关键点类型特征;平级结构节点1.1的关键点类型特征为【数据】,平级结构节点1.2和平级结构节点1.3的关键点类型特征为【结构】。
107.综上所述,继续以图4为例,假设“步骤220”是待生成结构节点,则将上级结构节点1的内容特征:论述【权利要求1】、文本单元“概述内容”的类型【概述】、相关要求【简略说明】,以及平级结构节点1.1的内容特征:关键点【技术特征1】、文本单元“步骤210内容”的类型【操作】、相关要求【详细描述】、关键点类型特征【数据】,平级结构节点1.2的内容特征:关键点【技术特征2】、文本单元“步骤220内容”的类型【算法】、相关要求【详细描述】、关键点类型特征【结构】,和平级结构节点1.3的内容特征:关键点【技术特征3】、文本单元“步骤230内容”的类型【算法】、相关要求【详细描述】、关键点类型特征【结构】输入结构节点生成模型,输出结构节点“步骤220”。
108.在一些实施例中,结构节点生成模型可以包括但不限于双向长短记忆循环神经网络(bi-directional long short-term memory,bi-lstm)模型、elmo(embedding from language models)模型、gpt(generative pre-traxining)模型和bert(bidirectional encoder representation from transformers)模型等。
109.在一些实施例中,可以基于大量带有标识的训练样本训练结构节点生成模型。具体地,将带有标识的训练样本输入结构节点生成模型,通过训练更新结构节点生成模型的参数。
110.在一些实施例中,训练样本可以是样本结构节点的上级结构节点的内容特征和平级结构节点的内容特征。在一些实施例中,标识可以是样本结构节点。在一些实施例中,训练样本和标识可以基于已完成的文档,通过人工输入、读取存储数据、调用相关接口或其他方式获取。
111.在一些实施例中,可以基于训练样本,通过常用的方法进行训练。例如,可以基于梯度下降法进行训练。在一些实施例中,当训练的模型满足预设条件时,训练结束。
112.上述实施例至少具备以下之一的技术效果:(1)基于第一文本,通过神经网络模型,能够获取高质量的文本结构;(2)基于用户设定的第二文本的文本单元类型和要求,可以过滤掉不符合用户设定的文本结构,实现生成的文本结构可控。
113.图6是根据本说明书一些实施例所示的编辑文本单元的内容的方法示意图。如图6所示,所述编辑文本单元的内容的方法600可以包括:
114.步骤610,显示目标文本单元的多个相邻文本单元。
115.如前所述,客户端的用户界面可以显示服务器获取的目标文本单元。
116.在一些实施例中,用户界面可以显示目标文本单元的多个相邻文本单元。具体地,客户端可以基于目标文本单元的内容,向服务器发送获取多个相邻文本单元的请求,并接收和显示服务器基于请求从数据库获取的多个相邻文本单元。若客户端存储有相邻文本单元,则直接读取并显示。如图7a所示,客户端基于目标文本单元“步骤220内容”,显示上一文本单元“步骤210内容”和下一文本单元“步骤230内容”。
117.在一些实施例中,客户端可以基于用户在客户端对文本单元的选择操作,在用户界面显示选择的当前文本单元的相关信息。其中,相关信息是用于提示用户的与当前文本单元的有关的信息。在一些实施例中,相关信息可以包括当前文本单元对应的当前结构节点的内容特征和用户的修改批注。如图7a所示,用户在客户端的文本单元的页面选择“步骤220内容”为当前文本单元,用户界面则显示对应当前文本单元相关信息,包括当前结构节点“步骤220”的内容特征,以及用户对当前文本单元的修改批注。可以理解,用户在输入修改指令时可以参考文本单元的相关信息。修改指令的相关描述参见步骤620,在此不再赘述。
118.步骤620,获取对目标文本单元的修改指令。
119.在一些实施例中,客户端可以获取用户对目标文本单元的修改指令。其中,修改指令可以是对文本单元中未编辑的空白内容进行编辑,从而得到第二文本的初始版本;修改也可以是指对文本单元中已编辑的内容进行编辑。可以理解,每一次修改对应第二文本的一个版本。
120.步骤630,执行修改指令后,显示更新后的目标文本单元。
121.进一步地,客户端执行修改指令后,用户界面可以显示内容被更新后(即,修改后)的目标文本单元。
122.示例性地,客户端获取并在用户界面显示的目标文本单元的内容为空白,客户端获取用户对目标文本单元的输入“在步骤220中”后,在用户界面显示目标文本单元的内容为“在步骤220中”。
123.在一些实施例中,客户端可以基于保存的触发条件,向服务器发送当前第二文本的版本。
124.在一些实施例中,保存的触发条件可以是达到预设的时间间隔。具体地,客户端可以基于预设的时间间隔,自动获取当前时间第二文本的内容,向服务器发送当前第二文本的版本。
125.在一些实施例中,保存的触发条件还可以是客户端检测到用户保存第二文本的版
本的操作。具体地,客户端可以接收到用户触发的保存指令后,将当前第二文本的版本发送给服务器。
126.进一步的,服务器从客户端接收到当前第二文本的版本后,可以存储在数据库中。在一些实施例中,服务器可以只存储第二文本的初始版本和最新修改的版本,也可以保存第二文本的所有版本。
127.在一些实施例中,客户端可以显示文本结构的版本差异和显示文本单元的版本差异。在一些实施例中,用户可以通过客户端选择需要显示差异的多个版本的第二文本。在一些实施例中,客户端也可以在接收到用户触发的显示差异指令后,自动选择最新版本和上一版本的第二文本。具体地,客户端向服务器发送多个版本的第二文本的文本结构和/或文本单元的差异获取请求,服务器接收到请求后,从数据库调取多个版本的第二文本,并确定多个第二文本的文本结构的版本差异和/或文本单元的版本差异。
128.进一步地,客户端可以显示服务器提供的多个第二文本的文本结构的版本差异和/或文本单元的版本差异。如图7b所示,可以基于用户在客户端的选择操作,在文本结构页面对比显示当前版本的文本结构和历史版本的文本结构。进一步的,用户通过对比当前版本的文本结构和历史版本的文本结构,获取两个版本的差异。
129.在一些实施例中,客户端可以在其中一个版本的第二文本上,以批注的方式显示其他版本的差异。如图7c所示,可以基于用户在客户端的选择操作,在文本单元页面以批注的方式显示当前版本的文本单元和历史版本的文本单元的差异。
130.上述实施例至少具备以下之一的技术效果:(1)文本单元编辑界面能够显示文本结构节点和文本单元的对应关系,便于用户快速定位相应的内容,从而提高文档编辑效率;(2)基于用户选择,文本单元编辑界面可以显示文本结构和文本单元的各版本差异,便于用户学习总结,从而提升用户文档编辑能力;(3)客户端可以自动保存用户的版本,从而可以基于用户选择找回历史版本。
131.本说明书实施例还提供一种计算机可读存储介质。所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机实现前述的文档辅助编辑的方法。
132.需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
133.上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
134.同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
135.此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或
对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
136.计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、rf、或类似介质,或任何上述介质的组合。
137.本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如java、scala、smalltalk、eiffel、jade、emerald、c 、c#、vb.net、python等,常规程序化编程语言如c语言、visual basic、fortran2003、perl、cobol2002、php、abap,动态编程语言如python、ruby和groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(lan)或广域网(wan),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(saas)。
138.此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的处理设备或移动设备上安装所描述的系统。
139.同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
140.一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有
±
20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
141.针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、
书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
142.最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献