一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于万有引力的文本交互可视化方法和系统

2022-09-03 23:11:36 来源:中国专利 TAG:


1.本发明属于文本可视化领域,具体涉及一种基于万有引力的文本交互可视化方法和系统。


背景技术:

2.研究性论文是针对某一个或一些问题、现象进行深入分析、讨论并得到有意义结论的文章。在研究性论文中,存在叙述文本体量大、信息面广、分析内容复杂的任务特点。文本可视化技术将文本中复杂或者难以通过文字表达的内容和规律以视觉符号的形式表达出来,其可视化分析的最终目标是使人类能够理解、推理大量文本信息以获得洞察和知识。
3.从处理文档数进行分类,文本可视化方法包括针对单个和多个文档内容的总结和分析。按照文本的语义特征分类,文本可视化通常根据词的出现频率、重要程度、文本逻辑结构、多文本主题聚类、主题动态变化等角度进行设计。现有技术中用文本大小反映文本关键词出现频率、以饼图方式排列的词云支持搜索词共现的对比分析、通过语义图生成文件摘要等方法较为常见。本发明关注静态主题可视化,旨在为一个文本语料库的主题提取构建主题可视化方法。
4.静态主题可视化大多旨在提供一个或多个文本语料库中提取的主题的概述,利用单词列表和词云等形式可视化主题模型。而从视觉隐喻层面和美学角度,现有方法的界面设计和视觉样式较为单一,对语料库主题与视觉特征的关联考虑较少,仍有很大空间以更好地提升用户的沉浸式交互体验。topicpanorama用径向冰柱图的视觉隐喻呈现多个语料库的静态主题可视化分析,但该可视化技术由于涉及多个语料库可能存在视觉效果混乱和显示空间有限的问题。
5.而文本可视化方法的有用性在很大程度上取决于底层视觉隐喻和传达人们想要从其中掌握信息的效率,使用户在浏览或者完成任务时获得高效、舒适的阅读体验。


技术实现要素:

6.为了克服现有技术存在的上述问题,本发明提供一种基于万有引力的文本交互可视化方法和系统,用于解决现有技术中存在的上述问题。
7.一种基于万有引力的文本交互可视化方法,包括如下步骤:
8.s1.文本文档自动提取与统计步骤:
9.对文本文档进行自动提取,获取其中的全部文本、各级标题和每个标题下的文本,按照各级标题将所述文本文档划分为各篇章、各节或各小节,形成提取文档,并对文本全文、各篇章、各节或各小节所包括的字数进行统计;
10.s2.细节自动提取与统计步骤:
11.对文本文档中的各篇章、各节或各节下的各小节进行细节部分的自动提取,获得其中所有的论点、论据和论证,并统计论点、论据和论证所包括的字数;
12.s3.星球体系与文本文档的可视化模型建立步骤:
13.所述星球体系包括星球、行星、行星环以及宇宙尘埃,用各子体系之间的关系将自动提取后的电子文本文档及其细节映射后以可视化方式呈现,所述星球体系各子体系之间运动关系基于万有引力定律。
14.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s3所述行星与星球的质量表示如下:mn=xn/1000,m=x/1000,n≥1,n为所述篇章、节或小节序数,xn为s1中统计的所述第n个篇章、节或小节的文本字数,x为s1中统计的文本全文的字数,m为所述文本全文的星球质量,m1,m2,
…mn
为第n个篇章、节或小节的行星质量。
15.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s3还包括:按照文本全文与各篇章、各篇章与各节、节与小节的顺序,分别计算行星的公转半径和公转速度,由万有引力公式
16.与天体运动学公式联立,求取及其中,g=6.67
×
103为万有引力常数,r1,r2,
…rn
为对应的行星公转半径,v1,v2,

vn为对应行星的公转速度。
17.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,将所述行星以图形表示时,计算方法如下:
18.dn=mn19.αn=vn/100
20.其中dn表示行星的像素直径,αn表示行星公转轨道的不透明度,即将所述行星的质量和速度映射到图形上,分别以行星的公转轨道所在圆环象征各篇章围绕全文、各节围绕各篇章、各小节围绕各节的公转。
21.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,每一篇章、节或小节的行星公转半径和速度受到其上一级行星质量影响,在篇章n=1时取α1=100%,得到v1=1,得到篇章一的轨道半径:从而所述行星的公转轨道半径的等差轨迹通过如下公式获取:
22.δr=max(mn)
×223.rn=r
n-1
δr,n≥2。
24.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,以不同颜色的行星表示不同的篇章、节和小节。
25.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在以行星环表示各小节的论证,其上的宇宙尘埃表示论据时,此时行星环不透明度为定值,即αn=100%,宇宙尘埃的公转环轨道半径与行星公转轨道半径相同,即公转轨道为行星环,宇宙尘埃的像素直径d'n与所述行星的像素直径计算同理,即d'n=m'n,m'n=x'n/1000,此时输入x'n为论据所包括的字数。
26.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s3中所述行星环宽度的求取方式如下:pn=x”n
/1000,n≥1,其中,x”n
为所述论证包括的文本字数。
27.本发明还提供了一种基于万有引力的文本交互可视化系统,所述系统包括:文本文档自动提取与统计,用于获取其中的全部文本、各级标题和每个标题下的文本,按照各级标题将所述文本文档划分为各篇章、各节或各小节,形成提取文档,并对文本全文、各篇章、各节或各小节所包括的字数进行统计;
28.细节自动提取与统计模块:用于对文本文档中的各篇章、各节或各节下的各小节进行细节部分的自动提取,获得其中所有的论点、论据和论证,并统计论点、论据和论证所包括的字数;
29.星球体系与文本文档的可视化模型建立模块:所述星球体系包括星球、行星、行星环以及宇宙尘埃,用各子体系之间的关系将自动提取后的电子文本文档及其细节映射后以可视化方式呈现,所述星球体系各子体系之间运动关系基于万有引力定律。
30.本发明还提供了一种终端,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行本发明所述的基于万有引力的文本交互可视化方法。
31.本发明的有益效果
32.与现有技术相比,本发明有如下有益效果:
33.1.在万有引力定律框架下,利用象征文章框架的星球系统、象征论证的行星环、象征论据的突出显示的尘埃点三种视觉组件构成连贯的视觉隐喻,以行星之间力与运动的平衡、行星环上宇宙尘埃的构成,传达整篇文章与各篇章、各节及各小节的结构及论证与论据之间的复杂关系。
34.2.从宏观组合论证、论据,到论证原文文本,通过用户交互完成星球与行星、行星与行星环、详细论证三个层级信息的组合呈现,提升用户对文本文档的整体理解和对论证的高效获取。
35.3该可视化方法用天体物理中的万有引力编码星球、行星、行星环与宇宙尘埃,计算方法符合自然规律的同时,形成自然的视觉隐喻:用星球和行星的相对运动表示文本文档的整体与各篇章、各篇章与各节、节与小节之间的关系,用行星与行星环、宇宙尘埃的相对运动象征文章各节与论证、论据的关系。以质量m、mn表示文本全文及各章、各节或和各小节的质量,以公转轨道半径构架公转轨迹的章节结构、行星环的论证结构,以公转速度与不透明度进行映射,帮助用户直观获取论文论证结构、简化研究模式和认知模式方面的有效性和有用性。
附图说明
36.图1为本发明的实施例中方法流程示意图;
37.图2为本发明的实施例中星球大小与最内层公转轨道示意图;
38.图3为本发明的实施例中行星公转轨道半径示意图;
39.图4为本发明的实施例中行星环示意图;
40.图5为本发明的实施例中星球系统的颜色示意图;
41.图6为本发明的实施例中界面流程的示意图。
具体实施方式
42.为了更好的理解本发明的技术方案,本发明内容包括但不限于下文中的具体实施方式,相似的技术和方法都应该视为本发明保护的范畴之内。为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
43.应当明确,本发明所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
44.在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
45.如图1所示为本发明的基于万有引力的文本交互可视化方法,包括如下步骤:
46.一种基于万有引力的文本交互可视化方法,包括如下步骤:
47.s1.文本文档自动提取与统计步骤:
48.对文本文档进行自动提取,获取其中的全部文本、各级标题和每个标题下的文本,按照各级标题将所述文本文档划分为各篇章、各节或各小节,形成提取文档,并对文本全文、各篇章、各节或各小节所包括的字数进行统计;
49.s2.细节自动提取与统计步骤:
50.对文本文档中的各篇章、各节或各节下的各小节进行细节部分的自动提取,获得其中所有的论点、论据和论证,并统计论点、论据和论证所包括的字数;
51.s3.星球体系与文本文档的可视化模型建立步骤:
52.所述星球体系包括星球、行星、行星环以及宇宙尘埃,用各子体系之间的关系将自动提取后的文本文档及其细节映射后以可视化方式呈现,所述星球体系各子体系之间运动关系基于万有引力定律。
53.优选地,本发明的实施例中所述所述s3包括用星球和行星的关系表示文本文档的整体与各篇章、各篇章与各节、各节与各小节之间的关系,以星球表示篇章,以行星表示各篇章、各节或各小节的质量,所述行星与星球的质量表示如下:mn=xn/1000,m=x/1000,n≥1,n为所述篇章、节或小节序数,xn为所述第n个篇章、节或小节的文本字数,x为全部文本全文的文本字数,m为所述全部文本全文的星球质量,m1,m2,
…mn
为第n个篇章、节或小节的行星质量。
54.优选地,本发明的实施例中所述s3还包括:计算行星的公转半径和公转速度,由万有引力公式和天体运动学公式联立:
55.得到
56.其中,g=6.67
×
103为万有引力常数,r1,r2,
…rn
为对应的行星公转半径,v1,v2,

vn为对应行星的公转速度。在某一篇章中,以该篇章与节之间的关系求解为例,m为全文的星球质量,m1,m2,
…mn
是本篇章第n节的行星质量。
57.优选地,本发明的实施例中将所述行星以图形表示时,如图2所示,计算方法如下:
58.dn=mn59.αn=vn/100
60.其中dn表示行星的像素直径,αn表示行星公转轨道的不透明度,即将所述行星的公转半径和速度映射到图形上,分别以行星的公转轨道所在圆环象征各篇章围绕全文、各节围绕各篇章、各小节围绕各节的公转,其中,公转轨道像素宽度pn=1其中的一级标题表示的是全部文本全文,二级标题表示各篇章、各节或各小节。
61.优选地,本发明的实施例中所述行星的公转轨道半径的等差轨迹通过如下公式获取,如图3所示:
62.δr=max(mn)
×263.rn=r
n-1
δr,n≥2,每级的行星公转半径和速度只受到其上一级行星质量影响,在第一篇章下,首先取α1=100%,得到v1=1,得到所述篇章一的轨道半径:由r1=1,rn=r
n-1
δr,n≥2,求得r2,
…rn
后,利用求取v2,

vn。
64.优选地,本发明的实施例中以不同颜色的行星表示不同的篇章、节和小节。同级行星使用相同的颜色表示,且同级篇章、节下的次级行星颜色相同,但饱和度逐渐降低。
65.优选地,本发明的实施例中以行星环表示论证,其中突出的宇宙尘埃点表示论据,如图4所示,此时行星环不透明度为定值,即αn=100%,宇宙尘埃的公转环轨道半径与行星公转轨道半径相同,即公转轨道即为行星环,尘埃的像素直径d'n与所述行星的像素直径计算同理,即d'n=m'n,m'n=x'n/1000,此时输入x'n为论据包括的字数。
66.具体的处理过程如下:图1所示为本发明的方法示意图。输入是包括章节、文本、论点与论据的文档不同论证板块的数据样本,输出是代表每个板块的图形元素,目标是通过求解行星及宇宙尘埃的直径dn、公转轨道半径rn和不透明度αn、行星环宽度pn等将论点的视觉分布、论证的视觉抽象问题量化为万有引力系统的求解问题。本发明的步骤为:
67.(a)基于文本结构的量化。针对文本文档进行处理,首先根据其目录框架、参考文献,结合基于关键主题提取的挖掘算法,获取其中的全部文本、参考文献与引用、各级标题和每个标题下的文本,形成提取文档,计数得到全文的、各篇章、各节及各小节的字数。
68.该发明提出用文字宇宙的万有引力概念来编码,用星球-行星系统可视化整个文章框架:使用集合文本字数的行星表示论文的篇章/节小节,作为行星质量,以行星为公转天体,以全文作为星球,星球作为被公转天体环绕的天体,定义如下:
69.mn=xn/1000
70.m=x/1000,n≥1
71.其中,n为本篇章、节或小节序数,xn为本篇章、第n节、第n小节的文本字数,m1,m2,
…mn
是对应的篇章、节或小节的行星质量,x为全文的文本字数,m为全文的星球质量。也就是说,整个论文,以全文作为一个星球体系,以每篇章中、每节或每小节作为行星,论点作为行星环,论据作为宇宙尘埃,从而完成对整篇文档的可视化展示。
72.基于1920*1080分辨率的显示器,选取相应数量级g=6.67
×
103作为引力常数,且定义m为全文的星球质量,m1,m2,
…mn
是对应篇章、节或小节的行星质量的行星质量,r1,
r2,
…rn
为对应的行星公转半径,v1,v2,

vn为对应行星的公转速度。首先利用万有引力与天体运动公式:
[0073][0074][0075]
其中f表示星球与行星之间的引力。计算得到
[0076][0077][0078]
采用上述公式对篇章中的每级标题,即各节或各小节分别计算,得到篇章中每个行星的质量、公转速度和半径,根据篇章、各节或各小节的等级不同设置行星的层级,按照由红至紫色的可见光散射光谱规定不同层级行星颜色,如图5所示,其中r表示红色层级的行星,b表示蓝色层级的行星。同级行星使用同一色调,同级标题(即各节)下的次级标题(即各节下的各小节)对应的行星颜色饱和度逐渐降低。
[0079]
(b)基于计算的视觉抽象。根据对文档的整体与各篇章、各篇章与各节、节与小节之间的计算结果,将质量m、mn、公转半径rn、速度vn映射到星球-行星系统的图形元素上。计算方法如下:
[0080]dn
=mn[0081]
αn=vn/100
[0082]
其中dn为行星的像素直径,rn为公转半径,αn为行星公转轨道的不透明度,与行星质量和公转速度相映射,并规定轨道宽度pn=1。
[0083]
如取α1=1时将得到篇章一的公转半径:
[0084][0085]
根据下级小行星的最大直径规定公转轨道半径的等差轨迹:
[0086]
δr=max(mn)
×2[0087]rn
=r
n-1
δr通过对各级行星进行计算,得出全文、每篇章、每节下的星球-行星系统。
[0088]
不同宽度的行星环表示包括不同字数的论点,按照文档结构由内向外分布;论据是其中的宇宙尘埃,论据根据其与论点的相关性进行不同紧密度排布,其次按照文章结构顺序遵从顺时针方向排布。
[0089]
(c)论证与文章结构的统一。以环绕星球的行星环象征各小节的论证,以突出显示的尘埃圆象征论据。对尘埃圆的计算与象征篇章、节或小节的行星计算同理:
[0090]
以行星环表示各小节论证,其中突出的宇宙尘埃点表示论据,此时行星环不透明度为定值,即αn=100%,宇宙尘埃的公转环轨道半径与行星公转轨道半径相同,即
公转轨道即为行星环,尘埃的像素直径d'n与所述行星的像素直径计算同理,d'n=m'n,m'n=x'n/1000,此时输入x'n为论据字数,d'n,m'n分别为尘埃的直径与质量,此时行星环不透明度为定值,即αn=100%,以行星环象征各小节的论证,所述行星环宽度的求取方式如下:pn=x”n
/1000,n≥1,其中,x”n
为该论证段落的文本字数,与每篇章的行星-行星环系统共同构成论点-论据结构。
[0091]
在文章篇章、篇章-节、节-小节、小节-论证、详细论证层级的视图之间进行浏览时,对窗口采用50倍比例缩放,如图6所示。
[0092]
在行星环、宇宙尘埃的位置基础上,在详细论证层级,不再以行星环的形式进行论证的抽象,而是将论点、论据详细论证呈现,论据、论点文本大小分别在尘埃点像素宽度、行星环宽度基础上进行缩放,如图6所示。
[0093]
优选地,本发明的实施例中还提供了基于万有引力的文本交互可视化系统,所述系统包括:文本文档自动提取与统计模块,用于获取其中的全部文本、各级标题和每个标题下的文本,按照各级标题将所述文本文档划分为各篇章、各节或各小节,形成提取文档,并对文本全文、各篇章、各节或各小节所包括的字数进行统计;
[0094]
细节自动提取与统计模块:用于对文本文档中的各篇章、各节或各节下的各小节进行细节部分的自动提取,获得其中所有的论点、论据和论证,并统计论点、论据和论证所包括的字数;
[0095]
星球体系与文本文档的可视化模型建立模块:所述星球体系包括星球、行星、行星环以及宇宙尘埃,用各子体系之间的关系将自动提取后的电子文本文档及其细节映射后以可视化方式呈现,所述星球体系各子体系之间运动关系基于万有引力定律。
[0096]
优选地,本发明的实施例中还提供了一种终端,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行本发明所述的基于万有引力的文本交互可视化方法。
[0097]
上述说明示出并描述了本发明的若干优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求书的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献