图像移动的方法及相关装置与流程

2022-02-21 04:17:15 来源：中国专利 TAG：

图像移动的方法及相关装置
【技术领域】
1.本发明涉及图像处理技术领域，特别涉及一种图像移动的方法及相关装置。

背景技术：

2.视觉训练是一种眼睛和大脑的训练方式，重新训练大脑和眼睛之间的关系，如做眼睛运动一样，这是以持续性训练大脑视觉神经认知系统的刺激与训练，增加眼睛运动、聚焦、固视能力以及双眼的合作能力，视觉处理能力和治疗弱视等视觉功能。
3.现有的业界进行视觉训练主要是通过播放特定视频的方式对用户的视觉进行刺激。然而针对不同用户相同的视觉问题的训练方案是固定的，针对不同用户相同的视觉问题，所播放的特定视频是相同的，属于普世化的视觉刺激方案，输出的程序和参数是标准，不能适应不同个体的针对性动态调整方案。
4.因此，如何提供一种新的视觉训练方式，来适应不同个体的视觉训练需求，是当前需要解决的一个问题。

技术实现要素：

5.本技术提供了一种图像移动的方法及相关装置，通过图像追踪用户双眼，以提高视觉训练的训练效果。。
6.本发明为解决上述技术问题，提供的技术方案如下：确定目标用户对应的刺激图像，并通过显示屏幕显示所述刺激图像，所述刺激图像用于对所述目标用户进行视觉训练；实时追踪所述目标用户双眼在所述显示屏幕上的聚焦位置；将所述刺激图像的光强区域移动至所述聚焦位置。
7.可选的，所述实时追踪所述用户双眼在所述显示屏幕上的聚焦位置包括：采集所述目标用户双眼的眼部图像；对所述目标用户双眼进行标定，以得到所述目标用户双眼对应在所述显示屏幕上的第一坐标；确定所述目标用户双眼的瞳孔半径；根据所述眼部图像确定虹膜的旋转角度；将所述第一坐标、所述目标用户双眼的瞳孔半径和所述虹膜的旋转角度输入至眼动仪，以确定所述聚焦位置。
8.可选的，所述对所述用户双眼进行标定包括：根据所述面部的空间位置信息，确定所述目标用户的面部在所述显示屏幕上的位置；基于所述目标用户的面部在所述显示屏幕上的位置以及所述显示屏幕进行双眼检测，获得所述目标用户的双眼在所述显示屏幕中的位置。
9.可选的，所述确定所述目标用户双眼的瞳孔半径包括：采集原始眼动图像，并抑制所述原始眼动图像的图像噪声，得到去噪后图像；基于自适应阈值方法优化所述去噪后图像的边缘，得到边缘优化后图像；分割所述边缘优化后图像中的所述目标用户双眼的瞳孔，确定所述瞳孔半径大小。
10.可选的，所述确定所述目标用户双眼的瞳孔半径包括：采集所述目标用户的眼睛图像；通过二值化寻找潜在瞳孔区域，并分析去除明显非瞳孔区域；对椭圆形区域通过椭圆
拟合以获得所述目标用户双眼的瞳孔半径。
11.所述根据所述眼部图像确定虹膜的旋转角度包括：确定所述目标用户的眼球在第一位置时的虹膜外围和瞳孔外围形成的第一环形图像和所述目标用户的眼球在第二位置时的虹膜外围和瞳孔外围形成的第二环形图像，所述第一位置和所述第二位置为不同的位置；将所述第一环形图像和所述第二环形图像进行处理，得到第一虹膜条形图案和第二虹膜条形图案；将所述第一虹膜条形图案和所述第二虹膜条形图像进行压缩，以得到第一曲线和第二曲线；将所述第一曲线和所述第二曲线进行对比计算确定所述虹膜的旋转角度。
12.可选的，所述将所述刺激图像的光强区域移动至所述聚焦位置之前，所述方法还包括：根据所述刺激图像的属性确定对应的所述刺激图像的光强区域。
13.本技术实施例第二方面还提供一种图像移动装置，包括：确定单元，用于确定目标用户对应的刺激图像，并通过显示屏幕显示所述刺激图像；追踪单元，用于实时追踪所述目标用户双眼在所述显示屏幕上的聚焦位置；移动单元，用于将所述刺激图像移动至所述聚焦位置。
14.本技术实施例第三方面提供一种计算机可读存储介质，存储介质中存储有至少一可执行指令，所述可执行指令在计算设备上运行时，使得计算设备执行上述任意实施例所述的图像移动的方法。
15.本技术实施例第四方面提供一种计算机程序产品，包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本技术实施例所述的流程或功能。
16.本技术实施例中，确定目标用户对应的刺激图像，并通过显示屏幕显示所述刺激图像的光强区域；实时追踪所述目标用户双眼在所述显示屏幕上的聚焦位置；将所述刺激图像移动至所述聚焦位置。本技术实施例中，通过图像追踪用户双眼，以提高视觉训练的训练效果。
【附图说明】
17.图1为本技术实施例提供的一种图像移动的方法的流程图；
18.图2为本技术实施例提供的一种追踪双眼的聚焦位置的流程图；
19.图3为本技术实施例提供的一种图像移动装置的结构示意图；
20.图4为本技术实施例提供的一种图像移动装置的结构示意图。
【具体实施方式】
21.为了使本发明的目的，技术方案及优点更加清楚明白，以下结合附图及实施实例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
22.需要说明的是，当元件被称为“固定于”另一个元件，它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件，它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
23.请参阅图1，为本技术实施例提供的一种图像移动的方法的流程图，包括：
24.101、确定目标用户对应的刺激图像，并通过显示屏幕显示所述刺激图像；
25.当目标用户需要进行视觉训练时，确定所述目标用户对应的刺激图像，其中，所述刺激图像用于对所述目标用户进行视觉训练，即当所述目标用户一直盯着所述刺激图像时，可以对所述目标用户的视觉进行训练。本技术实施例中，确定目标用户对应的刺激图像的方式有多种，例如：
26.接收所述目标用户的第一操作指令，所述第一操作指令用于确定所述刺激图像。其中，一个实施例中，生成第一操作指令的操作至少包括手势操作、滑动操作、点击操作以及声控操作中的一种，例如当目标用户对终端设备所对应的显示器进行点击操作时，终端设备可以接收到该点击操作，此时，该点击操作即生成第一操作指令，也就是说，可以提前定义第一操作指令，例如提前定义滑动操作为实时选择刺激图像的操作(如左滑操作、右滑操作、上滑操作以及下滑操作等等)，或者定义点击操作为实时从服务器获取原始视频流的操作(如单击终端设备所对应的显示器的操作或双击终端设备所对应的显示器的操作等等)，或者定义手势操作为实时从服务器获取原始视频流的操作(如向左摆动手腕或手臂，向右摆动手腕或手臂，如四根手指收缩操作或者三根手指上滑操作等等)，或者定义声控操作为为实时从服务器获取原始视频流的操作(如收到从实时从服务器获取原始视频流数据以及具体的视频名称的声音)，上述仅为举例说明，并不代表对生成第一操作指令的操作进行限定，当然还可以有其他的操作，例如通过预先设置的快捷键实时从服务器获取原始视频流数据，例如定义“ctrl a”为实时从服务器获取原始视频流数据的快捷键。
27.或者，根据所述目标用户的用户信息预测所述目标用户的偏好设置，并根据所述目标用户的偏好设置确定对应的所述刺激图像。比如，所述目标用户的性别年龄分别为女、6岁，则预测所述目标用户的偏好为儿童卡通，从图像库中找出与儿童卡通对应的图片组，进而随机选择一副图片作为所述刺激图像。
28.综上，本技术实施例中确定目标用户对应的刺激图像的方式有多种，具体此处不作限定。
29.在确定所述目标用户对应的刺激图像后，通过显示屏幕显示所述刺激图像。
30.102、实时追踪所述目标用户双眼在所述显示屏幕上的聚焦位置；
31.当用户在进行视距训练时，实时追踪所述目标用户双眼在所述显示屏幕上的聚焦位置，具体请参阅图2，为本技术实施例提供的一种追踪双眼的聚焦位置的流程图，具体包括：
32.201、采集所述目标用户的面部图像，以定位所述目标用户的面部的空间位置信息；
33.202、根据所述面部的空间位置信息对所述目标用户双眼进行标定，以得到所述目标用户双眼对应在所述显示屏幕上的第一坐标；
34.通过摄像头采集所述目标用户的面部图像，所述摄像头可以为双摄或者单摄或者三维体感摄像机，具体此处不作限定。在采集到所述目标用户的面部图像后，定位所述目标用户的面部的空间位置信息；根据所述面部的空间位置信息，确定所述目标用户的面部在所述显示屏幕上的位置；基于所述目标用户的面部在所述显示屏幕上的位置以及所述显示屏幕进行双眼检测，获得所述目标用户的双眼在所述显示屏幕中的位置，即得到所述目标用户双眼对应在所述显示屏幕上的第一坐标。
35.203、确定所述目标用户双眼的瞳孔半径；
36.在平面直角坐标系中，椭圆可以有多种形态。几何学上，从原点出发的射线逆时针旋转，射线与x轴正向的角度可定义为射线的角度。本发明参照上述知识定义椭圆角度(即瞳孔角度)，先使坐标原点与椭圆中心重合，在坐标系第一象限或第二象限的长轴与坐标x轴正向之间的夹角，定义为椭圆角度，此角度可以是0～180
°
之间的任意值。当椭圆角度是0
°
或180
°
时，椭圆长轴与x轴重合；当椭圆角度为90
°
时，椭圆长轴与y轴重合。当长轴和短轴长度一致时，这是椭圆的特例——即为圆，定义圆的位置只需圆心和半径，角度失去作用。瞳孔参数包括瞳孔中心坐标、瞳孔长短轴参数、角度，用这几个数值可限定瞳孔位置、形状和大小，完成跟踪测量。
37.采集原始眼动图像，并抑制所述原始眼动图像的图像噪声，得到去噪后图像，可选的，通过高斯模糊算法模糊采集到的原始眼动图像，抑制图像噪声，平滑图像，得到所述去噪后图像；再基于自适应阈值方法优化所述去噪后图像的边缘，得到边缘优化后图像，具体地，设置自适应阈值，将所述去噪后图像的每一块区域的像素强度平均值作为阈值；再利用thread将所述去噪后图像转化为二值数字图像；腐蚀优化：用固定大小规格的结构元素扫描二值数字图像的每一个像素，用结构元素与其覆盖的二值数字图像做“与”运算，如果都为1，结构图像的该像素为1，否则为0，过滤冗余的边缘分支，得到边缘优化后图像。得到边缘优化后图像后，分割所述边缘优化后图像中的所述目标用户双眼的瞳孔，确定所述瞳孔半径大小，具体地，基于avbfsc算法分割所述优化后图像中的瞳孔的步骤包括：输入所述边缘优化后图像，背景的像素点强度为0，图像目标的像素点强度为1；利用cht计算粗略的瞳孔圆心(ox,oy)和半径or，选取以(ox,oy)为初始中心，or
±
δ*or为半径的区域及该区域内的强度为1的像素点；设置随机搜索的总次数n，随机搜索三个不共线的像素点，对选取的像素点进行离群点检测，如不是离群点则利用其拟合圆模型；将所有非离群像素点代入圆模型，计算到圆边缘的距离，若距离小于给定阈值，则将这些像素点作为内点，计算内点的个数；如果不共线的像素点中出现了离群点，放弃拟合圆模型，重复上述步骤，直到搜索次数达到n停止迭代搜索，返回内点个数最多的圆模型参数；最终确定眼动图像中的瞳孔区域以及半径大小和中心点坐标。即可确定所述目标用户双眼的瞳孔半径。
38.或者，
39.采集所述目标用户的眼睛图像；通过二值化寻找潜在瞳孔区域，并分析去除明显非瞳孔区域；对椭圆形区域通过椭圆拟合以获得所述目标用户双眼的瞳孔半径。
40.204、根据所述眼部图像确定虹膜的旋转角度；
41.需要说明的是，虹膜旋转是指采集设备和虹膜所在的两个平面发生了相对的角度旋转变化，导致采集的不同虹膜图像发生了相对的旋转变化。造成虹膜图像发生旋转的原因是：(1)头部倾斜(或采集设备倾斜)；(2)眼球在眼眶的转动。
42.因此，确定所述目标用户的眼球在第一位置时的虹膜外围和瞳孔外围形成的第一环形图像和所述目标用户的眼球在第二位置时的虹膜外围和瞳孔外围形成的第二环形图像，其中，所述第一位置和所述第二位置为不同的位置；将所述第一环形图像和所述第二环形图像进行处理，得到第一虹膜条形图案和第二虹膜条形图案；将所述第一虹膜条形图案和所述第二虹膜条形图像进行压缩，以得到第一曲线和第二曲线；将所述第一曲线和所述第二曲线进行对比计算确定所述虹膜的旋转角度。
43.205、将所述第一坐标、所述目标用户双眼的瞳孔半径和所述虹膜的旋转角度输入至眼动仪，以确定所述聚焦位置。
44.在得到所述第一坐标、所述目标用户双眼的瞳孔半径和所述虹膜的旋转角度后，输入至所述眼动仪，以得到所述聚焦位置。
45.103、将所述刺激图像的光强区域移动至所述聚焦位置。
46.在确定所述聚焦位置后，将所述刺激图像的光强区域移动至所述聚焦位置，当所述目标用户双眼在动的过程中，其在所述显示屏幕上的聚焦位置也在对应的移动，将所述刺激图像的光强区域随着所述聚焦位置移动，即所述刺激图像的光强区域会随着所述目标用户双眼的移动而移动，即可以一直训练所述目标用户的视觉。
47.需要说明的是，将所述刺激图像的光强区域移动至所述聚焦位置之前，所述方法还包括：根据所述刺激图像的属性确定对应的所述刺激图像的光强区域。本实施例中，所述刺激图像的光强区域可以进行设置，例如将所述光强区域的亮度设置成多种颜色，所述光强区域的形状也可以根据需求进行设置，例如圆形、云朵状、卡通状等，增加视觉训练的趣味性。如所述刺激图像的属性包括自然景物，其对应的光强区域应设置为云朵状。
48.本技术实施例中，确定目标用户对应的刺激图像，并通过显示屏幕显示所述刺激图像；实时追踪所述目标用户双眼在所述显示屏幕上的聚焦位置；将所述刺激图像的光强区域移动至所述聚焦位置。且能够根据目标用户的偏好设置确定对应的所述刺激图像，可以适应更多应用需求。
49.本技术实施例还提供了一种图像移动装置，请参阅图3，为本技术实施例提供的一种可能的图像移动装置的结构示意图，所述图像移动装置300包括：
50.确定单元301，用于确定目标用户对应的刺激图像，并通过显示屏幕显示所述刺激图像；
51.追踪单元302，用于实时追踪所述目标用户双眼在所述显示屏幕上的聚焦位置；
52.移动单元303，用于将所述刺激图像的光强区域移动至所述聚焦位置。
53.本技术实施例还提供了另一种图像移动装置，该图像移动装置部署于服务器。请参阅图4，图4是本发明实施例提供的一种服务器的结构示意图，该服务器400可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，cpu)422(例如，一个或一个以上处理器)和存储器332，一个或一个以上存储应用程序442或数据444的存储介质330(例如一个或一个以上海量存储设备)。其中，存储器432和存储介质330可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器422可以设置为与存储介质430通信，在服务器400上执行存储介质430中的一系列指令操作。
54.服务器400还可以包括一个或一个以上电源426，一个或一个以上有线或无线网络接口450，一个或一个以上输入输出接口458，和/或，一个或一个以上操作系统441，例如windows servertm，mac os xtm，unixtm，linuxtm，freebsdtm等等。
55.上述实施例中由图像移动装置所执行的步骤可以基于该图4所示的服务器结构。
56.本技术还提供一种计算机可读存储介质，存储介质中存储有至少一可执行指令，所述可执行指令在计算设备上运行时，使得计算设备执行上述任意实施例所述的图像移动
的方法。
57.在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。
58.所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质(例如固态硬盘(solid state disk，ssd))等。
59.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
60.在本技术所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
61.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
62.另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
63.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
64.以上所述，以上实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些
修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

图像移动的方法及相关装置与流程

相关文献

最热文献