增强现实引导的制作方法

2023-02-06 11:34:54 来源：中国专利 TAG：

增强现实引导
相关申请的交叉引用
1.本技术要求于2020年5月29日提交的名称为“augmented reality guidance”，申请号为16/887,333的美国专利申请的优先权，该专利申请的内容全部以引用方式并入本文。
技术领域
2.本公开中阐述的示例涉及增强现实(ar)和可穿戴移动设备(诸如眼戴设备)领域。更具体地，但不作为限制，本发明描述了对用户在环境中的增强现实引导。

背景技术：

3.当今可用的许多类型的计算机和电子设备(诸如移动设备(例如，智能电话、平板电脑和笔记本电脑)、手持式设备和可穿戴设备(例如，智能眼镜、数字眼戴器、头饰、头戴器和头戴式显示器))包括各种相机、传感器、无线收发器、输入系统(例如，触敏表面、指示器)、外围设备、显示器和用户可与显示内容交互的图形用户界面(gui)。
4.增强现实(ar)将物理环境中的现实对象与虚拟对象组合，并将该组合显示给用户。组合显示给出了虚拟对象真实地存在于环境中的印象，尤其是当虚拟对象看起来并且表现得像真实对象一样时。
5.高级ar技术，诸如计算机视觉和对象追踪，可用于创建在感知丰富和沉浸式体验。计算机视觉算法从数字图像或视频中捕获的数据中提取关于物理世界的三维数据。对象追踪算法可用于检测数字图像或视频中的对象并且追踪其移动。
附图说明
6.从以下参考附图的实施例方式中，将容易理解所描述的各种示例的特征。在说明书中和附图的几个视图中，每个元件使用了附图标记。当存在多个相似的元件时，可以给相似的元件指定单个附图标记，通过添加小写字母来指代特定的元件。
7.除非另外指出，否则图中所示的各种元件并非按比例绘制的。为了清楚起见，可放大或缩小各个元件的尺寸。若干附图描绘了一个或多个实施例，并且仅作为示例呈现，而不应被解释为限制。附图中包括以下附图：
8.图1a是适用于增强现实产生系统的眼戴设备的示例性硬件配置的侧视图(右)；
9.图1b是图1a的眼戴设备的右角部的局部横截面透视图，其描绘了右可见光相机和电路板；
10.图1c是图1a的眼戴设备的示例性硬件配置的侧视图(左)，其示出了左可见光相机；
11.图1d是图1c的眼戴设备的左角部的局部横截面透视图，其描绘了左可见光相机和电路板；
12.图2a和图2b是在增强现实产生系统中利用的眼戴设备的示例性硬件配置的后视
图；
13.图3是三维场景的图形描述，由左可见光相机捕获的左原始图像和由右可见光相机捕获的右原始图像；
14.图4是包括经由各种网络连接的可穿戴设备(例如，眼戴设备)和服务器系统的示例性增强现实产生系统的功能框图；
15.图5是用于图4的增强现实产生系统的移动设备的示例性硬件配置的图形表示；
16.图6是示例性环境中用于描述即时定位与地图构建的的用户的示意性图示；
17.图7是列出在物理环境中显示虚拟对象的示例性方法中的步骤的流程图；
18.图8a、图8b、图8c、图8d和图8e是包括示例性虚拟引导增强现实体验的步骤的流程图；并且
19.图9a、图9b、图9c、图9d、图9e和图9f是将用户引导到环境内的位置的虚拟引导增强现实体验的透视图示。实施例方式
20.参考示例描述了各种实施例和细节，其包括一种利用包括定位检测系统和显示系统的眼戴设备来提供增强现实引导体验的系统。该眼戴设备监视其在环境内的当前定位并且在眼戴设备的预定距离内的记录标记定位。眼戴设备生成并呈现叠层图像，这些叠层图像包括用于在记录的标记定位处显示的引导标记。这使得眼戴设备能够在环境中引导用户到达环境内的物理目的地。
21.以下实施例方式包括说明本公开中阐述的示例的系统、方法、技术、指令序列和计算机器程序产品。出于提供对所公开的主题及其相关教导内容的透彻理解的目的而包括许多细节和示例。然而，相关领域的技术人员能够理解如何在没有此类细节的情况下应用相关教导内容。所公开的主题的各方面不限于所描述的特定设备、系统和方法，因为相关教导内容可以以各种方式来应用或实践。本文中所使用的术语和命名仅仅是为了描述特定方面并非旨在进行限制。通常，公知的指令实例、协议、结构和技术不一定被详细示出。
22.本文中所使用的术语“耦接”或“连接”指的是任何逻辑、光学、物理或电连接(包括链路等)，由一个系统元件产生或提供的电或磁信号通过这些连接传递到另一耦接或连接的系统元件。除非另外描述，否则耦接或连接的元件或设备不一定直接彼此连接，并且可以由中间组件、元件或通信介质隔开，中间组件、元件或通信介质中的一者或多者可修改、操纵或承载电信号。术语“上”是指由元件直接支撑或通过另一元件由元件间接支撑，该另一元件集成到元件中或由元件支撑。
23.术语“近侧”用于描述位于对象或人附近、左近或旁边的物品或物品的一部分；或者相对于该物品的其他部分更近，其他部分可以被描述为“远侧”。例如，物品最靠近对象的端部可以被称为近端，而大致相对的端部可以被称为远端。
24.出于说明和讨论的目的，仅以示例的方式给出了诸如附图中的任一附图所示的眼戴设备、其他移动设备、相关联部件和结合了相机、惯性测量单元或两者的任何其他设备的定向。在操作中，眼戴设备可以在适合于眼戴设备的特定应用的任何其他方向上定向，例如，向上、向下、侧向或任何其他定向。此外，就本文所用的范围而言，任何方向性术语，诸如前、后、内、外、向、左、右、侧向、纵向、上、下、高、低、顶部、底部、侧面、水平、垂直和对角，仅以示例的方式使用，并且不限制如本文所构造或另外描述的任何相机或惯性测量单元的方
向或定向。
25.示例的其他目的、优点和新颖特征将部分地在以下实施例方式中阐述，并且部分地在本领域技术人员检查以下内容和附图后将变得显而易见，或者可通过示例的生产或操作来了解。本技术的目的和优点可借助于所附权利要求书中特别指出的方法、手段和组合来实现和达成。
26.现在详细参考附图所示和下文所讨论的示例。
27.图1a是包括触敏输入设备或触摸板181的眼戴设备100的示例性硬件配置的侧视图(右)。如图所示，触摸板181可具有细微且不易看到的边界；或者，边界可清楚可见或包括向用户提供关于触摸板181的位置和边界的反馈的凸起或以其他方式可触知的边缘。在其他实施例中，眼戴设备100可包括在左侧的触摸板。
28.在图像显示器上的触摸板181表面被配置为检测手指触摸、轻击和手势(例如，移动触摸)，以便与眼戴设备上显示的gui一起使用，从而允许用户以直观的方式浏览并选择菜单选项，这改善并简化了用户体验。
29.对触摸板181上的手指输入的检测可实现若干功能。例如，触摸触摸板181上的任何地方都可使gui在图像显示器上显示或突出显示项目，该项目可被投影到光学组件180a、180b中的至少一者上。在触摸板181上双击可选择项目或图标。在特定方向上(例如，从前到后、从后到前、从上到下或从下到上)滑动或轻扫手指可使项目或图标在特定方向上滑动或滚动；例如，以移动到下一项目、图标、视频、图像、页面或幻灯片。在另一方向上滑动手指可以在相反方向上滑动或滚动；例如，用于移动到前一项目、图标、视频、图像、页面或幻灯片。触摸板181实际上可以在眼戴设备100上的任何地方。
30.在一个示例中，在触摸板181上单击所识别的手指手势发起对呈现在光学组件180a、180b的图像显示器上的图像中的图形用户界面元素的选择或按压。基于被识别手指手势对呈现在光学组件180a、180b的图像显示器上的图像的调整，可以作为选择或提交图像显示上的图形用户界面元素的主要动作，以用于进一步显示或执行的主要动作。
31.如图所示，眼戴设备100包括右可见光相机114b。如本文进一步描述，两个相机114a、114b从两个单独视点捕获场景的图像信息。两个所捕获的图像可用于将三维显示投影到图像显示器上以利用3d眼镜进行观看。
32.眼戴设备100包括右光学组件180b，其具有图像显示器以呈现图像，诸如深度图像。如图1a和图1b所示，眼戴设备100包括右可见光相机114b。眼戴设备100可包括多个可见光相机114a、114b，其形成被动式三维相机，诸如立体相机，其中右可见光相机114b位于右角部110b。如图1c-d所示，眼戴设备100还包括左可见光相机114a。
33.左和右可见光相机114a、114b对可见光范围波长敏感。可见光相机114a、114b中的每一者具有不同的前向视场，这些视场重叠以使得能够生成三维深度图像，例如，右可见光相机114b描绘右视场111b。通常，“视场”是在空间中的特定定位处和方向上通过相机可见的场景的部分。视场111a和111b具有重叠的视场304(图3)。当可见光相机捕获图像时，视场111a、111b之外的对象或对象特征未被记录在原始图像(例如，照片或图片)中。视场描述了可见光相机114a、114b的图像传感器在给定场景的所捕获的图像中拾取给定场景的电磁辐射的角度范围或幅度。视场可以被表示为视锥的角度大小；即视角。视角可以水平、垂直或对角地测量。
34.在示例中，可见光相机114a、114b具有视角在40
°
至110
°
之间(例如，大约100
°
)的视场，并且具有480
×
480像素或更大的分辨率。“覆盖角度”描述了可见光相机114a、114b或红外相机410(见图2a)镜头可有效成像的的角度范围。通常，相机镜头产生大到足以完全覆盖相机的胶片或传感器的成像圈，可能包括某种渐晕(例如，与中心相比，图像朝向边缘变暗)。如果相机镜头的覆盖角度未遍及传感器，则成像圈将是可见的，通常具有朝向边缘的强渐晕，并且有效视角将限于覆盖角度。
35.此类可见光相机114a、114b的示例包括高分辨率互补金属氧化物半导体(cmos)图像传感器和能够具有640p(例如，640
×
480像素，总共0.3兆像素)、720p或1080p的分辨率的数字vga相机(视频图形阵列)。可见光相机114a、114b的其他示例，其可捕获高清晰度(hd)静止图像且以1642
×
1642像素(或更大)的分辨率存储这些图像；或者以高帧率(例如，每秒三十至六十帧或更多)记录高清晰度视频且以1216
×
1216像素(或更大)的分辨率存储该记录。
36.眼戴设备100可捕获来自可见光相机114a、114b的图像传感器数据以及由图像处理器数字化的地理定位数据，以存储在存储器中。可见光相机114a、114b在二维空间域中捕获相应的左原始图像和右原始图像，这些原始图像包括二维坐标系上的像素矩阵，该二维坐标系包括用于水平定位的x轴和用于垂直定位的y轴。每个像素包括颜色属性值(例如，红色像素光值、绿色像素光值或蓝色像素光值)；和定位属性(例如，x轴坐标和y轴坐标)。
37.为了捕获立体图像以用于稍后显示为三维投影，图像处理器412(在图4中示出)可耦接到可见光相机114a、114b以接收并存储视觉图像信息。图像处理器412或另一处理器控制可见光相机114a、114b的操作以充当模拟人类双眼视觉的立体相机，并且可将时间戳添加到每个图像。每对图像上的时间戳允许将图像一起显示为三维投影的一部分。三维投影产生沉浸式逼真体验，这在包括虚拟现实(vr)和视频游戏的各种环境中都是期望的。
38.图1b是图1a的眼戴设备100的右角部110b的横截面透视图，其描绘了相机系统的右可见光相机114b和电路板。图1c是图1a的眼戴设备100的示例性硬件配置的侧视图(左)，其示出了相机系统的左可见光相机114a。图1d是图1c的眼戴设备的左角部110a的横截面透视图，其描绘了三维相机的左可见光相机114a和电路板。
39.除了连接和耦接位于左侧面170a上之外，左可见光相机114a的结构和布置基本上类似于右可见光相机114b。如图1b的示例所示，眼戴设备100包括右可见光相机114b和电路板140b，该电路板可以是柔性印刷电路板(pcb)。右铰链126b将右角部110b连接到眼戴设备100的右镜腿125b上。在一些示例中，右可见光相机114b、柔性pcb 140b或其他电连接器或触点等部件可位于右镜腿125b或右铰链126b上。
40.右角部110b包括角部体190和角部盖，图1b的横截面中省略了角部盖。设置在右角部110b内部的是各种互连的电路板，诸如pcb或柔性pcb，其包括用于右可见光相机114b、麦克风、低功率无线电路(例如，用于经由bluetooth
tm
的无线短距离网络通信)、高速无线电路(例如，用于经由wi-fi的无线局域网通信)的控制器电路。
41.右可见光相机114b耦接到或设置在柔性pcb 140b上且由可见光相机覆盖镜头覆盖，该镜头通过形成在框架105中的开口瞄准。例如，框架105的右边缘107b，如图2a所示，连接到右角部110b，并且包括用于可见光相机覆盖镜头的开口。框架105包括被配置为面向外且远离用户的眼睛的前侧。用于可见光相机覆盖镜头的开口形成并穿过所述框架105的前
侧或面朝外的一侧。在示例中，右可见光相机114b具有面向外的视场111b(图3所示)，其视线或视角与眼戴设备100的用户的右眼相关。可见光相机覆盖镜头也可粘附到右角部110b的前侧或面向外的表面，其中开口形成有面向外的覆盖角度，但在不同的向外方向上。耦接也可经由中间部件间接实现。
42.如图1b所示，柔性pcb 140b设置在右角部110b内，并且耦接到容纳在右角部110b中的一个或多个其他部件。尽管示出为形成在右角部110b的电路板上，但是右可见光相机114b可形成在左角部110a、镜腿125a、125b或框架105的电路板上。
43.图2a和图2b是包括两种不同类型的图像显示器的眼戴设备100的示例性硬件配置的后透视图。眼戴设备100的尺寸和形状被设计成被配置为供用户佩戴的形式；在该示例中为眼镜的形式。眼戴设备100可采取其他形式并且可结合其他类型的框架，例如，头戴器、头戴式耳机或头盔。
44.在眼镜的示例中，眼戴设备100包括框架105，其包括经由适于由用户的鼻部支撑的鼻梁架106连接到右边缘107b的左边缘107a。左和右边缘107a、107b包括相应的孔口175a、175b，这些孔口保持相应的光学元件180a、180b，诸如镜头和显示设备。如本文所用，术语“镜头”旨在包括透明或半透明玻璃或塑料片，其具有弯曲或平坦表面，导致光会聚/发散或导致几乎或完全不会聚或发散。
45.虽然被示出为具有两个光学元件180a、180b，但是眼戴设备100可包括其他布置，诸如单个光学元件(或者其可不包括任何光学元件180a、180b)，这取决于眼戴设备100的应用或预期用户。如图进一步所示，眼戴设备100包括与框架105的左侧面170a相邻的左角部110a以及与框架105的右侧面170b相邻的右角部110b。角部110a、110b可在相应的侧面170a、170b上集成到框架105中(如图所示)或实施为在框架105的相应侧面170a、170b上附接的单独部件。或者，角部110a、110b可集成到附接到框架105的镜腿(未示出)中。
46.在一个示例中，光学组件180a、180b的图像显示器包括集成的图像显示器。如图2a所示，每个光学组件180a、180b包括合适的显示矩阵177，诸如液晶显示器(lcd)、有机发光二极管(oled)显示器或任何其他此类显示器。每个光学组件180a、180b还包括一个或多个光学层176，其可以包括镜头、光学涂层、棱镜、反射镜、波导、光学条带和其他光学部件及其任何组合。光学层176a、176b、
…
、176n(在图2a中示出为176a-n)可包括具有合适的尺寸和构造的棱镜，该棱镜包括用于接收来自显示矩阵的光的第一表面和用于向用户的眼睛发射光的第二表面。光学层176a-n的棱镜在形成在左和右边缘107a、107b中的相应的孔口175a、175b的全部或至少一部分上方延伸，以允许用户在用户的眼睛透过对应的左和右边缘107a、107b观看时看到棱镜的第二表面。光学层176a-n的棱镜的第一表面从框架105面向上，并且显示矩阵177覆盖在棱镜上，使得由显示矩阵177发射的光子和光照射在第一表面上。棱镜的尺寸和形状被设计成使得光在棱镜内被折射并且被光学层176a-n的棱镜的第二表面导向用户的眼睛。在这一点而言，光学层176a-n的棱镜的第二表面可以是凸形的以将光导向眼睛的中心。棱镜的尺寸和形状可任选地被设计成放大由显示矩阵177投影的图像，并且光穿过棱镜使得从第二表面观察的图像在一个或多个维度上大于从显示矩阵177发射的图像。
47.在一个示例中，光学层176a-n可包括透明的lcd层(保持镜头打开)，除非且直到施加电压使该层不透明(关闭或遮挡镜头)。眼戴设备100上的图像处理器412可执行程序以将
电压施加到lcd层，以便产生主动式快门系统，从而使得眼戴设备100适于观看被显示为三维投影的视觉内容。除了lcd之外的技术可用于主动式快门模式，包括响应电压或另一类型的输入的其他类型的反应层。
48.在另一示例中，光学组件180a、180b的图像显示设备包括如图2b所示的投影图像显示器。每个光学组件180a、180b包括激光投影仪150，其是使用扫描镜或检流计的三色激光投影仪。在操作期间，光源(诸如激光投影仪150)设置在眼戴设备100的镜腿125a、125b中的一个镜腿之中或之上。在该示例中，光学组件180b包括一个或多个光学条带155a、155b、
…
155n(在图2b中示出为155a-n)，其在每个光学组件180a、180b的镜头的宽度上，或者在镜头的前表面和后表面之间的镜头的深度上间隔开。
49.当由激光投影仪150投影的光子行进穿过每个光学组件180a、180b的镜头时，光子遇到光学条带155a-n。当特定光子遇到特定光学条带时，光子要么朝向用户的眼睛重定向，要么传递到下一光学条带。激光投影仪150的调制和光学条带的调制的组合可控制特定的光子或光束。在示例中，处理器通过发出机械、声学或电磁信号来控制光学条带155a-n。虽然被示出为具有两个光学组件180a、180b，但是眼戴设备100可包括其他布置，诸如单个或三个光学组件，或者每个光学组件180a、180b可被布置有不同的布置，这取决于眼戴设备100的应用或预期用户。
50.如图2a和图2b进一步所示，眼戴设备100包括与框架105的左侧面170a相邻的左角部110a以及与框架105的右侧面170b相邻的右角部110b。角部110a、110b可集成到框架105中(如图所示)的相应侧面170a、170b上或实施为附接到框架105相应的侧面170a、170b上的单独部件。或者，角部110a、110b可集成到与框架105相连的镜腿125a、125b中。
51.在另一示例中，图2b中示出的眼戴设备100可包括两个投影仪，左投影仪150a(未示出)和右投影仪150b(示出为投影仪150)。左光学组件180a可包括左显示矩阵177a(未示出)或左光学条带155'a、155'b、
…
、155'n(155撇，a至n，未示出)，其被配置为与来自左投影仪150a的光进行交互。类似地，右光学组件180b可包括右显示矩阵177b(未示出)或右光学条155”a、155”b、
…
、155”n(155双撇，a至n，未示出)，其被配置为与来自右投影仪150b的光进行交互。在该示例中，眼戴设备100包括左显示器和右显示器。
52.图3是三维场景306、由左可见光相机114a捕获的左原始图像302a和由右可见光相机114b捕获的右原始图像302b的图形描绘。如图所示，左视场111a可与右视场111b重叠。重叠的视场304表示由图像中两个相机114a、114b捕获的部分。术语“重叠”在涉及视场时意味着所生成的原始图像中的像素矩阵重叠百分之三十(30％)或更多。“基本上重叠”意味着所生成的原始图像中的像素矩阵或场景的红外图像中的像素矩阵重叠百分之五十(50％)或更多。如本文所述，两个原始图像302a、302b可被处理以包括时间戳，该时间戳允许将图像作为三维投影的一部分被一起显示。
53.为了捕获立体图像，如图3所示，真实场景306在给定时刻的一对原始红绿蓝(rgb)图像被捕获-由左相机114a捕获的左原始图像302a和由右相机114b捕获的右原始图像302b。当(例如，由图像处理器412)处理该对原始图像302a、302b时，生成深度图像。所生成的深度图像可在眼戴设备的光学组件180a、180b上、在另一显示器(例如，移动设备401上的图像显示器580)上、或在屏幕上查看。
54.所生成的深度图像在三维空间域中，并且可包括三维位置坐标系上的顶点矩阵，
该三维位置坐标系包括用于水平定位(例如，长度)的x轴、用于垂直定位(例如，高度)的y轴和用于深度(例如，距离)的z轴。每个顶点可包括颜色属性(例如，红色像素光值、绿色像素光值或蓝色像素光值)；定位属性(例如，x位置坐标、y位置坐标和z位置坐标)；纹理属性；反射率属性；或它们的组合。纹理属性量化深度图像的感知纹理，诸如深度图像的顶点区域中的颜色或强度的空间布置。
55.在一个示例中，交互式增强现实系统400(图4)包括眼戴设备100，其包括框架105、从框架105的左侧面170a延伸的左镜腿110a、以及从框架105的右侧面170b延伸的右镜腿125b。眼戴设备100可进一步包括具有重叠的视场的至少两个可见光相机114a、114b。在一个示例中，眼戴设备100包括具有左视场111a的左可见光相机114a，如图3所示。左相机114a连接到框架105或左镜腿110a以从场景306的左侧捕获左原始图像302a。眼戴设备100进一步包括具有右视场111b的右可见光相机114b。右相机114b连接到框架105或右镜腿125b以从场景306的右侧捕获右原始图像302b。
56.图4是示例性交互式增强现实系统400的功能框图，该系统包括经由各种网络495(诸如因特网)连接的可穿戴设备(例如，眼戴设备100)、移动设备401和服务器系统498。交互式增强现实系统400包括眼戴设备100与移动设备401之间的低功率无线连接425和高速无线连接437。
57.如图4所示，如本文所述，眼戴设备100包括一个或多个可见光相机114a、114b，它们捕获静止图像、视频图像或静止图像和视频图像两者。相机114a、114b可具有对高速电路430的直接存储器访问(dma)并且用作立体相机。相机114a、114b可用于捕获初始深度图像，这些初始深度图像可被渲染成三维(3d)模型，这些三维模型是红绿蓝(rgb)成像场景的纹理映射图像。该设备100还可包括深度传感器213，其使用红外信号来估计对象相对于设备100的定位。在一些示例中，深度传感器213包括一个或多个红外发射器215和红外相机410。
58.眼戴设备100进一步包括每个光学组件180a、180b的两个图像显示器(一个与左侧面170a相关联，一个与右侧面170b相关联)。眼戴设备100还包括图像显示驱动器442、图像处理器412、低功率电路420和高速电路430。每个光学组件180a、180b的图像显示器用于呈现图像，包括静止图像、视频图像、或静止和视频图像。图像显示驱动器442耦接到每个光学组件180a、180b的图像显示器，以便控制图像的显示。
59.眼戴设备100还包括一个或多个扬声器440(例如，一个与眼戴设备的左侧相关联，另一个与眼戴设备的右侧相关联)。扬声器440可并入到眼戴设备100的框架105、镜腿125或角部110中。一个或多个扬声器440由音频处理器443在低功率电路420、高速电路430或两者的控制下驱动。扬声器440用于呈现音频信号，包括例如节拍音轨。音频处理器443耦接到扬声器440以便控制声音的呈现。
60.图4所示的用于眼戴设备100的部件位于一个或多个电路板上，例如，位于边缘或镜腿中的印刷电路板(pcb)或柔性印刷电路(fpc)。另选地或附加地，所描绘的部件可位于眼戴设备100的角部、框架、铰链或鼻梁架中。左和右可见光相机114a、114b可包括数字相机元件，诸如互补金属氧化物半导体(cmos)图像传感器、电荷耦合器件、镜头、或可用于捕获数据(包括具有未知对象的场景的静止图像或视频)的任何其他相应的可见或光捕获元件。
61.如图4所示，高速电路430包括高速处理器432、存储器434和高速无线电路436。在该示例中，图像显示驱动器442耦接到高速电路430并且由高速处理器432操作，以便驱动每
个光学组件180a、180b的左和右图像显示器。高速处理器432可以是能够管理眼戴设备100所需的任何通用计算系统的高速通信和操作的任何处理器。高速处理器432包括包括管理高速无线连接437到使用高速无线电路436的无线局域网(wlan)的高速数据传输所需的处理资源。
62.在一些示例中，高速处理器432执行操作系统，诸如linux操作系统或眼戴设备100的其他此类操作系统，并且操作系统被存储在存储器434中以供执行。除了任何其他职责之外，执行眼戴设备100的软件架构的高速处理器432还用于管理利用高速无线电路436的数据传输。在一些示例中，高速无线电路436被配置为实现电气和电子工程师协会(ieee)802.11通信标准，本文中也称为wi-fi。在其他示例中，高速无线电路436可实施其他高速通信标准。
63.低功率电路420包括低功率处理器422和低功率无线电路424。眼戴设备100的低功率无线电路424和高速无线电路436可包括短距离收发器(bluetooth
tm
或蓝牙低功耗(ble))和无线广域网、局域网或广域网收发器(例如，蜂窝或wi-fi)。移动设备401，包括经由低功率无线连接425和高速无线连接437通信的收发器的，可使用眼戴设备100的架构的细节来实施，网络495的其他元件同样可如此实施。
64.存储器434包括能够存储各种数据和应用的任何存储设备，所述数据包括由左和右可见光相机114a、114b、红外相机410、图像处理器412生成的相机数据、以及由图像显示驱动器442生成以在每个光学组件180a、180b的图像显示器上显示的图像。虽然存储器434被示出为与高速电路430集成，但在其他示例中，存储器434可以是眼戴设备100的单独的独立元件。在某些此类示例中，电气布线线路可提供从图像处理器412或低功率处理器422通过包括高速处理器432的芯片到存储器434的连接。在其他示例中，高速处理器432可管理存储器434的寻址，使得低功率处理器422将在需要涉及存储器434的读或写操作的任何时间启动高速处理器432。
65.如图4所示，眼戴设备100的高速处理器432可耦接到相机系统(可见光相机114a、114b)、图像显示驱动器442、用户输入设备491和存储器434。如图5所示，移动设备401的cpu 530可耦接到相机系统570、移动显示器驱动器582、用户输入层591和存储器540a。
66.服务器系统498可以是作为服务或网络计算系统的一部分的一个或多个计算设备，例如包括处理器、存储器和网络通信接口以通过网络495与眼戴设备100和移动设备401通信的计算设备。
67.眼戴设备100的输出部件包括视觉元件，诸如与每个镜头或光学组件180a、180b相关联的左和右图像显示器，如图2a和图2b所述(例如，显示器，诸如液晶显示器(lcd)、等离子体显示面板(pdp)、发光二极管(led)显示器、投影仪或波导)。眼戴设备100可包括面向用户的指示器(例如，led、扬声器或振动执行器)，或面向外的信号(例如，led、扬声器)。每个光学组件180a、180b的图像显示器由图像显示驱动器442驱动。在一些示例性配置中，眼戴设备100的输出部件进一步包括附加指示器，诸如可听元件(例如，扬声器)、触觉部件(例如，致动器，诸如用于生成触觉反馈的振动马达)和其他信号生成器。例如，设备100可包括面向用户设置的指示器或者面向外的信号组。面向用户的指示器被配置为由设备100的用户看到或以其他方式感知到。例如，设备100可包括被定位成使得用户可以看见它的led显示器、被定位成生成用户可以听到的声音的一个或多个扬声器、或者提供用户可以感觉到
的触觉反馈的致动器。面向外的信号组被配置为由设备100附近的观察者看到或以其他方式感知到。类似地，设备100可包括led、扬声器或配置为可被观察者感知的执行器。
68.眼戴设备100的输入部件可包括字母数字输入部件(例如，被配置为接收字母数字输入的触摸屏或触摸板、摄影光学键盘或其他字母数字配置的元件)、基于点的输部件(例如，鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指点仪器)、触觉输入部件(例如，按钮开关、感测触摸或触摸手势的位置、力或位置和力的触摸屏或触摸板，或其他触觉配置的元件)和音频输入部件(例如，麦克风)等。移动设备401和服务器系统498可包括字母数字、基于点、触觉、音频和其他输入部件。
69.在一些示例中，眼戴设备100包括被称为惯性测量单元472的运动感测部件的集合。运动感测部件可以是具有微观移动部件的微机电系统(mems)，这些微观移动部件通常足够小以成为微芯片的一部分。在一些示例性配置中，惯性测量单元(imu)472包括加速计、陀螺仪和磁力计。所述加速计可感测所述设备100相对于三个正交轴(x、y、z)的线性加速度(包括由于重力而引起的加速度)。陀螺仪感测设备100绕三个旋转轴(俯仰、滚转、偏航)的角速度。加速计和陀螺仪可一起提供关于设备相对于六个轴(x、y、z、俯仰、滚转、偏航)的定位、定向和运动数据。如果存在磁力计，则感测所述设备100相对于磁北极的航向。设备100的定位可以由位置传感器诸如gps单元473、用于生成相对定位坐标的一个或多个收发器、高度传感器或气压计和其他定向传感器来确定。还可经由低功率无线电路424或高速无线电路436从移动设备401通过无线连接425和437接收此类定位系统坐标。
70.imu 472可包括数字运动处理器或程序，或者与数字运动处理器或程序协作，该数字运动处理器或程序从部件采集原始数据，并且计算关于设备100的定位、定向和运动的多个有用值。例如，从加速计采集的加速度数据可被积分以获得相对于每个轴(x、y、z)的速度；并再次被积分以获得设备100的定位(以线性坐标x、y和z表示)。来自陀螺仪的角速度数据可被积分以获得设备100的定位(以球面坐标表示)。用于计算这些有效值的程序可存储在存储器434中并且由眼戴设备100的高速处理器432执行。
71.眼戴设备100可以可选地包括附加的外围传感器，诸如与眼戴设备100集成的生物计量传感器、特性传感器或显示元件。例如，外围设备元件可包括任何i/o部件，包括输出部件、运动部件、定位部件或本文所述的任何其他此类元件。例如，生物计量传感器可包括检测表情(例如，手势、面部表情、声音表达、身体姿势或眼睛追踪)、测量生物信号(例如，血压、心率、体温、出汗或脑电波)或识别人(例如，基于语音、视网膜、面部特征、指纹或电生物信号诸如脑电图数据的识别)等的部件。
72.移动设备401可以是智能电话、平板电脑、笔记本电脑、接入点或能够使用低功率无线连接425和高速无线连接437两者与眼戴设备100连接的任何其他此类设备。移动设备401连接到服务器系统498和网络495。网络495可包括有线和无线连接的任何组合。
73.如图4所示的交互式增强现实系统400包括通过网络耦接到眼戴设备100的计算设备，诸如移动设备401。交互式增强现实系统400包括用于存储指令的存储器和用于执行指令的处理器。由处理器432执行交互式增强现实系统400的指令将眼戴设备100配置为与移动设备401协作。交互式增强现实系统400可利用眼戴设备100的存储器434或移动设备401的存储器元件540a、540b、540c(图5)。此外，交互式增强现实系统400可利用眼戴设备100的处理器元件432、422或移动设备401的中央处理单元(cpu)530(图5)。另外，交互式增强现实
系统400可进一步利用服务器系统498的存储器和处理器元件。在这个方面中，交互式增强现实系统400的存储器和处理功能可以跨眼戴设备100、移动设备401和服务器系统498共享或分布。
74.存储器434包括歌曲文件482和虚拟对象484。歌曲文件482包括节奏(例如，节拍音轨)以及可选的音符序列和音符值。音符是表示特定音高或其他乐声的符号。音符值包括相对于节奏而言的弹奏音符的持续时间，并且可包括其他质量，诸如响度、强调、清晰发音和相对于其他音符的分句。在一些实施例中，节奏包括默认值以及用户界面，用户可通过该用户界面选择在歌曲回放期间使用的特定节奏。虚拟对象484包括用于识别由相机114捕获的图像中的对象或特征的图像数据。这些对象可以是物理特征，诸如用于在环境内定位眼戴设备100的已知的绘画或物理标记。
75.存储器434另外包括由处理器432执行的定位检测工具460、标记配准工具462、定位工具464、虚拟对象渲染工具466、物理引擎468和预测引擎470。定位检测工具460将处理器432配置为例如使用定位工具464来确定在环境内的定位(位置和定向)。标记配准工具462将处理器432配置为在环境内配准标记。标记可以是在环境内具有已知位置的预定义物理标记，或者由处理器432指定到相对于眼戴设备100正在其中操作的环境或相对于眼戴器本身的特定位置。定位工具464将处理器432配置为获得定位数据，以用于确定眼戴设备100、由眼戴设备呈现的虚拟对象或它们的组合的定位。位置数据可以从一系列图像、imu单元472、gps单元473或它们的组合中导出。虚拟对象渲染工具466将处理器432配置为渲染用于由图像显示器180在图像显示驱动器442和图像处理器412的控制下显示的虚拟图像。物理引擎468将处理器432配置为以将物理定律(诸如重力和摩擦)应用于例如虚拟游戏之间的虚拟世界。预测引擎470将处理器432配置为基于对象(诸如眼戴设备100)的当前航向、来自传感器(诸如imu 472)的输入、环境的图像或它们组合来预测该对象的预期移动。
76.图5是示例性移动设备401的高级功能框图。移动设备401包括闪存存储器540a，其存储由cpu 530执行以运行本文所述的所有功能或功能子集的程序。
77.移动设备401可包括相机570，其包括至少两个可见光相机(具有重叠的视场的第一和第二可见光相机)或具有基本上重叠的视场的至少一个可见光相机和深度传感器。闪存存储器540a可进一步包括经由相机570生成的多个图像或视频。
78.如图所示，移动设备401包括图像显示器580、控制图像显示器580的移动显示驱动器582和显示控制器584。在图5的示例中，图像显示器580包括用户输入层591(例如，触摸屏)，该层位于图像显示器580使用的屏幕的顶部上或以其他方式集成到该屏幕中。
79.可使用的触摸屏式的移动设备的示例包括(但不限于)智能电话、掌上电脑(pda)、平板计算机、笔记本电脑或其他便携式设备。然而，触摸屏式的设备的结构和操作是以示例的方式提供的；如本文所述的主题技术并不旨在局限于此。出于该讨论的目的，图5因此提供了具有用户界面的示例性移动设备401的框图图示，该用户界面包括用于接收输入(通过手、触笔或其他工具的触摸、多点触摸或手势等)的触摸屏输入层891和用于显示内容的图像显示器580。
80.如图5所示，移动设备401包括用于经由广域无线移动通信网络进行数字无线通信的至少一个数字收发器(xcvr)510，示出为wwan xcvr。移动设备401还包括附加的数字或模拟收发器，诸如用于诸如经由nfc、vlc、dect、zigbee、bluetooth
tm
或wi-fi进行短距离网络
通信的短距离收发器(xcvr)520。例如，短距离xcvr 520可采取与在无线局域网中实施的一个或多个标准通信协议(例如，符合ieee 802.11的wi-fi标准之一)兼容的类型的任何可用双向无线局域网(wlan)收发器的形式。
81.为了生成用于定位移动设备401的位置坐标，移动设备401可包括全球定位系统(gps)接收器。另选地或附加地，移动设备401可利用短距离xcvr 520和wwan xcvr 510中的任一者或两者来生成用于定位的位置坐标。例如，基于蜂窝网络、wi-fi或bluetooth
tm
的定位系统可生成非常准确的位置坐标，尤其是当它们组合使用时。此类位置坐标可经由xcvr 510、520通过一个或多个网络连接传输到眼戴设备。
82.收发器510、520(即，网络通信接口)符合现代移动网络所利用的各种数字无线通信标准中的一个或多个标准。wwan收发器510的示例包括(但不限于)被配置为根据码分多址(cdma)和第3代合作伙伴计划(3gpp)网络技术操作的收发器，所述技术包括例如但不限于3gpp类型2(或3gpp2)和lte，有时被称为“4g”。例如，收发器510、520提供信息的双向无线通信，所述信息包括数字化音频信号、静止图像和视频信号、用于显示的网页信息以及web相关输入，以及去往/来自移动设备401的各种类型的移动消息通信。
83.移动设备401进一步包括用作中央处理单元(cpu)的微处理器；如图4中的cpu530所示。处理器是具有被构造并布置成执行一个或多个处理功能(通常是各种数据处理功能)的具有元器件的电路。尽管可使用分立的逻辑部件，但是这些示例利用形成可编程cpu的部件。微处理器例如包括一个或多个集成电路(ic)芯片，其结合了执行cpu的功能的电子元件。例如，cpu 530可基于任何已知或可用的微处理器架构，诸如使用arm架构的精简指令集计算(risc)，正如现今在移动设备和其他便携式电子设备中通常使用的。当然，处理器电路的其他布置可用于形成智能电话、笔记本电脑和平板电脑中的cpu530或处理器硬件。
84.cpu 530用作移动设备401的可编程主机控制器，通过配置在移动设备401上执行各种操作，例如，根据cpu 530可执行的指令或编程。例如，此类操作可包括移动设备的各种一般操作，以及与用于移动设备上的应用的程序相关的操作。尽管处理器可使用硬连线逻辑来配置，但是移动设备中的典型处理器是通过执行程序来配置的通用处理电路。
85.移动设备401包括用于存储程序和数据的存储器或存储系统。在示例中，存储器系统可根据需要包括闪存存储器540a、随机存取存储器(ram)540b和其他存储器部件540c。ram 540b用作由cpu 530处理的指令和数据的短期存储装置，例如，用作工作数据处理存储器。闪存存储器540a通常提供长期存储。
86.因此，在移动设备401的示例中，闪存存储器540a用于存储由cpu 530执行的程序或指令。根据设备的类型，移动设备401存储并运行移动操作系统，特定应用程序通过该移动操作系统执行。移动操作系统的示例包括google android、apple ios(用于iphone或ipad设备)、windows mobile、amazon fire os、rim blackberry os等。
87.眼戴设备100内的处理器432构建眼戴设备100周围的环境的地图，确定眼戴设备在映射环境内的位置，并且确定眼戴设备相对于映射环境中的一个或多个对象的相对定位。在一个示例中，处理器432构建地图，并且使用应用于从一个或多个传感器接收的数据的即时定位与地图构建(slam)算法来确定位置和定位信息。在增强现实的背景下，slam算法用于构建并更新环境的地图，同时追踪并更新设备(或用户)在映射的环境中的位置。数学解可使用各种统计方法来近似，诸如粒子滤波、卡尔曼滤波、扩展卡尔曼滤波和协方差交
集。
88.传感器数据包括从相机114a、114b中的一者或两者接收的图像、从激光测距仪接收的距离、从gps单元473接收的定位信息、或两个或更多个此类传感器数据的组合，或来自提供用于确定定位信息的数据的其他传感器的数据。
89.图6描绘了示例性环境600以及用于自然特征追踪(nft；例如，使用slam算法的追踪应用)的元素。眼戴设备100的用户602存在于示例性物理环境600(在图6中为内部房间)中。眼戴设备100的处理器432使用所捕获的图像来确定其相对于环境600内的一个或多个对象604的定位，使用环境600的坐标系(x,y,z)来构建环境600的地图，并且确定其在坐标系内的定位。另外，处理器432通过使用与单个对象604a相关联的两个或更多个位置点(例如，三个位置点606a、606b和606c)或者通过使用与两个或更多个对象604a、604b、604c相关联的一个或更多个位置点606来确定眼戴设备100在环境内的头部姿态(滚转、俯仰和偏航)。在一个示例中，眼戴设备100的处理器432在环境600内定位一个虚拟对象408(诸如图6中所示的钥匙)，经图像显示器180进行增强现实观看。
90.图7是描绘用于在可穿戴设备(例如，眼戴设备)上实施本文所述的增强现实应用的方法的流程图700。尽管如本文所述，参考眼戴设备100描述了这些步骤，但是本领域技术人员根据本文的描述将理解所描述的步骤针对其他类型的设备的其他实施例。另外，可以设想，在图7中以及在其他附图中示出的并且在本文中描述的一个或多个步骤可省略、同时或依序执行、以不同于所示和所述的次序执行、或结合附加步骤执行。
91.在框702处，眼戴设备100捕获在眼戴设备100附近的物理环境600中的一个或多个输入图像。处理器432可连续地从可见光相机114接收输入图像，并且将这些图像存储在存储器434中以供处理。另外，眼戴设备100可以从其他传感器捕获信息(例如，来自gps单元473的位置信息、来自imu 472的定向信息、或来自激光距离传感器的距离信息)。
92.在框704处，眼戴设备100将所捕获的图像中的对象与存储在图像库中的对象进行比较以识别匹配。在一些实施例中，处理器432将所捕获的图像存储在存储器434中。已知对象的图像库存储在虚拟对象数据库484中。
93.在一个示例中，处理器432被编程为识别预定义的特定对象(例如，悬挂在墙壁上的已知位置处的特定照片604a、另一墙壁上的窗口604b、或定位在地板上的对象诸如保险箱604c)。其他传感器数据诸如gps数据可用于缩小在比较中使用的已知对象(例如，仅与通过gps坐标识别出的房间相关联的图像)的数量。在另一示例中，处理器432被编程为识别预定义的一般对象(诸如公园内的一棵或多棵树)。
94.在框706处，眼戴设备100确定其相对于对象的定位。处理器432可通过将所捕获的图像中的两个或更多个点之间(例如，一个对象604上的两个或更多个位置点之间或者两个对象604中的每个对象上的位置点606之间)的距离与所识别的对象中的对应点之间的已知距离进行比较和处理，来确定其相对于对象的定位。所捕获的图像的点之间的距离大于所识别的对象的点之间的距离的指示眼戴设备100比捕获包括所识别的对象的图像的成像器更靠近所识别的对象。另一方面，所捕获的图像的点之间的距离小于所识别的对象的点之间的距离的指示眼戴设备100比捕获包括所识别的对象的图像的成像器更远离所识别的对象。通过处理相对距离，处理器432能够确定相对于对象的定位。另选地或附加地，可使用其他传感器信息(诸如激光距离传感器信息)来确定相对于对象的定位。
95.在框708处，眼戴设备100构建围绕眼戴设备100的环境600的地图，并且确定其在环境内的位置。在一个示例中，在所识别的对象(框704)具有预定义坐标系(x,y,z)的情况下，眼戴设备100的处理器432使用该预定义坐标系来构建地图，并且基于相对于所识别的对象的所确定的定位(框706)来确定其在该坐标系内的定位。在另一示例中，眼戴设备使用环境内的永久或半永久对象604的图像(例如，公园内的树或公园长凳)来构建地图。根据该示例，眼戴设备100可限定用于环境的坐标系(x
′
,y
′
,z
′
)。
96.在框710处，眼戴设备100确定眼戴设备100在环境内的头部姿态(滚转、俯仰和偏航)。处理器432通过使用一个或多个对象604上的两个或更多个位置点(例如，三个位置点606a、606b和606c)或通过使用两个或更多个对象604上的一个或多个位置点606来确定头部姿态。通过使用常规图像处理算法，处理器432通过比较在所捕获图像与已知图像的位置点之间延伸线的角度和长度来确定滚转、俯仰和偏航。
97.在框712处，眼戴设备100向用户呈现视觉图像。处理器432使用图像处理器412和图像显示驱动器442在图像显示器180上向用户呈现图像。处理器通过对环境600内眼镜设备100的位置做出响应的图像显示器形成并呈现视觉图像。
98.在框714处，随着用户在环境600中移动，重复以上参考框706-712所述的步骤，以更新眼戴设备100的定位以及用户602所观看的内容。
99.再次参考图6，在该示例中，实施本文所述的增强现实虚拟引导应用的方法包括与物理对象(例如，绘画604a)相关联的虚拟标记(例如，虚拟标记610a)和与虚拟对象(例如，钥匙608)相关联的虚拟标记。在一个示例中，眼戴设备100使用与物理对象相关联的标记来确定眼戴设备100在环境中的定位，并且使用与虚拟对象相关联的标记来生成叠层图像，这些叠层图像在眼戴设备100的显示器上的虚拟标记定位处呈现环境600中的相关联虚拟对象608。例如，标记在环境中的位置被登记以用于追踪和更新用户、设备和对象(虚拟的和物理的)在映射的环境中的位置。标记有时被登记到高对比度物理对象(诸如安装在较浅色墙壁上的相对较暗的对象604a)，以帮助相机和其他传感器进行检测标记的任务。标记可以是预先指定的，或者可以由眼戴设备100在进入环境时指定。标记也被配准在环境中的位置处，以用于在映射的环境中的那些位置处呈现虚拟图像。
100.标记可以用信息编码或以其他方式与信息链接。标记可包括定位信息、物理代码(诸如条形码或qr码；对用户可见或隐藏)或它们的组合。与标记相关联的一组数据被存储在眼戴设备100的存储器434中。该一组数据包括关于标记610a、标记的定位(位置和定向)、一个或多个虚拟对象或它们的组合的信息。标记定位可包括一个或多个标记界标616a的三维坐标，诸如图6所示的大致矩形的标记610a的角部。标记定位可以相对于真实世界的地理坐标、标记坐标系、眼戴设备100的定位或其他坐标系来表示。与标记610a相关联的该一个或多个虚拟对象可包括各种材料中的任何一种，包括静止图像、视频、音频、触觉反馈、可执行应用、交互式用户界面和体验、以及此类材料的组合或序列。在该上下文中，能够被存储在存储器中并且在遇到标记610a时被检索或与所指定的标记相关联的任何类型的内容都可以被分类为虚拟对象。例如，图6所示的钥匙608是在标记位置处显示为2d或3d静止图像的虚拟对象。
101.在一个示例中，标记610a可在存储器中登记为位于物理对象604a(例如，图6所示的带框架艺术品)附近并与其相关联。在另一示例中，标记可在存储器中登记为相对于眼戴
设备100的特定定位。
102.图8a至图8e是列出增强现实引导体验的示例性方法中的步骤的流程图800、850、860、870和890。如本文所述，尽管这些步骤是参考眼戴设备100描述的，如本文所述，但针对其他类型的可穿戴移动设备，所述步骤的其他实施例将由本领域技术人员根据本文的描述中理解。另外，可以设想，在图8a-e中以及在其他附图中示出的并且在本文中描述的一个或多个步骤可省略、同时或依序执行、以不同于所示和所述的次序执行、或结合附加步骤执行。
103.在图8a中，在框802处，处理器432捕获环境的图像。在示例中，图像是由耦接到眼戴设备100或作为其一部分的相机114a、114b捕获的一系列视频数据帧。在一些实施例中，相机114a、114b包括一个或多个高分辨率数字相机，其配备有能够捕获高清晰度静止图像和高清晰度视频的cmos图像传感器。每个数字视频帧包括图像中的多个像素的深度信息。在这个方面，相机114a、114b通过捕获环境的详细输入图像而用作高清晰度扫描仪。在一些实施例例中，相机114a、114b包括一对高分辨率数字相机114a、114b，它们耦接到眼戴设备100并间隔设置以获取左相机原始图像和右相机原始图像。当被组合时，原始图像形成一个包括三维像素位置矩阵的输入图像。在一些实施例中，在步骤802的方法包括将捕获的一系列视频数据帧至少暂时地存储在眼戴设备100上的存储器434中，使得这些帧可用于分析。
104.在框804处，处理器432确定眼戴设备100相对于环境中的其他对象的定位(例如，位置和定向)。在示例中，处理器432使用一系列视频数据帧通过应用slam算法或其他计算机视觉算法来定位眼戴设备100在环境内的位置。
105.另外，处理器432确定眼戴设备100的视场。眼戴设备100的视场是透过光学元件(假设为透视显示器)所见的视野。视场可基于与光学组件相关联的角度值(例如，围绕光学组件的中心轴指向的方向成30度的锥体)来确定。在一个示例中，移动设备是平板电脑，视场是在屏幕上查看的图像，该图像基本上同时被平板电脑的可见光相机捕获。
106.眼戴设备100确定并监视其在三维空间中的位置和定向(例如，两个轴x和y或三个轴x、y和z)以及绕一个或多个轴的旋转(例如，俯仰、偏航和滚转)。眼戴设备100可使用slam算法、其他计算机视觉算法、各种传感器(例如，用于确定方向的罗盘和用于确定定向的imu 472)或它们的组合来确定和监视眼戴设备100的位置和定向。
107.在框806处，处理器432随着眼戴设备在环境中移动而监视眼戴设备100的当前定位。眼戴设备100的移动改变了由相机捕获一系列视频数据帧的定位和定向。处理器432(实施定位检测程序460和定位程序464)通过例如应用slam算法、其他计算机视觉算法，使用一系列视频数据帧以随着佩戴者/用户在环境中移动而更新定位。在这个方面，该方法随着佩戴者相对于物理环境移动而持续地更新眼戴设备100的当前本地定位，使得所呈现的虚拟对象在相对于物理环境逻辑上真实的位置中是持久可见的。
108.在框808处，处理器432识别在当前定位的预定义阈值(限制或范围)内的第一标记定位。为了识别第一标记定位，根据一个示例，处理器432识别在眼戴设备100的当前位置坐标周围的坐标范围，该坐标范围包括例如眼戴设备100的当前位置坐标十英尺内的所有坐标或大于一英尺且小于10英尺的所有坐标。
109.在处理器432识别环境后，环境内的标记可被存储在由眼戴设备100从服务器498检索的查找表中。处理器432例如通过网络495且任选地通过移动设备401将其位置坐标发
送到服务器498。然后，处理器432例如通过网络495且任选地通过移动设备401从服务器498接收与其位置/当前环境对应的查找表。处理器432将查找表存储在存储器中，例如存储器434。
110.在一个示例中，处理器432从标记定位的子集中识别第一标记定位，该子集包括环境内具有在眼戴设备100的位置坐标周围的坐标范围内的坐标的所有标记定位。处理器432可通过在存储器434中查询包括环境内的所有标记的查找表、从查找表中识别在坐标范围内的所有标记定位、以及从所识别的标记定位中选择最靠近眼戴设备100的当前定位的标记作为第一标记定位，从而识别第一标记定位。
111.在另一示例中，处理器432从标记定位的子集中识别第一标记定位，该子集包括所有标记定位，环境的坐标在眼戴设备100的位置坐标周围的坐标范围内并且也在眼戴设备100的视场内。处理器432可通过在存储器434中查询包括环境内的所有标记的查找表、从查找表中识别既在坐标范围内又在眼戴设备100的视场内的所有标记定位、以及从所识别的标记定位中选择在视场内且最靠近眼戴设备100的当前定位的标记作为第一标记定位，从而识别第一标记定位。
112.在框810处，处理器432登记第一标记定位。处理器432使用标记配准程序462相对于眼戴设备100周围的环境来选择并配准标记位置。标记登记包括将标记位置存储在存储器(例如，存储器434)中。在一个示例中，标记位置包括基于从数字图像或数字视频帧获得的深度信息或与之相关的一组三维标记坐标。在另一示例中，标记定位包括基于由处理器432获得的gps信息或其他定位信息或与之相关的一组三维标记坐标。
113.在一些实施例中，标记位置与标记坐标系的原点(0,0,0)重合。标记坐标系可用作标记位置以及标记所放置的位置或附近的各种其他位置的参考。在一个示例中，原点对应于环境，并且所有的标记定位是相对于环境而限定的。
114.在框812处，处理器432生成叠层图像，该叠层图像包括用于在第一标记定位处显示的第一引导标记。处理器432可使用显示系统来生成叠层图像，该显示系统执行渲染程序466并且包括图像处理器412、图像显示驱动器442和图像显示器180。第一引导标记包括多个属性(例如，形状、大小、颜色)。属性可存储在标记定位查找表或另一表中。在一个示例中，处理器432例如通过基于距离调整属性(诸如大小)，从而响应于眼戴设备100相对于第一标记定位的定位而生成叠层图像，使得标记的表观大小随着眼戴设备100接近标记而增大。
115.在框814处，处理器432呈现叠层图像。图像处理器412使用图像显示驱动器442在图像显示器180a-b上呈现包括第一引导标记的叠层图像，使得第一引导标记出现在第一标记定位处。例如，使用从使用所捕获的视频数据帧的定位获得的位置和定向结果(步骤802)和虚拟对象渲染程序466，眼戴设备100执行以与标记位置相关的大小、形状和定向在显示器上呈现具有第一引导标记的叠层图像的步骤814。第一引导标记呈现在眼戴设备100的镜头上，从而便于观看第一引导标记和物理环境两者。例如，右镜头(右光学组件180b)包括右显示矩阵177b，其被配置为与来自右投影仪150b的光交互，该右投影仪被定位成将图像投影到镜头180b的内表面上。在这个方面，第一引导标记被呈现为相对于物理环境的叠层的一部分，使得第一虚拟标记是持久可见的。图9a描绘了具有叠层图像的示例性眼戴设备100，该叠层图像包括定位在环境904内的第一标记定位处的第一引导标记902(具有第一颜
色属性；例如，绿色)。
116.在框816处，处理器432识别在当前定位的预定义阈值(限制或范围)内的第二标记定位。可基本上如上文针对第一标记所述(框808)来识别第二标记定位—修改为查看下一最靠近的标记。在一个示例中，处理器432可通过在存储器434中查询包括环境内的所有标记的查找表、从查找表中识别在坐标范围内的所有标记定位、以及从所识别的标记定位中选择第一标记定位之后的下一最接近眼戴设备100的当前定位的标记，从而识别第二标记定位。在另一示例中，处理器432可通过在存储器434中查询包括环境内的所有标记的查找表、从查找表中识别既在坐标范围内又在眼戴设备100的视场内的所有标记定位、以及从所识别的标记定位中选择在视场内且在第一标记定位之后的下一最靠近眼戴设备100的当前定位的标记，从而识别第二标记定位。
117.在框818和820处，处理器432配准第二标记定位并生成包括第二标记定位的另一叠层图像。处理器432配准第二标记定位，并使用与上文针对第一标记定位所述的相同过程(框810和812)来生成另一叠层图像。所生成的另一叠层图像可仅包括第二引导标记，或者包括第一和第二引导标记两者。
118.在框822处，处理器432呈现另一叠层图像。图像处理器412使用图像显示驱动器442在图像显示器180a-b上呈现包括第二引导标记(以及任选地，第一引导标记)的另一叠层图像，使得第二引导标记出现在第二标记定位处。处理器432使用与上文针对叠层图像所述的相同过程来呈现另一叠层图像(框814)。图9a描绘了具有叠层图像的示例性眼戴设备100，该叠层图像包括定位在环境904内的第二标记定位处的第二引导标记906(具有第二颜色属性；例如，浅绿色)。
119.在框824处，处理器432识别在当前位置的预定义阈值(限制或范围)内的其他标记定位。其他标记定位可基于上文针对第一和第二标记(框808、810、816和818)的描述来被识别并登记。用于登记的标记位置的叠层图像然后可参考上文所述框812、814、820和822来呈现并生成。图9a描绘了具有叠层图像的示例性眼戴设备100，该叠层图像包括在环境904内定位的第三标记定位处的另一引导标记(第三引导标记908；具有第三颜色属性；例如，红色)。
120.在框826处，处理器432抑制小于预定义阈值的引导标记的显示。例如，如果引导标记的标记定位在眼戴设备100的当前位置的一英尺内，则处理器432阻止在生成叠层图像期间包括对应的引导标记。因此，为避免视场变得杂乱，已用于引导眼戴设备100的佩戴者的引导标记不会被显示。图9b描绘了具有叠层图像的示例性眼戴设备100，该叠层图像包括定位在环境内的第三引导标记908，但是不再显示第一引导标记902和第二引导标记904(参见图9a)。
121.在图8b中，流程图850描绘了用于创建和显示动态引导标记的步骤的示例。在框852处，处理器432监视计数器。计数器可由处理器432实施。
122.在框854处，处理器432生成包括在不同定向上的引导标记的接续叠层图像(例如，每个图像对应计数器的一次递增)。处理器432可使用显示系统来生成接续叠层图像。在一个示例中，动态引导标记包括具有相同形状但具有不同定向的多个引导标记。对于计数器的每次递增，选择多个引导标记中的不同引导标记以在叠层图像中显示。通过加快和减慢计数器，处理器432能够增大和减小变化率(例如，引导标记绕轴的旋转)。图9d-f描绘了在
每个帧中具有不同定向(例如，从引导标记910a转变到引导标记910b再转变到引导标记910c)的动态引导标记(最终引导标记910)。
123.在图8c中，流程图860描绘了用于基于距离来改变引导标记的外观的步骤的示例。在框862处，处理器432确定引导标记的标记定位与眼戴设备102之间的距离。例如，处理器432可计算引导标记的标记定位与眼戴设备102的当前定位之间的差值，并使用该差值的绝对值和距离。在框864处，图像处理器412在处理器432的控制下响应于所确定的距离而调整引导标记的视觉属性。例如，图像处理器412可以随着距离减小而增大引导标记的大小，并且随着距离增大而增大引导标记的大小。图9b描绘了具有第一尺寸的引导标记914a，并且图9c描绘了具有第二更大尺寸的引导标记914b。也可基于距离来调整其他属性(诸如颜色)。在框866处，处理器432生成包括经调整的引导标记的另一叠层图像。可以如上文参考框812和820所述来生成叠层图像。
124.在图8d中，流程图870描绘了用于基于距离来改变引导标记的外观的另一示例性步骤。在框872处，处理器432确定引导标记的标记定位与眼戴设备102之间的距离。例如，处理器432可如上参考框862所述来计算距离。
125.在决策框874处，处理器432将所确定的距离(框872)与阈值距离(例如，4英尺)进行比较。如果距离大于阈值距离，则处理在框876处继续选择用于引导标记的第一视觉图像(例如，图9b中具有第一大小的引导标记914a)。如果距离小于或等于阈值距离，则处理在框878处继续选择用于引导标记的第二视觉图像(例如，图9c中具有第二更大尺寸的引导标记914b)。具有其他属性差异(诸如颜色)的图像也可基于距离来选择。
126.在框880处，处理器432生成包括所选择的引导标记的另一叠层图像。可以如上文参考框812和820所述来生成叠层图像。
127.在图8e中，流程图890描绘了用于基于环境的特性来调整引导标记的示例。在框892处，处理器432感测环境的特性(例如，走廊宽度)。处理器432可通过应用cv算法至由相机捕获的图像来感测特性(框802)。在框894处，处理器432响应于所感测的特性而调整引导标记的视觉属性。例如，可调整引导标记的大小以填充走廊的宽度(参见图9c)。处理器432可经由执行渲染程序466的图像处理器412来调整视觉属性。
128.图9a-f示出了经引导的增强现实体验，其中眼戴设备100的用户在环境904中被引导到达目的地(例如，碎纸机920)。图9a描绘了呈现在眼戴设备100的显示器180上的叠层图像，其包括位于环境(例如，办公室或博物馆)内的标记定位处的第一引导标记902、第二引导标记906和第三引导标记908。引导标记被成形为在引导方向(在例示的示例中为正前方)上引导用户。图9b描绘了叠层图像，其中随着眼戴设备100的用户在环境904中移动，第三引导标记908、第四引导标记912和第五引导标记914被包括在叠层中(并且第一引导标记902和第二引导标记904不再可见)。
129.图9b、图9c示出了引导标记的特性(在图示示例中为尺寸)基于眼戴设备100与引导标记的标记定位之间的距离而改变的示例。当眼戴设备100接近标记定位时，对应的引导标记从相对较小的引导标记914a转变到相对较大的引导标记914b。
130.图9d-9f示出了当在眼戴设备100的视场内时连续地转变(例如，旋转)的附加引导标记916和918以及动态引导标记910。在例示的实施方案中，动态引导标记910是识别物理世界(在这种情况下为碎纸机盒920)中的特征/位置的最终引导标记。
131.如本文所述，眼戴设备100、移动设备401和服务器系统498的功能中的任何功能可以被体现在一个或多个计算机软件应用或编程指令集中。根据一些示例，“功能”、“应用”、“指令”或“程序”是执行在程序中定义的功能的程序。可采用各种程序设计语言来开发以各种方式结构化的应用中的一个或多个应用，诸如面向对象的程序设计语言(例如，objective-c、java或c )或过程程序设计语言(例如，c或汇编语言)。在特定示例中，第三方应用(例如，由除特定平台的供应商之外的实体使用android
tm
或ios
tm
软件开发工具包(sdk)开发的应用)可包括在移动操作系统(诸如ios
tm
、android
tm
、电话或另一移动操作系统)上运行的移动软件。在该示例中，第三方应用可调用由操作系统提供的api调用，以促进本文所述的功能。
132.因此，机器可读介质可采取许多形式的有形存储介质。非易失性存储介质包括例如光盘或磁盘，诸如任何计算机设备等中的任何存储设备，诸如可用于实施附图中所示的客户端设备、媒体网关、代码转换器等。易失性存储介质包括动态存储器，诸如此类计算机平台的主存储器。有形传输介质包括同轴电缆；铜线和光纤，包括构成计算机系统内的总线的导线。载波传输介质可采取电信号或电磁信号、或声波或光波的形式，诸如在射频(rf)和红外(ir)数据通信期间生成的那些。因此，计算机可读介质的常见形式包括例如：软盘、软磁盘、硬盘、磁带、任何其他磁介质、cd-rom、dvd或dvd-rom、任何其他光学介质、穿孔卡片纸带、任何其他具有孔图案的物理存储介质、ram、prom和eprom、flash-eprom、任何其他存储器芯片或盒、传输数据或指令的载波、传输此类载波的电缆或链路、或计算机可以从其中读取程序代码或数据的任何其他介质。许多这些形式的计算机可读介质可参与将一个或多个指令的一个或多个序列承载到处理器以供执行。
133.除了上文刚刚陈述的，无论是否在权利要求书中陈述，已陈述或说明的内容都不旨在或不应解释为导致任何部件、步骤、特征、对象、益处、优点或等效物献给公众。
134.应当理解，除非本文另外阐述了特定的含义，否则本文所用的术语和表达具有与关于它们对应的相应调查和研究领域的此类术语和表达一致的通常含义。诸如“第一”和“第二”等的关系术语仅可用于将一个实体或动作与另一实体或动作区分开，而不一定要求或暗示这些实体或动作之间的任何实际的此类关系或顺序。术语“包括”、“包含”、“含有”、“具有”或其任何其他变型形式旨在涵盖非排他性的包括，使得包括或包含一系列元素或步骤的过程、方法、制品或装置不仅包括那些元素或步骤，而是还可以包括未明确列出的或对于此类过程、方法、制品或装置固有的其他元素或步骤。在没有进一步限制的情况下，前缀为“一”或“一个”的元素并不排除在包括该元素的过程、方法、制品或装置中另外的相同元素的存在。
135.除非另有说明，否则本说明书中，包括所附权利要求书中阐述的任何和所有测量、值、额定值、定位、量值、尺寸和其他规格是近似的，而不是精确的。此类量旨在具有与它们涉及的功能和它们所属的领域中的惯例一致的合理范围。例如，除非另外明确说明，否则参数值等可以从所述量或范围变化多达正负百分之十。
136.此外，在前述实施例中可看出，出于使本公开简化的目的，各种特征在各种示例中被组合在一起。公开的本方法不应被解释为反映所要求保护的示例需要比每个权利要求中明确记载的特征更多的特征的意图。相反，如以下权利要求所反映的，要求保护的本主题在于少于任何单个公开的示例的所有特征。因此，将以下权利要求据此并入到实施例中，其中
每个权利要求作为独立要求保护的主题而独立存在。
137.虽然前文已描述了被认为是最佳模式的示例和其他示例，但应当理解，可在其中作出各种修改且本文所公开的主题可以各种形式和示例来实施，并且其可应用于许多应用中，本文仅描述了其中的一些应用。所附权利要求书旨在要求保护落入本发明构思的真实范围内的任何和所有修改和变型。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种多源量测终端数据融合的微电网状态估计方法及系统与流程

增强现实引导的制作方法

相关文献

最热文献