一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

增强现实眼戴器与3D服装的制作方法

2023-03-08 08:49:35 来源:中国专利 TAG:

增强现实眼戴器与3d服装
相关申请的交叉引用
1.本技术要求2020年6月29日提交的美国临时专利申请号63/045,636和2020年7月7日提交的美国专利申请号16/922,215的优先权,这两个专利申请的全部内容据此以引用方式并入。
技术领域
2.本公开中阐述的示例涉及增强现实(ar)和可穿戴移动设备(诸如眼戴设备)领域。更具体地,但不作为限制,本公开描述了与交互式增强现实环境的用户交互。


背景技术:

3.当今可用的许多类型计算机和电子设备诸如移动设备(例如,智能电话、平板电脑和笔记本电脑)、手持式设备和可穿戴设备(例如,智能眼镜、数字眼戴器、头饰、头戴器和头戴式显示器),包括各种相机、传感器、无线收发器、输入系统(例如,触敏表面、指示器)、外围设备、显示器和用户可与显示内容进行交互的图形用户界面(gui)。
4.增强现实(ar)将物理环境中的现实对象与虚拟对象组合,并将该组合显示给用户。组合显示给人的印象是虚拟对象真实地存在于环境中,尤其是当虚拟对象出现并且表现得像真实对象一样时。
附图说明
5.从以下参考附图的具体实施方式中,将容易理解所描述的各种示例的元件。在说明书中和附图的几个视图中,每个元件使用了附图标记。当存在多个相似的元件时,可以给相似的元件指定单个附图标记,通过添加小写字母来指代特定的元件。
6.除非另外指出,否则图中所示的各种特征并非按比例绘制的。为了清楚起见,可放大或缩小各个元件的尺寸。若干附图描绘了一个或多个具体实施,并且仅作为示例呈现,而不应被解释为限制。附图中包括以下附图:
7.图1a是适用于增强现实产生系统的眼戴设备的示例性硬件配置的侧视图(右);
8.图1b是图1a的眼戴设备的右角部的局部横截面透视图,其描绘了右可见光相机和电路板;
9.图1c是图1a的眼戴设备的示例性硬件配置的侧视图(左),其示出了左可见光相机;
10.图1d是图1c的眼戴设备的左角部的局部横截面透视图,其描绘了左可见光相机和电路板;
11.图2a和图2b是在增强现实产生系统中利用的眼戴设备的示例性硬件配置的后视图;
12.图3是三维场景、由左可见光相机捕获的左原始图像和由右可见光相机捕获的右原始图像的图形描绘;
13.图4是包括经由各种网络连接的可穿戴设备(例如,眼戴设备)和服务器系统的示例性增强现实产生系统的功能框图;
14.图5是用于图4的增强现实产生系统的移动设备的示例性硬件配置的图形表示;
15.图6是在用于描述即时定位与地图构建的示例性环境中的用户的示意图;
16.图7是列出在物理环境中显示虚拟对象的示例性方法中的步骤的流程图;
17.图8a示出了各自确定环境中的相应定位的相应眼戴设备的两个用户,诸如(x,y,z)坐标定位;
18.图8b示出了用户b向用户a广播个人属性;
19.图8c示出了在用户a的眼戴设备上显示在用户a头部或面部附近的用户b的个人属性;
20.图9是示出广播和显示个人属性的方法的流程图;
21.图10a示出了眼戴设备识别用户b并且确定用户b的配准点;
22.图10b示出了以3d方式叠加在用户b上的叠层图像;
23.图10c示出了用户b与3d叠层图像一起以3d方式移动;
24.图11示出了允许使用触摸屏选择叠层图像的设备;并且
25.图12示出了选择叠层图像并且在用户b上显示所选择的叠层图像的方法流程图。
具体实施方式
26.眼戴设备提供了一种提供交互式增强现实体验以允许眼戴设备的用户在被查看的人身上显示3d叠层图像。该用户可以图像列表中选择该叠层图像,例如从存储在内存中由用户下载或生成的服装。这些图像能够基于共同的属性在存储器中被分类。当人移动时,人的配准点与该叠层的配准点连续地对齐,使得该用户在移动期间似乎穿着该3d服装。通过对齐这些配准点,该服装能够适应于不同的体型和身高。该服装的着色能够基于环境诸如照明而改变,或者与取景器中看到的颜色形成对比。
27.以下具体实施方式包括说明本公开中阐述的示例的系统、方法、技术、指令序列和计算机器程序产品。出于提供对所公开的主题及其相关教导内容的透彻理解的目的而包括许多细节和示例。然而,相关领域的技术人员能够理解如何在没有此类细节的情况下应用相关教导内容。所公开的主题的各方面不限于所描述的特定设备、系统和方法,因为相关教导内容可以以各种方式来应用或实践。本文中所使用的术语和命名仅仅是为了描述特定方面并非旨在进行限制。通常,公知的指令实例、协议、结构和技术不一定被详细示出。
28.本文中所使用的术语“耦接”或“连接”指的是任何逻辑、光学、物理或电连接(包括链路等),由一个系统特征产生或提供的电或磁信号通过这些连接传递到另一耦接或连接的系统特征。除非另外描述,否则耦接或连接的特征或设备不一定直接彼此连接,并且可以由中间组件、特征或通信介质隔开,中间组件、特征或通信介质中的一者或多者可修改、操纵或承载电信号。术语“上”是指由特征直接支撑或通过另一特征由特征间接支撑,该另一特征集成到特征中或由特征支撑。
29.术语“近侧”用于描述位于对象或人附近、左近或旁边的物品或物品的一部分;或者相对于该物品的其他部分更近,其他部分可以被描述为“远侧”。例如,物品最靠近对象的端部可以被称为近侧端部,而大致相对的端部可以被称为远侧端部。
30.出于说明和讨论的目的,仅以示例的方式给出了诸如附图中的任一附图所示的眼戴设备、其他移动设备、相关联部件和结合了相机、惯性测量单元或两者的任何其他设备的定向。在操作中,眼戴设备可以在适合于眼戴设备的特定应用的任何其他方向上定向,例如,向上、向下、侧向或任何其他定向。此外,就本文所用的范围而言,任何方向性术语,诸如前、后、内、外、向、左、右、侧向、纵向、上、下、高、低、顶部、底部、侧面、水平、垂直和对角,仅以示例的方式使用,并且不限制如本文所构造或另外描述的任何相机或惯性测量单元的方向或定向。
31.示例的其他目的、优点和新颖特征将部分地在以下具体实施方式中阐述,并且部分地在本领域技术人员检查以下内容和附图后将变得显而易见,或者可通过示例的生产或操作来了解。本主题的目的和优点可借助于所附权利要求书中特别指出的方法、手段和组合来实现和达成。
32.现在详细参考附图所示和下文所讨论的示例。
33.图1a是包括触敏输入设备或触摸板181的眼戴设备100的示例性硬件配置的侧视图(右)。在本说明书中,眼戴设备100也被简称为眼戴器。如图所示,触摸板181可具有细微且不易看到的边界;另选地,边界可清楚可见或包括向用户提供关于触摸板181的位置和边界的反馈的凸起或以其他方式可触知的边缘。在其他具体实施中,眼戴设备100可包括在左侧的触摸板。
34.触摸板181的表面被配置为检测手指触摸、轻击和手势(例如,移动触摸),以便与眼戴设备在图像显示器上显示的gui一起使用,从而允许用户以直观的方式浏览并选择菜单选项,这改善并简化了用户体验。
35.对触摸板181上的手指输入的检测可实现若干功能。例如,触摸触摸板181上的任何地方都可使gui在图像显示器上显示或突出显示项目,该项目可被投影到光学组件180a、180b中的至少一者上。在触摸板181上双击可选择项目或图标。在特定方向上(例如,从前到后、从后到前、从上到下或从下到上)滑动或轻扫手指可使项目或图标在特定方向上滑动或滚动;例如,以移动到下一项目、图标、视频、图像、页面或幻灯片。在另一方向上滑动手指可以在相反方向上滑动或滚动;例如,以移动到前一项目、图标、视频、图像、页面或幻灯片。触摸板181实际上可以在眼戴设备100上的任何地方。
36.在一个示例中,在触摸板181上单击的所识别的手指手势开始选择或压下光学组件180a、180b的图像显示器上显示的图像中的图形用户界面元素。基于所识别的手指手势对呈现在光学组件180a、180b的图像显示器上的图像的调整可以是在光学组件180a、180b的图像显示器上选择或提交图形用户界面元素以用于进一步显示或执行的主要动作。
37.如图所示,眼戴设备100包括右可见光相机114b。如本文进一步描述,两个相机114a、114b从两个单独视点捕获场景的图像信息。所捕获的两个图像可用于将三维显示投影到图像显示器上以便用3d眼镜观看。
38.眼戴设备100包括右光学组件180b,其具有图像显示器以呈现图像,诸如深度图像。如图1a和图1b所示,眼戴设备100包括右可见光相机114b。眼戴设备100可包括多个可见光相机114a、114b,其形成被动式三维相机,诸如立体相机,其中右可见光相机114b位于右角部110b。如图1c-d所示,眼戴设备100还包括左可见光相机114a。
39.左和右可见光相机114a、114b对可见光范围波长敏感。可见光相机114a、114b中的
每个具有不同的前向视场,这些视场重叠以能够生成三维深度图像,例如,右可见光相机114b描绘了右视场111b。通常,“视场”是场景的一部分,其通过相机在空间中的特定位置和方向上是可见的。视场111a和111b具有重叠视场304(图3)。当可见光相机捕获图像时,视场111a、111b之外的对象或对象特征未被记录在原始图像(例如,照片或图片)中。视场描述了可见光相机114a、114b的图像传感器在给定场景的所捕获的图像中拾取给定场景的电磁辐射的角度范围或幅度。视场可以被表示为视锥的角度大小;即视角。视角可以水平、垂直或对角地测量。
40.在示例中,可见光相机114a、114b具有视角在15
°
至110
°
之间(例如,24
°
)的视场(fov),并且具有480
×
480像素或更大的分辨率。在另一示例中,使用具有100
°
fov的广角相机来获得更大的fov。“覆盖角度”描述了可见光相机114a、114b或红外相机410(见图2a)的镜头可以有效成像的角度范围。通常,相机镜头产生大到足以完全覆盖相机的胶片或传感器的成像圈,可能包括某种渐晕(例如,与中心相比,图像朝向边缘变暗)。如果相机镜头的覆盖角度未遍及传感器,则成像圈将是可见的,通常具有朝向边缘的强渐晕,并且有效视角将会局限于覆盖角度。
41.此类可见光相机114a、114b的示例包括高分辨率互补金属氧化物半导体(cmos)图像传感器和具有640p(例如,640
×
480像素,总共0.3兆像素)、720p或1080p分辨率的数字vga相机(视频图形阵列)。可见光相机114a、114b的其他示例,其可捕获高清晰度(hd)静止图像且以1642
×
1642像素(或更大)的分辨率存储这些图像;或者以高帧率(例如,每秒三十至六十帧或更多)记录高清晰度视频且以1216
×
1216像素(或更大)的分辨率存储该记录。
42.眼戴设备100可捕获来自可见光相机114a、114b的图像传感器数据以及由图像处理器数字化的地理定位数据,以存储在存储器中。可见光相机114a、114b在二维空间域中捕获相应的左原始图像和右原始图像,这些原始图像包括二维坐标系上的像素矩阵,该二维坐标系包括用于水平定位的x轴和用于垂直定位的y轴。每个像素包括颜色属性值(例如,红色像素光值、绿色像素光值或蓝色像素光值);和定位属性(例如,x轴坐标和y轴坐标)。
43.为了捕获立体图像以用于稍后作为三维投影显示,图像处理器412(在图4中示出)可耦接到可见光相机114a、114b以接收并存储视觉图像信息。图像处理器412或另一处理器控制可见光相机114a、114b的操作以充当模拟人类双眼视觉的立体相机,并且可将时间戳添加到每个图像。每对图像上的时间戳允许将图像一起显示为三维投影的一部分。三维投影产生沉浸式逼真体验,这在包括虚拟现实(vr)和视频游戏的各种情境中是期望的。
44.图1b是图1a的眼戴设备100的右角部110b的横截面透视图,描绘了相机系统的右可见光相机114b和电路板。图1c是图1a的眼戴设备100的示例性硬件配置的侧视图(左),其示出了相机系统的左可见光相机114a。图1d是图1c的眼戴设备的左角部110a的横截面透视图,其描绘了三维相机的左可见光相机114a和电路板。
45.除了连接和耦接位于左侧面170a上之外,左可见光相机114a的结构和布置基本上类似于右可见光相机114b。如图1b的示例所示,眼戴设备100包括右可见光相机114b和电路板140b,该电路板可以是柔性印刷电路板(pcb)。右铰链126b将右角部110b连接到眼戴设备100的右镜腿125b上。在一些示例中,右可见光相机114b、柔性pcb 140b或其他电连接器或触点等部件可位于右镜腿125b或右铰链126b上。
46.右角部110b包括角部体190和角部盖,在图1b的横截面中省略了角部盖。设置在右
角部110b内部的是各种互连的电路板,诸如pcb或柔性pcb,其包括用于右可见光相机114b、麦克风、低功率无线电路(例如,用于经由bluetooth
tm
的无线短距离网络通信)、高速无线电路(例如,用于经由wi-fi的无线局域网通信)的控制器电路。
47.右可见光相机114b耦接到或设置在柔性pcb 140b上且由可见光相机覆盖镜头覆盖,该镜头通过形成在框架105中的开口瞄准。例如,框架105的右边缘107b,如图2a所示,连接到右角部110b,并且包括用于可见光相机覆盖镜头的开口。框架105包括被配置为面向外且远离用户的眼睛的前侧。用于可见光相机覆盖镜头的开口形成在框架105的前向或外向侧面上并穿过该前向或外向侧面。在该示例中,右可见光相机114b具有面向外的视场111b(图3所示),其视线或视角与眼戴设备100的用户的右眼相关。可见光相机覆盖镜头也可粘附到右角部110b的前侧或面向外的表面,其中开口形成有面向外的覆盖角度,但朝向不同的朝外方向。耦接也可经由居间部件间接实现。
48.如图1b所示,柔性pcb 140b设置在右角部110b内,并且耦接到容纳在右角部110b中的一个或多个其他部件。尽管示出为形成在右角部110b的电路板上,右可见光相机114b可形成在左角部110a、镜腿125a、125b或框架105的电路板上。
49.图2a和图2b是眼戴设备100的示例性硬件配置的后透视图,包括两种不同类型的图像显示器。眼戴设备100的尺寸和形状被配置为供用户佩戴的形式;在该示例中为眼镜的形式。眼戴设备100可采取其他形式并且可结合其他类型的框架,例如,头戴器、头戴式耳机或头盔。
50.在眼镜的示例中,眼戴设备100包括框架105,其包括经由适于由用户的鼻部支撑的鼻梁架106连接到右边缘107b的左边缘107a。左和右边缘107a、107b包括相应的孔口175a、175b,这些孔口保持相应的光学元件180a、180b,诸如镜头和显示设备。在此使用的术语“镜头”旨在包括透明或半透明玻璃或塑料片,其具有弯曲或平坦表面,使光会聚/发散或几乎或完全不引起会聚或发散。
51.虽然被示出为具有两个光学元件180a、180b,但是眼戴设备100可包括其他布置,诸如单个光学元件(或者其可不包括任何光学元件180a、180b),这取决于眼戴设备100的应用或预期用户。如前所示,眼戴设备100包括与框架105的左侧面170a相邻的左角部110a以及与框架105的右侧面170b相邻的右角部110b。角部110a、110b可集成到框架105相应的侧面170a、170b上(如图所示)或实施为附接到框架105相应侧面170a、170b上的单独部件。另选地,角部110a、110b可集成到附接到框架105的镜腿(未示出)中。
52.在一个示例中,光学组件180a、180b的图像显示器包括集成的图像显示器。如图2a所示,每个光学组件180a、180b包括合适的显示矩阵177,诸如液晶显示器(lcd)、有机发光二极管(oled)显示器或任何其他此类显示器。每个光学组件180a、180b还包括一个或多个光学层176,其可以包括镜头、光学涂层、棱镜、反射镜、波导、光学条带和其他光学部件及任意组合。光学层176a、176b、

、176n(在图2a中示出为176a-n)可包括棱镜,该棱镜具有合适的尺寸和构造并包括用于接收来自显示矩阵的光的第一表面和用于向用户的眼睛发射光的第二表面。光学层176a-n的棱镜在整个或部分孔口175a、175b上延伸,该孔口形成在左和右边缘107a、107b以在用户的眼睛透过对应的左和右边缘107a、107b观看时允许用户看到棱镜的第二表面。光学层176a-n的棱镜的第一表面从框架105面向上方且显示矩阵177覆盖在棱镜上,使得由显示矩阵177发射的光子和光照射在第一表面上。棱镜的尺寸和形状使得
光在棱镜内被折射并通过光学层176a-n的棱镜的第二表面导向用户的眼睛。在这一点而言,光学层176a-n的棱镜的第二表面可以是凸形的以将光导向眼睛的中心。棱镜可选择性的被设计尺寸和形状来放大由显示矩阵177投影的图像,并且光通过所述棱镜使得从第二表面观察的图像在一个或多个维度上大于从显示矩阵177发射的图像。
53.在一个示例中,光学层176a-n可包括透明的lcd层(保持镜头打开),除非且直到施加电压使该层不透明(关闭或遮挡镜头)。眼戴设备100上的图像处理器412可执行程序以将电压施加到lcd层,以便产生主动式快门系统,从而使得眼戴设备100适于观看被显示为三维投影的视觉内容。除了lcd之外的技术可用于主动式快门模式,包括响应于电压或另一类型的输入的其他类型的反应层。
54.在另一示例中,光学组件180a、180b的图像显示设备包括如图2b所示的投影图像显示器。每个光学组件180a、180b包括激光投影仪150,其是使用扫描镜或检流计的三色激光投影仪。在操作期间,光源(诸如激光投影仪150)被放置在眼戴设备100的镜腿125a、125b中的一个之中或之上。在该示例中,光学组件180b包括一个或多个光学条带155a、155b、

、155n(在图2b中示出为155a-n),它们间隔开来并穿过每个光学组件180a、180b的镜头宽度,或者在镜头的前表面和后表面之间穿过镜头深度。
55.当激光投影仪150投射的光子穿过每个光学组件180a、180b的镜头时,光子遇到光学条带155a-n。当特定光子遇到特定光学条带时,光子要么被重定向到用户的眼睛,要么传递到下一光学条带。激光投影仪150的调制和光学条带的调制的组合可控制特定的光子或光束。在示例中,处理器通过发出机械、声学或电磁信号来控制光学条带155a-n。虽然被示出为具有两个光学组件180a、180b,但是眼戴设备100可包括其他布置,诸如单个或三个光学组件,或者每个光学组件180a、180b可被布置有不同的布置,这取决于眼戴设备100的应用或预期用户。
56.如图2a和图2b进一步所示,眼戴设备100包括与框架105的左侧面170a相邻的左角部110a以及与框架105的右侧面170b相邻的右角部110b。角部110a、110b可集成到框架105相应的侧面170a、170b上(如图所示)或作为附加到框架105各自侧面170a、170b上的单独部件实施。另选地,角部110a、110b可集成到连接在框架105上的镜腿125a、125b中。
57.在另一示例中,图2b中示出的眼戴设备100可包括两个投影仪,左投影仪150a(未示出)和右投影仪150b(示出为投影仪150)。左光学组件180a可包括左显示矩阵177a(未示出)或左光学条带155'a、155'b、

、155'n(155',a至n,未示出),其被配置为与来自左投影仪150a的光交互。类似地,右光学组件180b可包括右显示矩阵177b(未示出)或右光学条155”a、155”b、

、155”n(155”,a至n,未示出),其被配置为与来自右投影仪150b的光交互。在该示例中,眼戴设备100包括左显示器和右显示器。
58.图3是三维场景306、由左可见光相机114a捕获的左原始图像302a和由右可见光相机114b捕获的右原始图像302b的图形描绘。如图所示,左视场111a可与右视场111b重叠。重叠视场304表示由两个相机114a、114b均捕获的部分图像。术语“重叠”在涉及视场时意味着生成的原始图像中的像素矩阵重叠百分之三十(30%)或更多。“基本上重叠”意味着所生成的原始图像中的像素矩阵或场景的红外图像中的像素矩阵重叠百分之五十(50%)或更多。如本文所述,两个原始图像302a、302b可被处理以包括时间戳,该时间戳允许图像作为三维投影的一部分被一起显示。
59.为了捕获立体图像,如图3所示,在给定时刻捕获真实场景306的一对原始红绿蓝(rgb)图像:由左相机114a捕获的左原始图像302a和由右相机114b捕获的右原始图像302b。当(例如,由图像处理器412)处理该对原始图像302a、302b时,生成深度图像。所生成的深度图像可在眼戴设备的光学组件180a、180b上、在另一显示器(例如,移动设备401上的图像显示器580)上、或在屏幕上查看。
60.所生成的深度图像在三维空间域中,并且可包括三维位置坐标系上的顶点矩阵,该三维位置坐标系包括用于水平定位(例如,长度)的x轴、用于垂直定位(例如,高度)的y轴和用于深度(例如,距离)的z轴。每个顶点可包括一个颜色属性(例如,红色像素光值、绿色像素光值或蓝色像素光值);定位属性(例如,x位置坐标、y位置坐标和z位置坐标);纹理属性;反射率属性;或它们的组合。纹理属性量化深度图像的感知纹理,诸如深度图像的顶点区域中的颜色或强度的空间布置。
61.在一个示例中,交互式增强现实系统400(图4)包括眼戴设备100,其包括框架105、从框架105的左侧面170a延伸的左镜腿125a、以及从框架105的右侧面170b延伸的右镜腿125b。眼戴设备100还包括具有重叠的视场的至少两个可见光相机114a、114b。在一个示例中,眼戴设备100包括具有左视场111a的左可见光相机114a,如图3所示。左相机114a连接到框架105或左镜腿125a以从场景306的左侧捕获左原始图像302a。眼戴设备100还包括具有右视场111b的右可见光相机114b。右相机114b连接到框架105或右镜腿125b以从场景306的右侧捕获右原始图像302b。
62.图4是示例性交互式增强现实系统400的功能框图,该系统包括经由各种网络495(诸如因特网)连接的可穿戴设备(例如,眼戴设备100)、移动设备401和服务器系统498。交互式增强现实系统400包括眼戴设备100与移动设备401之间的低功率无线连接425和高速无线连接437。
63.如图4所示,如本文所述,眼戴设备100包括一个或多个可见光相机114a、114b,它们捕获静止图像、视频图像或静止图像和视频图像两者。相机114a、114b可具有对高速电路430的直接存储器访问(dma)并且用作立体相机。相机114a、114b可用于捕获初始深度图像,这些初始深度图像可被渲染成三维(3d)模型,这些三维模型是红绿蓝(rgb)成像场景的纹理映射图像。设备100还可包括深度传感器,其使用例如红外信号来估计对象相对于设备100的定位。在一些示例中,深度传感器包括一个或多个红外发射器415和红外相机410。
64.眼戴设备100还包括每一个光学组件180a、180b的两个图像显示器(一个与左侧面170a相关联,一个与右侧面170b相关联)。眼戴设备100还包括图像显示器驱动器442、图像处理器412、低功率电路420和高速电路430。每个光学组件180a、180b的图像显示器用于呈现图像,包括静止图像、视频图像、或静止和视频图像。图像显示器驱动器442耦接到每个光学组件180a、180b的图像显示器,以便控制图像的显示。
65.眼戴设备100还包括一个或多个扬声器440(例如,一个与眼戴设备的左侧相关联,另一个与眼戴设备的右侧相关联)。扬声器440可被包含在眼戴设备100的框架105、镜腿125或角部110中。一个或多个扬声器440由音频处理器443在低功率电路420、高速电路430或两者的控制下驱动。扬声器440用于呈现音频信号,包括例如节拍音轨。音频处理器443耦接到扬声器440以便控制声音的呈现。
66.图4所示的用于眼戴设备100的部件位于一个或多个电路板上,例如,位于边缘或
镜腿中的印刷电路板(pcb)或柔性印刷电路(fpc)。另选地或附加地,所描绘的部件可位于眼戴设备100的角部、框架、铰链或鼻梁架中。左和右可见光相机114a、114b可包括数字相机元件,诸如互补金属氧化物半导体(cmos)图像传感器、电荷耦合器件、镜头、或可用于捕获数据(包括具有未知对象的场景的静止图像或视频)的任何其他相应的可见或光捕获元件。
67.如图4所示,高速电路430包括高速处理器432、存储器434和高速无线电路436。在该示例中,图像显示驱动器442耦接到高速电路430并且由高速处理器432操作,以便驱动每个光学组件180a、180b的左和右图像显示器。高速处理器432可以是能够管理眼戴设备100所需的任何通用计算系统的高速通信和操作的任何处理器。高速处理器432包括使用高速无线电路436来管理到无线局域网(wlan)的高速无线连接437上的高速数据传输所需的处理资源。
68.在一些示例中,高速处理器432执行操作系统,诸如linux操作系统或眼戴设备100的其他此类操作系统,并且操作系统被存储在存储器434中以供执行。除了任何其他职责之外,执行眼戴设备100的软件架构的高速处理器432还用于管理利用高速无线电路436的数据传输。在一些示例中,高速无线电路436被配置为实现电气和电子工程师协会(ieee)802.11通信标准,本文中也称为wi-fi。在其他示例中,高速无线电路436可实施其他高速通信标准。
69.低功率电路420包括低功率处理器422和低功率无线电路424。眼戴设备100的低功率无线电路424和高速无线电路436可包括短距离收发器(bluetooth
tm
或蓝牙低功耗(ble))和无线广域网、局域网或广域网收发器(例如,蜂窝或wi-fi)。移动设备401,包括经由低功率无线连接425和高速无线连接437通信的收发器,可像网络495的其他元件一样,使用眼戴设备100的架构的细节来实施。
70.存储器434包括能够存储各种数据和应用的任何存储设备,所述数据包括由左和右可见光相机114a、114b、红外相机410、图像处理器412生成的相机数据、以及由图像显示驱动器442在每个光学组件180a、180b的图像显示器上生成用于显示的图像。虽然存储器434被示出为与高速电路430集成,但在其他示例中,存储器434可以是眼戴设备100的单独的独立元件。在某些此类示例中,电气布线线路可提供从芯片到存储器434的连接,所述芯片包括图像处理器412的高速处理器432或低功率处理器422。在其他示例中,高速处理器432可管理存储器434的寻址,使得低功率处理器422将在需要涉及存储器434的读或写操作的任何时间启动高速处理器432。
71.如图4所示,眼戴设备100的高速处理器432可耦接到相机系统(可见光相机114a、114b)、图像显示器驱动器442、用户输入设备491和存储器434。如图5所示,移动设备401的cpu 530可耦接到相机系统570、移动显示驱动器582、用户输入层591和存储器540a。高速处理器432可以与cpu 530双向通信以执行应用程序,诸如稍后将更详细地讨论的。
72.服务器系统498可以是作为服务或网络计算系统的一部分的一个或多个计算设备,例如包括处理器、存储器和网络通信接口以通过网络495与眼戴设备100和移动设备401通信。
73.眼戴设备100的输出部件包括视觉元件,诸如与每个镜头或如图2a和图2b所述光学组件180a、180b相关联的左和右图像显示器(例如,显示器,诸如液晶显示器(lcd)、等离子体显示面板(pdp)、发光二极管(led)显示器、投影仪或波导)。眼戴设备100可包括面向用
户的指示器(例如,led、扬声器或振动致动器),或面向外的信号(例如,led、扬声器)。每个光学组件180a、180b的图像显示器由图像显示驱动器442驱动。在一些示例性配置中,眼戴设备100的输出部件进一步包括额外的指示器,诸如可听元件(例如,扬声器)、触觉部件(例如,致动器,诸如用于生成触觉反馈的振动马达)和其他信号生成器。例如,设备100可包括一组面向用户的指示器和一组面向外的信号。一组面向用户的指示器被配置为由设备100的用户看到或以其他方式感知到。例如,设备100可包括被定位成使得用户可以看见它的led显示器、被定位成生成用户可以听到的声音的一个或多个扬声器、或者提供用户可以感觉到的触觉反馈的致动器。面向外的信号组被配置为由设备100附近的观察者看到或以其他方式感知到。类似地,设备100可包括被配置和定位成由观察者感知到的led、扬声器或致动器。
74.眼戴设备100的输入部件可包括字母数字输入部件(例如,被配置为接收字母数字输入的触摸屏或触摸板、摄影光学键盘或其他字母数字配置的元件)、基于指针的输入部件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向仪器)、触觉输入部件(例如,按钮开关、感测触摸或触摸手势的位置、力或位置和力的触摸屏或触摸板,或其他触觉配置的元件)和音频输入部件(例如,麦克风)等。移动设备401和服务器系统498可包括字母数字、基于指针、触觉、音频和其他输入部件。
75.在一些示例中,眼戴设备100包括一些被称为惯性测量单元472的运动感测部件。运动感测部件可以是具有微观移动部件的微机电系统(mems),这些微观移动部件通常足够小以成为微芯片的一部分。在一些示例性配置中,惯性测量单元(imu)472包括加速度计、陀螺仪和磁力计。加速度计可感测设备100相对于三个正交轴(x、y、z)的线性加速度(包括由于重力而引起的加速度)。陀螺仪可感测设备100绕三个旋转轴(俯仰、滚转、偏航)的角速度。加速度计和陀螺仪可一起提供关于设备相对于六个轴(x、y、z、俯仰、滚转、偏航)的定位、定向和运动数据。如果存在磁力计,则磁力计可感测设备100相对于磁北极的航向。设备100的定位可以由位置传感器诸如gps单元473、用于生成相对定位坐标的一个或多个收发器、高度传感器或气压计和其他定向传感器来确定。还可经由低功率无线电路424或高速无线电路436从移动设备401通过无线连接425和437接收此类定位系统坐标。
76.imu 472可包括数字运动处理器或程序,或者与数字运动处理器或程序协作,该数字运动处理器或程序从部件采集原始数据,并且计算关于设备100的定位、定向和运动的多个有用值。例如,从加速度计采集的加速度数据可被积分以获得相对于每个轴(x、y、z)的速度;并再次被积分以获得设备100的定位(以线性坐标x、y和z表示)。来自陀螺仪的角速度数据可被积分以获得设备100的定位(以球面坐标表示)。用于计算这些有效值的程序可存储在存储器434中并且由眼戴设备100的高速处理器432执行。
77.眼戴设备100可以可选地包括附加的外围传感器,诸如生物计量传感器、特性传感器,或者与眼戴设备100集成的显示元件。例如,外围设备元件可包括任何i/o部件,包括输出部件、运动部件、定位部件或本文所述的任何其他此类元件。例如,生物计量传感器可包括检测表情(例如,手势、面部表情、声音表达、身体姿势或眼睛追踪)、测量生物信号(例如,血压、心率、体温、出汗或脑电波)或识别人(例如,基于语音、视网膜、面部特征、指纹或电生物信号诸如脑电图数据的识别)等的部件。
78.移动设备401可以是智能电话、平板电脑、笔记本电脑、接入点或任何能使用低功
率无线连接425和高速无线连接437两者与眼戴设备100连接的其他此类设备。移动设备401连接到服务器系统498和网络495。网络495可包括有线和无线连接的任何组合。
79.如图4所示的交互式增强现实系统400包括通过网络耦接到眼戴设备100的计算设备,诸如移动设备401。交互式增强现实系统400包括用于存储指令的存储器和用于执行指令的处理器。由处理器432执行交互式增强现实系统400的指令将眼戴设备100配置为与移动设备401协作。交互式增强现实系统400可利用眼戴设备100的存储器434或移动设备401的存储器元件540a、540b、540c(图5)。此外,交互式增强现实系统400可利用眼戴设备100的处理器元件432、422或移动设备401的中央处理单元(cpu)530(图5)。此外,交互式增强现实系统400可进一步利用服务器系统498的存储器和处理器元件。在这一方面,交互式增强现实系统400的存储器和处理功能可以跨眼戴设备100、移动设备401和服务器系统498共享或分布。
80.存储器434另外包括由处理器432执行的定位检测程序460、标记配准程序462、定位程序464、虚拟对象渲染程序466、物理引擎468和预测引擎470。定位检测程序460将处理器432配置为例如使用定位程序464来确定在环境内的定位(位置和定向)。标记配准工具462将处理器432配置为在环境内配准标记。标记可以是在环境内具有已知位置的预定义物理标记,或者由处理器432指定到相对于眼戴设备100正在其中操作的环境或相对于眼戴器本身的特定位置。定位程序464将处理器432配置为获得定位数据,以用于确定眼戴设备100、由眼戴设备呈现的虚拟对象或它们的组合的定位。位置数据可以从一系列图像、imu单元472、gps单元473或它们的组合中导出。虚拟对象渲染程序466将处理器432配置为渲染用于由图像显示器180在图像显示器驱动器442和图像处理器412的控制下显示的虚拟图像。物理引擎468将处理器432配置为以将物理定律(诸如重力和摩擦)应用于例如虚拟游戏件之间的虚拟单词。预测引擎470将处理器432配置为基于对象(诸如眼戴设备100)的当前航向、来自传感器(诸如imu 472)的输入、环境的图像或它们组合来预测该对象的预期移动。
81.图5是示例性移动设备401的高级功能框图。移动设备401包括闪存存储器540a,其存储要由cpu 530执行以执行本文所述的所有功能或功能子集的程序。
82.移动设备401可包括相机570,其包括至少两个可见光相机(具有重叠的视场的第一和第二可见光相机)或具有基本上重叠的视场的至少一个可见光相机和深度传感器。闪存存储器540a还可包括经由相机570生成的多个图像或视频。
83.如图所示,移动设备401包括图像显示器580、控制图像显示器580的移动显示驱动器582和显示控制器584。在图5的示例中,图像显示器580是包括用户输入层591(例如,触摸屏)的触摸显示器,其层叠在由图像显示器580使用的屏幕之上或以其他方式集成到该屏幕中。
84.可使用的触摸屏式的移动设备的示例包括(但不限于)智能电话、个人数字助理(pda)、平板电脑、笔记本电脑或其他便携式设备。然而,触摸屏式的设备的结构和操作是以示例的方式提供的;如本文所述的主题技术并不旨在局限于此。出于该讨论的目的,图5因此提供了具有用户界面的示例性移动设备401的框图图示,该用户界面包括用于接收输入(通过手、触笔或其他工具的触摸、多点触摸或手势等)的触摸屏输入层591和用于显示内容的图像显示器580。
85.如图5所示,移动设备401包括用于经由广域无线移动通信网络进行数字无线通信
的至少一个数字收发器(xcvr)510,示为wwan xcvr。移动设备401还包括额外的数字或模拟收发器,诸如用于诸如经由nfc、vlc、dect、zigbee、bluetooth
tm
或wi-fi进行短距离网络通信的短距离收发器(xcvr)520。例如,短距离xcvr 520可采用任何可用的双向无线局域网(wlan)收发器的形式,该类型与无线局域网中实施的一个或多个标准通信协议(例如,符合ieee 802.11的wi-fi标准之一)兼容。
86.收发器510、520(即,网络通信接口)符合现代移动网络所利用的各种数字无线通信标准中的一个或多个标准。wwan收发器510的示例包括(但不限于)被配置为根据码分多址(cdma)和第3代合作伙伴计划(3gpp)网络技术操作的收发器,所述技术包括例如但不限于3gpp类型2(或3gpp2)和lte,有时被称为“4g”。例如,收发器510、520提供信息的双向无线通信,所述信息包括数字化音频信号、静止图像和视频信号、用于显示的网页信息以及web相关输入,以及去往/来自移动设备401的各种类型的移动消息通信。
87.移动设备401还包括用作中央处理单元(cpu)的微处理器;如图4中的cpu 530所示。处理器是一种电路,其元件被构造并布置成执行一个或多个处理功能(通常是各种数据处理功能)。尽管可使用离散的逻辑部件,但是这些示例利用形成可编程cpu的部件。微处理器例如包括一个或多个集成电路(ic)芯片,其结合了执行cpu的功能的电子元件。例如,cpu 530可基于任何已知或可用的微处理器架构,诸如使用arm架构的精简指令集计算(risc),正如现今在移动设备和其他便携式电子设备中通常使用的。当然,处理器电路的其他布置可用于形成智能电话、笔记本电脑和平板电脑中的cpu 530或处理器硬件。
88.通过将移动设备401配置为例如根据cpu 530可执行的指令或程序来执行各种操作,cpu 530用作移动设备401的可编程主机控制器。例如,此类操作可包括移动设备的各种一般操作,以及与用于移动设备上的应用的程序相关的操作。尽管处理器可使用硬连线逻辑来配置,但是移动设备中的典型处理器是通过执行程序来配置的通用处理电路。cpu 530与imu 572和gps 573通信以获得和使用相对或实际位置信息,诸如执行被配置为使用定位数据的应用。在示例中,移动设备401的cpu 530、imu 572和gps 573可以与眼戴器100一起使用以执行各种应用。
89.移动设备401包括用于存储程序和数据的存储器或存储系统。在示例中,存储器系统可根据需要包括闪存存储器540a、随机存取存储器(ram)540b和其他存储器部件540c。ram 540b用作由cpu 530处理的指令和数据的短期存储装置,例如,用作工作数据处理存储器。闪存存储器540a通常提供长期存储。
90.因此,在移动设备401的示例中,闪存存储器540a用于存储由cpu 530执行的程序或指令。根据设备的类型,移动设备401存储并运行移动操作系统,特定应用通过该移动操作系统执行。移动操作系统的示例包括google android、apple ios(用于iphone或ipad设备)、windows mobile、amazon fire os、rim blackberry os等。
91.眼戴设备100内的处理器432被配置为构建眼戴设备100周围的环境的地图,确定眼戴设备在映射的环境内的位置,并且确定眼戴设备相对于映射的环境中的一个或多个对象的相对定位。处理器432被配置为构建地图,并且使用应用于从一个或多个传感器接收的数据的即时定位与地图构建(slam)算法来确定位置和定位信息。在增强现实的背景下,slam算法用于构建并更新环境的地图,同时追踪并更新设备(或用户)在映射的环境中的位置。数学解可使用各种统计方法来近似,诸如粒子滤波、卡尔曼滤波、扩展卡尔曼滤波和协
方差交集。
92.slam算法还通过确定用户b身体的配准点1010来确定眼戴设备100b的所查看用户b的整个身体的物理属性,包括当用户b以三维方式移动和转弯时,如图10a和图10c中所示。这些物理属性可以是面部或头部,以及包括躯干和四肢的整个身体。所确定的配准点1010允许处理器432连续地识别和处理用户b的地点,并启用对用户b的图像处理,诸如在如通过显示器177a所看到的用户b上和该用户周围叠加三维(3d)图像(诸如服装)。
93.传感器数据包括从相机114a、114b中的一者或两者接收的图像、从激光测距仪(更一般地,光探测和测距(lidar))接收的距离、从gps 473和gps 573、imu 472和imu 572接收的定位信息、或两个或更多个此类传感器数据的组合,或来自提供用于确定定位信息的数据的其他传感器的数据。
94.图6描绘了示例性环境600以及对自然特征追踪(nft;例如,使用slam算法的追踪应用)有用的元素。眼戴设备100的用户602存在于示例性物理环境600(在图6中为内部房间)中。眼戴设备100的处理器432使用所捕获的图像来确定其相对于环境600内的一个或多个对象604的定位,使用环境600的坐标系(x,y,z)来构建环境600的地图,并且确定其在坐标系内的定位(图7)。另外,处理器432通过使用与单个对象604a相关联的两个或更多个位置点(例如,三个位置点606a、606b和606c)或者通过使用与两个或更多个对象604a、604b、604c相关联的一个或更多个位置点606来确定眼戴设备100在环境内的头部姿态(滚转、俯仰和偏航)。眼戴设备100的处理器432可定位环境600内的虚拟对象408(诸如图6中所示的钥匙),以经由图像显示器180进行增强现实观看。
95.如参考图8a、图8b和图8c所述,由用户a操作的第一眼戴设备100a和由用户b操作的第二眼戴设备100b都可以使用所述的slam算法来分别确定其在同一内部房间中的定位。第二眼戴器100b还使用环境600的同一坐标系(x,y,z)来构建环境600的地图,并且确定其在该同一坐标系中的定位。多个眼戴设备100能够在同一坐标系中确定它们的定位以便进行多人交互,并且不应推断出在环境600中限于两个眼戴设备100。每个眼戴设备100a和100b可以经由无线电路424(诸如和wifi)或经由无线电路436和网络495使用短距离通信技术通过消息传送来共享其(x,y,z)定位(图4)。
96.针对每个用户眼戴设备100的slam算法还确定用户b在室内房间中的物理属性,诸如面部或头部,以及包括躯干和四肢的整个身体,诸如图10a所示。处理器432被配置为在由相机114a和114b生成的该多个帧中识别物理属性。在示例中,处理器432可以使用图像处理器412来确定与用户b的身体部位相关联的物理属性。例如,slam算法使用面部检测软件来确定用户b的面部或嘴部。眼戴设备100还可以将面部图像存储在图像库诸如数据库中,以通过将检测到的面部图像与用于匹配的图像数据库进行比较来执行对另一用户的自动识别。slam算法还通过确定用户b的身体的配准点1010来确定用户b的整个身体的3d物理属性,即使当用户b以三维方式移动和转弯时。配准点1010指示用户b的属性,并且可以位于肩部、肘部、腕部、腰部、膝部和踝部以及其他身体部位处。配准点1010允许处理器432连续地确定用户b的身体部位,并在如通过显示器177a所看到的用户b上和该用户周围叠加3d图像1020,在本文中被称为叠层。叠层1020可以是一件或多件服装,并且具有相应配准点1030,诸如在肩部、颈线、肘部、腕部、膝部处,它们与用户b身体的相应配准点重叠。用户b的配准点1010与叠层配准点1030对齐,以使3d用户b看起来正穿着3d叠层,诸如服装或其他图像。
97.此外,用户的个人属性(图8a、图8b和图8c)可以使用用户属性共享应用480(图4)与另一用户共享,诸如情绪。在示例中,用户b可以与用户a共享其自身的个人属性。用户a的处理器432接收从用户b发送的个人属性,并且该个人属性可以在802处所示的用户a的显示器177上显示在用户b旁边,诸如在用户b的头部或嘴部附近的对话气泡100中,如图8c所示。
98.图7是描绘一种用于在可穿戴设备(例如,眼戴设备)上实施本文所述的增强现实应用的方法的流程图700。尽管如本文所述,参考眼戴设备100描述了这些步骤,但是本领域技术人员根据本文的描述将理解所描述的步骤针对其他类型的设备的其他具体实施。另外,可以设想,在图7中以及在其他附图中示出的并且在本文中描述的一个或多个步骤可省略、同时或依序执行、以不同于所示和所述的次序执行、或结合附加步骤执行。
99.在框702处,眼戴设备100捕获在眼戴设备100附近的物理环境600的一个或多个输入图像。处理器432可连续地从可见光相机114接收输入图像,并且将这些图像存储在存储器434中以供处理。另外,眼戴设备100可以从其他传感器捕获信息(例如,来自gps单元473的位置信息、来自imu 472的定向信息、或来自激光距离传感器的距离信息)。
100.在框704处,眼戴设备100将所捕获的图像中的对象与存储在图像库中的对象进行比较以识别匹配。在一些具体实施中,处理器432将所捕获的图像存储在存储器434中。已知对象的图像库存储在虚拟对象数据库484中。
101.在一个示例中,处理器432被编程为识别预定义的特定对象(例如,悬挂在墙壁上的已知位置处的特定照片604a、另一墙壁上的窗口604b、或定位在地板上的对象诸如保险箱604c)。其他传感器数据诸如gps数据可用于缩小在比较中使用的已知对象(例如,仅与通过gps坐标识别出的房间相关联的图像)的数量。在另一示例中,处理器432被编程为识别预定义的一般对象(诸如公园内的一棵或多棵树)。
102.在框706处,眼戴设备100确定其相对于对象的定位。处理器432可通过将所捕获的图像中的两个或更多个点之间(例如,一个对象604上的两个或更多个位置点之间或者两个对象604中的每个对象上的位置点606之间)的距离与所识别的对象中的对应点之间的已知距离进行比较和处理,来确定其相对于对象的定位。所捕获的图像的点之间的距离大于所识别的对象的点之间的距离的指示眼戴设备100比捕获包括所识别的对象的图像的成像器更靠近所识别的对象。另一方面,所捕获的图像的点之间的距离小于所识别的对象的点之间的距离的指示眼戴设备100比捕获包括所识别的对象的图像的成像器更远离所识别的对象。通过处理相对距离,处理器432能够确定相对于对象的定位。另选地或附加地,可使用其他传感器信息(诸如激光距离传感器信息)来确定相对于对象的定位。
103.在框708处,眼戴设备100构建围绕眼戴设备100的环境600的地图,并且确定其在环境内的位置。在一个示例中,在所识别的对象(框704)具有预定义坐标系(x,y,z)的情况下,眼戴设备100的处理器432使用该预定义坐标系来构建地图,并且基于相对于所识别的对象的所确定的定位(框706)来确定其在该坐标系内的定位。在另一示例中,眼戴设备使用环境内的永久或半永久对象604的图像(例如,公园内的树或公园长凳)来构建地图。根据该示例,眼戴设备100可限定用于环境的坐标系(x

,y

,z

)。
104.在框710处,眼戴设备100确定眼戴设备100在环境内的头部姿态(滚转、俯仰和偏航)。处理器432通过使用一个或多个对象604上的两个或更多个位置点(例如,三个位置点606a、606b和606c)或通过使用两个或更多个对象604上的一个或多个位置点606来确定头
部姿态。使用常规图像处理算法,处理器432通过比较在所捕获的图像与已知图像的位置点之间延伸的线的角度和长度来确定滚转、俯仰和偏航。
105.在框712处,眼戴设备100向用户呈现视觉图像。处理器432使用图像处理器412和图像显示器驱动器442在图像显示器180上向用户呈现图像。处理器响应于眼戴设备100在环境600内的位置而经由图像显示器显影并呈现视觉图像。
106.在框714处,随着用户在环境600中移动,重复以上参考框706-712所述的步骤,以更新眼戴设备100的定位以及用户602所观看的内容。
107.再次参考图6,在该示例中,实施本文所述的交互式增强现实应用的方法包括与环境600中的虚拟对象608相关联的虚拟标记610a。在ar系统中,标记被配准在环境中的位置处,以辅助设备完成追踪和更新用户、设备和对象(虚拟的和物理的)在映射的环境中的位置的任务。有时将标记与高对比度物理对象(诸如安装在较浅色的墙壁上的相对较暗的对象604a)配准,以帮助相机和其他传感器进行检测标记的任务。标记可以是预先指定的,或者可以由眼戴设备100在进入环境时指定。
108.标记可以用信息编码或以其他方式与信息链接。标记可能包括定位信息、物理代码(诸如条形码或qr码;对用户可见或隐藏)或它们的组合。与标记相关联的一组数据被存储在眼戴设备100的存储器434中。该组数据包括关于标记610a、标记的定位(位置和定向)、一个或多个虚拟对象或它们的组合的信息。标记定位可包括一个或多个标记界标616a的三维坐标,诸如图6所示的大致矩形的标记610a的角部。标记位置可以相对于真实世界地理坐标、标记坐标系、眼戴设备100的定位或其他坐标系来表示。一个或多个与标记610a相关联的虚拟对象可包括各种材料中的任何一种,包括静止图像、视频、音频、触觉反馈、可执行应用、交互式用户界面和体验、以及此类材料的组合或序列。在该上下文中,能够被存储在存储器中并且在遇到标记610a时被检索或与所指定的标记相关联的任何类型的内容都可以被分类为虚拟对象。例如,图6所示的钥匙608是在标记位置处显示为2d或3d静止图像的虚拟对象。
109.在一个示例中,标记610a可在存储器中配准为位于物理对象604a(例如,图6所示的装裱艺术品)附近并与其相关联。在另一示例中,标记可在存储器中配准为相对于眼戴设备100的特定定位。
110.参考图8a、图8b和图8c,示出了用户a的眼戴设备100a获得并与用户b的眼戴设备100b共享其在环境600(诸如室内房间)内的(x,y,z)坐标定位的示例,如参考图6所述。同样,用户b的眼戴设备100b获得并与用户a的眼戴设备100a共享其在环境600内的(x,y,z)坐标定位,诸如室内房间。在示例中,仅有一个眼戴设备100可以与另一眼戴设备100共享其(x,y,z)坐标定位以一起操作,诸如眼戴设备100b与眼戴设备100a共享其(x,y,z)坐标定位。
111.在一个示例中,当眼戴设备100a和100b处于会话中并相互通信时,诸如经由网络495或直接使用低功率信号诸如基于bluetooth
tm
,每个眼戴设备100的相应(x,y,z)坐标定位自动与其他眼戴设备共享。
112.在另一示例中,一个用户的眼戴设备100可以通过使用移动设备401与另一眼戴设备100共享其(x,y,z)坐标定位。例如,用户b的眼戴设备100b可以通过轻击用户b的同步移动设备401的触摸显示器580上的图标来与眼戴设备100a共享其(x,y,z)坐标定位,如图8a
所示。
113.如图8b和图8c所示,用户b可以选择性地向用户a广播该用户b的个人属性802。在一个示例中,个人属性可以是用户b的情绪。该广播的个人属性802可以是文本、bitmoji或其他个人属性的表达形式。眼戴设备100a在接收到广播的个人属性时,如通过光学组件180a和180b显示与用户b相关联的个人属性802,诸如在显示器177上显示的靠近用户b的一部分(诸如嘴部或头部)的对话气泡800中。如先前参考图6所述,眼戴设备的处理器432可以检测用户b的一部分,诸如头部,从而使得处理器432能够在头部附近生成属性图像,如图8c所示。
114.图9是描绘用于使用处理器432来实施本文所述的增强现实情绪检测应用480的方法的流程图900。尽管如本文所述,参考眼戴设备100和移动设备401描述了这些步骤,但针对其他类型的设备,本领域技术人员根据本文的描述将理解所描述的步骤的其他实施方式。另外,可以设想,在图9中以及在其他附图中示出的并且在本文中描述的一个或多个步骤可省略、同时或依序执行、以不同于所示和所述的次序执行、或结合附加步骤执行。
115.在框902处,眼戴器100a的处理器432检测环境600中的用户b。该检测可以由捕获多个帧的相机114a-b完成,其中处理器432被配置为在该多个帧中识别用户。slam算法可能被采用以检测用户b。
116.在框904处,用户a佩戴的眼戴设备100a的处理器432检测眼戴设备100a在环境600中的定位。眼戴设备100a的处理器432执行slam算法并确定定位,诸如(x,y,z)坐标定位。同样,用户b佩戴的眼戴设备100b的处理器432检测眼戴设备100b在环境600中的(x,y,z)坐标定位。由此,眼戴设备100a和眼戴设备100b能够各自建立对方在同一环境600中的定位。
117.在框906处,眼戴设备100b的处理器432使得用户b能够从眼戴器100b的触摸板以及从与眼戴器100b同步的移动设备401的触摸显示器580选择用户属性共享应用480。在示例中,用户b可以轻击在眼戴设备100b的显示器177上显示的图标,或者轻击在移动设备401的触摸显示器580上的图标。眼戴设备100a的处理器432还使得用户a能够从眼戴器100a的触摸板、以及从与眼戴器100a同步的移动设备401的触摸显示器580选择个人属性共享应用480。在一个示例中,用户b可以诸如从存储在存储器434中的个人属性列表,诸如bitmoji、化身、符号、文本和其他表达性媒体列表,生成用户b的个人属性802。
118.在框908处,当选择个人属性802时,眼戴设备100b的处理器432接着自动将个人属性802广播到眼戴设备100a。在一个示例中,个性属性802可表示用户b的情绪。在另一示例中,个人属性802可以是用户的状况,诸如生病或受伤。处理器432还可以为用户b提供在自动发送之前确认选择的选项。
119.在框910处,眼戴器100a从眼戴设备100b接收广播的个人属性,并且响应地在显示器177上在用户b的一部分附近显示用户b个人属性802。在示例中,个人属性802被显示在用户b的头部或嘴部附近。个人属性802可以被显示在对话气泡800中,这是可选的。
120.参考图10a、图10b和图10c,示出了用户a的眼戴设备100a使用slam算法获得3d用户b的身体3d配准点1010的示例。处理器432被配置为在由相机114a和114b实时生成的该多个帧中连续地识别配准点1010。在示例中,处理器432可以使用图像处理器412。例如,slam算法使用面部识别软件来确定用户b的面部或嘴部。slam算法还通过确定用户b的身体的配准点1010来确定用户b的整个身体的物理属性,即使当用户b以三维方式移动和转弯时。
121.如图10b和图10c所示,3d配准点1010允许处理器432在移动期间连续地确定用户b的身体部位,并在如通过显示器177a所看到的3d用户b上和该用户周围叠加3d图像1020。3d图像1020可以是存储在存储器434中的服装,并且具有与用户b身体的相应配准点重叠的相应配准点1030,诸如在与用户b的身体的相应配准点重叠的肩部、颈线、肘部、腕部、膝部等处,如图10b和图10c所示。这些图像能够基于共同的属性在存储器434中被分类。处理器432通过实时连续地将图像1020的配准点1030与用户b的配准点1010对准,在显示器177a上在用户b上或该用户周围叠加所选择的图像1020(图11)。通过对齐这些配准点1010和1030,该服装适应于不同的体型和身高。该服装的着色能够基于该环境诸如照明而改变,或者与当前取景器中的颜色形成对比。
122.图11示出了用户设备401在显示器580上显示可由用户a选择的3d图像1020的目录。在该示例中,图像1020为多件服装。用户a例如通过轻击标识期望服装的图标来选择服装。可以存储和选择其他图像以覆盖在用户b上,诸如面具、套装和动画。用户可以选择要覆盖在用户b的整个身体上的单个图像1020,并且还可以选择要覆盖在用户b上的多个图像。例如,可以选择将上衣覆盖在用户b的躯干上,并且可以选择将裤子或裙子覆盖在用户b的腿部或下半身上。用户a具有根据需要混合和搭配叠层的灵活性。用户a还可以选择由用户a从零开始生成并存储在存储器434中的叠层。
123.图12是描绘处理器432执行slam算法以及使用处理器432实施本文描述的增强现实3d服装叠层的方法的流程图1200。尽管如本文所述,参考眼戴设备100和移动设备401描述了这些步骤,但是本领域技术人员根据本文的描述将理解所描述的步骤针对其他类型的设备的其他具体实施。另外,可以设想,在图12中以及在其他附图中示出的并且在本文中描述的一个或多个步骤可省略、同时或依序执行、以不同于所示和所述的次序执行、或结合附加步骤执行。
124.在步骤1202处,处理器432控制眼戴设备100a使用左可见光相机114a和右可见光相机114b捕获图像,以分别生成左原始图像302a和右原始图像302b,从而生成包括如先前参考图3所讨论的用户b的三维场景306。场景306包括如先前所讨论的环境600。处理器432也可以使用图像处理器412来捕获和处理图像。
125.在框1204处,眼戴设备100a的处理器432连续地检测环境600中的用户b。这种检测可以通过相机114a-b捕获多个图像帧来完成,其中处理器432通过执行slam算法来执行3d图像处理,以在该多个帧中识别用户b。处理器432也可以使用图像处理器412来处理和检测用户b。
126.在框1206处,眼戴设备100a的处理器432检测用户b在环境600中的定位。眼戴设备100a的处理器432执行slam算法并确定用户b定位,诸如(x,y,z)坐标定位,如先前参考图6所述。处理器432还检测用户b的身体部位,诸如头部、嘴部、躯干和四肢。处理器432还可以使用图像处理器412来执行该检测。处理器432将配准点1010分配给用户b的3d图像,如图10a所示。这些配准点1010被处理器432用于与选择的3d叠层图像1020的配准点1030对齐。
127.在框1208处,眼戴设备100a的处理器432使得用户a能够选择3d叠层图像1020,诸如从移动设备401的触摸显示器580同步到眼戴器100a,如图11所示。在另一示例中,用户a可以使用眼戴设备100a的触摸板181来选择叠层图像1020,诸如从下拉菜单中。可用的叠层图像1020存储在存储器434中。在示例中,叠层图像1020是服装,这些服装从叠层图像1020
的目录中选择,如图11所示。
128.在框1210处,处理器432在显示器177a上将选择的叠层图像1020叠加在用户b的图像上方。处理器432通过将用户b的配准点1010与所选择的图像1020的配准点1030对齐来叠加选择的图像1020,如图10b和图10c所示。处理器432连续地捕获用户b的配准点1010,即使当用户b以3d方式移动时,并且在如图10c所示的移动期间将用户b上的所选择的图像1020对齐,从而以3d方式显示穿着3d服装的用户b。
129.在另一示例中,slam算法和图4中公开的硬件和软件可以位于用户设备401中,使得用户设备401的用户可以在使用前置相机自拍时查看叠加在通过设备相机查看并显示在用户设备显示器580上的用户b上的所选择的图像,以及设备401的用户。
130.除了上文刚刚陈述的,无论是否在权利要求书中陈述,已陈述或说明的内容都不旨在或不应解释为导致任何部件、步骤、特征、对象、益处、优点或等效物献给公众。
131.应当理解,除非本文另外阐述了特定的含义,否则本文所用的术语和表达具有与关于它们对应的相应调查和研究领域的此类术语和表达一致的通常含义。诸如“第一”和“第二”等的关系术语仅可用于将一个实体或动作与另一个实体或动作区分开,而不一定要求或暗示这些实体或动作之间的任何实际的此类关系或顺序。术语“包括”、“包含”、“含有”、“具有”或其任何其他变型形式旨在涵盖非排他性的包括,使得包括或包含一系列元素或步骤的过程、方法、制品或装置不仅包括那些元素或步骤,而是还可以包括未明确列出的或对于此类过程、方法、制品或装置固有的其他元素或步骤。在没有进一步限制的情况下,前缀为“一”或“一个”的元素并不排除在包括该元素的过程、方法、制品或装置中另外的相同元素的存在。
132.除非另有说明,否则本说明书中,包括所附权利要求书中阐述的任何和所有测量、值、额定值、定位、量值、尺寸和其他规格是近似的,而不是精确的。此类量旨在具有与它们涉及的功能和它们所属的领域中的惯例一致的合理范围。例如,除非另外明确说明,否则参数值等可以从所述量或范围变化多达正负百分之十。
133.此外,在前述具体实施方式中可看出,出于使本公开简化的目的,各种特征在各种示例中被组合在一起。公开的本方法不应被解释为反映所要求保护的示例需要比每个权利要求中明确记载的特征更多的特征的意图。相反,如以下权利要求所反映的,要求保护的本主题在于少于任何单个公开的示例的所有特征。因此,将以下权利要求据此并入到具体实施方式中,其中每个权利要求作为独立要求保护的主题而独立存在。
134.虽然前文已描述了被认为是最佳模式的示例和其他示例,但应当理解,可在其中作出各种修改且本文所公开的主题可以各种形式和示例来实施,并且其可应用于许多应用中,本文仅描述了其中的一些应用。所附权利要求书旨在要求保护落入本发明构思的真实范围内的任何和所有修改和变型。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献