一种景区电子导览方法及装置、电子设备、存储介质与流程

2022-04-16 16:25:27 来源：中国专利 TAG：

1.本技术涉及电子信息技术领域，尤其涉及一种景区电子导览方法及装置、电子设备、存储介质。

背景技术：

2.随着我国智慧旅游的建设和发展，依托云计算、物联网等新兴技术催生的智慧景区导览方案深受大众喜爱。目前，我国许多旅游景点不允许导游员大声讲解，而采用数字电子导览设备，克服了传统导览方案的局限性，完成了诸如实时定位，提供信息，正确导向，景点识别，行为管制等重要功能。
3.在实现本发明的过程中，发明人发现现有技术中至少存在如下问题：
4.主流的电子导览方案基于gps和rfid技术，在人流量大的景区中易产生信号串扰，并且电子设备的租借归还也较为麻烦。此外，传统的基于手机移动终端的导览方案，一般在景区景点附近环境中添加二维码等定位图标，用户通过手机扫描二维码获取导览信息，本质上利用了手机等移动设备的便捷性，并没有进行定位。在实际使用过程中会出现游客遗漏定位二维码，从而错过讲解的问题，另一方面，频繁的找码扫码，在人流量较大的景区操作复杂，实际体验较差。

技术实现要素：

5.为了解决上述现有技术中存在的问题，本技术实施例的目的是提供一种景区电子导览方法及装置、电子设备、存储介质。
6.根据本技术实施例的第一方面，提供一种景区电子导览方法，其特征在于，应用于云端服务器，包括：
7.获取移动终端通过无线传输的压缩后的查询图像，所述压缩后的查询图像由所述移动终端接收处理器通过蓝牙传输的查询图像并对所述查询图像进行压缩得到，所述查询图像由所述处理器获取全景环带相机采集的全景图像并对所述全景图像进行处理得到；
8.将所述压缩后的查询图像输入训练好的视觉定位模型中，得到数据库中与所述查询图像相似度最高的图像；
9.将所述图像对应的语音导览信息发送至移动终端以使得音频输出模块接收移动终端发送的所述语音导览信息并进行播放，从而进行景区电子导览。
10.进一步地，所述视觉定位模型包括：
11.用于接收压缩后的查询图像并对所述压缩后的查询图像进行编码，得到浅层次特征图的第一主干网络；
12.用于对所述浅层次特征图进行编码，得到包含局部特征的深层次特征图的第二主干网络，所述第二主干网络的输入端与所述第一主干网络的输出端相连接；
13.用于根据所述浅层次特征图，得到第一局部描述子和第一关键点分数的解码器，所述解码器的输入端设置在所述第一主干网络的输出端和所述第二主干网络的输入端之
间；及
14.用于根据所述深层次特征图，得到第一全局描述子的聚合器，所述聚合器的输入端与所述第二主干网络的输出端相连接。
15.进一步地，所述视觉定位模型还包括：
16.用于根据所述压缩后的编码图像生成第二局部描述子和第二关键点分数以对所述局部描述子和关键点分数进行调优的局部教师模型，所述局部教师模型设置在所述第一主干网络的输入端和所述解码器的输出端之间；及
17.用于根据所述压缩后的编码图像生成第二全局描述子以对所述第一全局描述子进行调优的全局教师模型，所述全局教师模型设置在所述第一主干网络的输入端和所述聚合器的输出端之间。
18.进一步地，所述视觉定位模型的训练过程包括：
19.获取待训练图像集并对所述待训练图像集进行预处理；
20.将所述待训练图像集中的一张待训练图像输入所述第一主干网络中，得到由所述解码器输出的第一关键点分数、第一局部描述子和由所述聚合器输出的第一全局描述子；
21.将所述待训练图像输入局部教师模型中，得到第二关键点分数和第二局部描述子；
22.将所述待训练图像输入全局教师模型中，得到第二全局描述子；
23.根据所述第二关键点、第二局部描述子和第二全局描述子，分别对所述第一关键点、第一局部描述子和第一全局描述子求损失函数；
24.对所述第一关键点、第一局部描述子和第一全局描述子的损失函数进行加权求和，得到总损失函数；
25.根据所述总损失函数，更新所述第一主干网络、第二主干网络、解码器和聚合器的参数；
26.对其余待训练图像依次执行从将所述待训练图像集中的一张待训练图像输入所述视觉定位模型中，得到第一关键点、第一局部描述子和第一全局描述子到根据所述总损失函数，更新所述第一主干网络、第二主干网络、解码器和聚合器的参数的步骤，直至所述总损失函数收敛。
27.进一步地，将所述压缩后的查询图像输入训练好的视觉定位模型中，得到所述查询图像对应的语音导览信息，包括：
28.将所述压缩后的查询图像输入训练好的视觉定位模型中，得到全局描述子和局部描述子；
29.将所述全局描述子与数据库中所有图像的描述子进行暴力匹配，得到第一相似度；
30.选取第一相似度最高的若干图像；
31.计算所述查询图像与所述若干图像中每一张图像的匹配特征点间的基础矩阵；
32.计算所述基础矩阵中的内点数量，将所述内点数量作为第二相似度；
33.将最高的所述第二相似度对应的图像作为与所述查询图像最相似的图像；
34.将所述图像的语音导览信息作为所述查询图像对应的语音导览信息。
35.根据本技术实施例的第二方面，提供一种景区电子导览装置，包括：
36.获取模块，用于获取移动终端通过无线传输的压缩后的查询图像，所述压缩后的查询图像由所述移动终端接收处理器通过蓝牙传输的查询图像并对所述查询图像进行压缩得到，所述查询图像由所述处理器获取全景环带相机采集的全景图像并对所述全景图像进行处理得到；
37.输入模块，用于将所述压缩后的查询图像输入训练好的视觉定位模型中，得到数据库中与所述查询图像相似度最高的图像；
38.发送模块，用于将所述图像对应的语音导览信息发送至移动终端以使得音频输出模块接收移动终端发送的所述语音导览信息并进行播放，从而进行景区电子导览。
39.进一步地，所述视觉定位模型包括：
40.用于接收压缩后的查询图像并对所述压缩后的查询图像进行编码，得到浅层次特征图的第一主干网络；
41.用于对所述浅层次特征图进行编码，得到包含局部特征的深层次特征图的第二主干网络，所述第二主干网络的输入端与所述第一主干网络的输出端相连接；
42.用于根据所述浅层次特征图，得到第一局部描述子和第一关键点分数的解码器，所述解码器的输入端设置在所述第一主干网络的输出端和所述第二主干网络的输入端之间；及
43.用于根据所述深层次特征图，得到第一全局描述子的聚合器，所述聚合器的输入端与所述第二主干网络的输出端相连接。
44.根据本技术实施例的第三方面，提供一种景区电子导览系统，其特征在于，包括：
45.采集处理模块，包括全景环带相机和处理器，所述全景环带相机用于采集全景图像，所述处理器用于获取所述全景图像并对所述全景图像进行处理，得到查询图像；
46.中转显示模块，所述中转显示模块包括移动终端，所述移动终端用于接收所述处理器通过蓝牙传输的查询图像并对所述查询图像进行压缩；
47.存储计算模块，所述存储计算模块包括云端服务器，所述云端服务器上存储有景区各景点的图像和对应的语音导览信息的数据库和训练好的视觉定位模型，用于将所述移动终端通过无线传输的压缩后的查询图像输入所述训练好的视觉定位模型，得到所述图像数据库中与所述查询图像相似度最高的图像并将所述图像对应的语音导览信息发送至移动终端；
48.音频输出模块，所述音频输出模块用于接收移动终端发送的所述语音导览信息并进行播放。
49.根据本技术实施例的第四方面，提供一种电子设备，其特征在于，包括：
50.一个或多个处理器；
51.存储器，用于存储一个或多个程序；
52.当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如第一方面所述的方法。
53.根据本技术实施例的第五方面，提供一种计算机可读存储介质，其上存储有计算机指令，其特征在于，该指令被处理器执行时实现如第一方面中任一项所述方法的步骤。
54.本技术的实施例提供的技术方案可以包括以下有益效果：
55.由上述实施例可知，本技术的查询图像由对全景环带相机采集的全景图像进行处
理得到，全景环带相机，视场覆盖范围广，可以为后端视觉定位算法获取更加丰富的视场信息，有利于提升定位精度，另一方面全景相机规避了传统窄视场相机拍摄盲区和视角差异导致的定位不准确的问题；由于多数功能和数据都存储在云端服务器中，对移动终端的硬件性能要求不高；涉及的视觉定位模型经过大量数据训练，在实际应用场景中具有较高的定位准确度和实时性，在限定全景相机的主视方向后，可以在室内密集展品陈列区准确选择用户朝向的展品，进行定向讲解，有效解决了传统导览方案中播报信息错位的问题；鲁棒性好。本技术采用的视觉定位模型，可以高效全面的提取不同环境下的图像特征，解决了同一位置不同光照、不同季节下获取的图像特征差异对定位精度的影响。
56.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术。
附图说明
57.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。
58.图1是根据一示例性实施例示出的一种景区电子导览方法的流程图。
59.图2是根据一示例性实施例示出的步骤s12的流程图。
60.图3是根据一示例性实施例示出的一种视觉定位模型的示意图。
61.图4是根据一示例性实施例示出的视觉定位模型的训练过程的流程图。
62.图5是根据一示例性实施例示出的一种景区电子导览装置的框图。
具体实施方式
63.这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
64.在本技术使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本技术。在本技术和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
65.应当理解，尽管在本技术可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本技术范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
66.图1是根据一示例性实施例示出的一种景区电子导览方法的流程图，如图1所示，该方法应用于云端服务器中，可以包括以下步骤：
67.步骤s11：获取移动终端通过无线传输的压缩后的查询图像，所述压缩后的查询图像由所述移动终端接收处理器通过蓝牙传输的查询图像并对所述查询图像进行压缩得到，所述查询图像由所述处理器获取全景环带相机采集的全景图像并对所述全景图像进行处
理得到；
68.步骤s12：将所述压缩后的查询图像输入训练好的视觉定位模型中，得到数据库中与所述查询图像相似度最高的图像；
69.步骤s13：将所述图像对应的语音导览信息发送至移动终端以使得音频输出模块接收移动终端发送的所述语音导览信息并进行播放，从而进行景区电子导览。
70.由上述实施例可知，本技术的查询图像由对全景环带相机采集的全景图像进行处理得到，全景环带相机，视场覆盖范围广，可以为后端视觉定位算法获取更加丰富的视场信息，有利于提升定位精度，另一方面全景相机规避了传统窄视场相机拍摄盲区和视角差异导致的定位不准确的问题；由于多数功能和数据都存储在云端服务器中，对移动终端的硬件性能要求不高；涉及的视觉定位模型经过大量数据训练，在实际应用场景中具有较高的定位准确度和实时性，在限定全景相机的主视方向后，可以在室内密集展品陈列区准确选择用户朝向的展品，进行定向讲解，有效解决了传统导览方案中播报信息错位的问题；鲁棒性好。本技术采用的视觉定位模型，可以高效全面的提取不同环境下的图像特征，解决了同一位置不同光照、不同季节下获取的图像特征差异对定位精度的影响。
71.在步骤s11的具体实施中，获取移动终端通过无线传输的压缩后的查询图像，所述压缩后的查询图像由所述移动终端接收处理器通过蓝牙传输的查询图像并对所述查询图像进行压缩得到，所述查询图像由所述处理器获取全景环带相机采集的全景图像并对所述全景图像进行处理得到；
72.具体地，所述处理器对所述全景图像进行处理的过程包括：
73.全景环带相机拍摄的图片进行去畸变处理，具体是将原始图像投影到单位球面上，并对其进行等距圆柱投影展开，得到上下等宽的矩形图像，这样将直接获取的较为抽象的图像转换为常规图像形式，便于用户理解和后端显示。
74.具体地，移动终端接收处理器通过蓝牙传输的查询图像并对所述查询图像进行压缩的过程包括：
75.在处理器的中断向量表中添加usb发送中断，调用函数正确使能ctr传输中断；将相机后端传感器传输出来的图像数据从pam双缓冲区中读取出来，放置在蓝牙模块的发送缓冲区中；将处理器上的蓝牙模块和移动终端中的蓝牙模块配对，数据传输采用串口通信的方式，使用中断并初始化nvic，编写中断函数，实现数据的传输和读取；移动终端中设置有相应的app，app将接收的全景图像放入缓存目录中，前台在app界面端显示，后台将图片适当压缩，以base64格式转换为字符串。
76.具体地，获取移动终端通过无线传输的压缩后的查询图像的过程包括：移动终端调用webservice接口，借助4g网络流量数据，将图像编码的字符串上传到云端服务器中。
77.在步骤s12的具体实施中，将所述压缩后的查询图像输入训练好的视觉定位模型中，得到数据库中与所述查询图像相似度最高的图像；
78.具体地，如图2所示，此步骤包括以下子步骤：
79.步骤s21：将所述压缩后的查询图像输入训练好的视觉定位模型中，得到全局描述子和局部描述子；
80.具体地，所述视觉定位模型包括：用于接收压缩后的查询图像并对所述压缩后的查询图像进行编码，得到浅层次特征图的第一主干网络、用于对所述浅层次特征图进行编
码，得到包含局部特征的深层次特征图的第二主干网络、用于根据所述浅层次特征图，得到第一局部描述子和第一关键点分数的解码器、及用于根据所述深层次特征图；所述第二主干网络的输入端与所述第一主干网络的输出端相连接；所述解码器的输入端设置在所述第一主干网络的输出端和所述第二主干网络的输入端之间；得到第一全局描述子的聚合器，所述聚合器的输入端与所述第二主干网络的输出端相连接。
81.所述视觉定位模型通过将解码器的输入端设置在第一主干网络的输出端和第二主干网络的输入端之间，将聚合器的输入端与第二主干网络的输出端相连接，实现了查询图像的局部描述子和关键点分数与查询图像的全局描述子的并行获取，提高了视觉定位的效率，从而实现了在景区电子导览中的高实时性；同时，该视觉定位模型可以高效全面的提取不同环境下的图像特征，且不受同一位置不同光照、不同季节下获取的图像特征差异对定位精度的影响。
82.在一实施例中，如图3所示，所述第一主干网络和第二主干网络均采用mobilenet，聚合器采用netvlad，解码器采用superpoint。mobilenet作为轻量级特征提取器，在保证模型参数量较少的同时兼顾较高的特征提取性能；聚合器使用netvlad，采用一种端到端的方式，引入弱监督标签进行聚类，以提升图像检索精度；解码器采用superpoint，可以同时得到局部特征描述子和关键点分数。
83.优选地，所述视觉定位模型还包括：
84.用于根据所述压缩后的编码图像生成第二局部描述子和第二关键点分数以对所述局部描述子和关键点分数进行调优的局部教师模型及用于根据所述压缩后的编码图像生成第二全局描述子以对所述第一全局描述子进行调优的全局教师模型，所述局部教师模型设置在所述第一主干网络的输入端和所述解码器的输出端之间；所述全局教师模型设置在所述第一主干网络的输入端和所述聚合器的输出端之间。
85.需要说明的是，所述全局教师模型和局部教师模型仅用于模型训练阶段。为了获取质量高的局部描述子使用的数据增强操作，通常会在一定程度上破坏输入图像的连续性，导致全局描述子质量变差。为了解决这个问题，在网络训练阶段，借鉴多任务学习的思路，在输入和输出端引入预训练好的、有较好参数的教师模型，使得网络输出可以像学生一样，学会教师模型中一些好的参数，起到一定程度自监督的作用。
86.需要说明的是，服务器上部署的模型是已经训练好的，训练集来自带有真值标注和开源大型数据集，景区中拍摄的数据库图像作为测试集使用。
87.具体地，如图4所示，所述视觉定位模型的训练过程包括：
88.步骤s31：获取待训练图像集并对所述待训练图像集进行预处理；
89.具体地，将所有待训练图像裁剪至相同尺寸，在具体实施中，该尺寸为全景图像展开图的尺寸，和相机分辨率有关，本发明中使用的原始图片尺寸为2048*300，优选地，将该尺寸设置为1024*150，这样做是为了减少输入信息量，提升模型训练速度，这样做并不会降低模型精度，并转换为灰度图，并添加高斯噪声，随机方向动态模糊、随机亮度对比度变化等数据增强操作，在训练集中添加图像干扰模拟测试集中的数据波动有助于提升神经网络的鲁棒性。
90.步骤s32：将所述待训练图像集中的一张待训练图像输入所述第一主干网络中，得到由所述解码器输出的第一关键点分数、第一局部描述子和由所述聚合器输出的第一全局
描述子；
91.具体地，将所述训练图像输入到第一主干网络进行图像低级特征的提取，并将图像信息进行编码，得到浅层次特征图；所述浅层次特征图通过一条支路进入所述解码器中，解码信息输出原图像尺寸的第一关键点分数和第一局部描述子；另一条支路进入第二主干网络进一步编码，得到深层次特征图，所述深层次特征图输入聚合器中，聚合器输出全局描述子；这种并行输出关键点分数、局部特征描述子和全局特征描述子的架构，可以缩短模型推断时间，提升应用实时性。
92.步骤s33：将所述待训练图像输入局部教师模型中，得到第二关键点分数和第二局部描述子；
93.具体地，局部教师模型加载在大型公开数据集上预训练好的模型参数，具体的使用superpoint模型作为局部教师模型，图像输入到局部教师模型中得到局部特征描述子和关键点分数作为伪真值，对视觉定位模型中输出的局部特征描述子和关键点分数进行监督。
94.步骤s34：将所述待训练图像输入全局教师模型中，得到第二全局描述子；
95.具体地，全局教师模型加载在大型公开数据集上预训练好的模型参数，具体的使用netvlad模型作为全局教师模型，图像输入到全局教师模型中得到全局描述子作为伪真值，对视觉定位模型中输出的全局描述子进行监督。
96.上述两步使用教师模型对视觉定位模型进行知识蒸馏，使得模型视觉定位可以从教师模型已具有的良好参数中，学习到针对本发明视觉定位网络架构有利的特性。
97.步骤s35：根据所述第二关键点、第二局部描述子和第二全局描述子，分别对所述第一关键点、第一局部描述子和第一全局描述子求损失函数；
98.步骤s36：对所述第一关键点、第一局部描述子和第一全局描述子的损失函数进行加权求和，得到总损失函数；
99.具体的，所述各子损失函数如下：
100.第一关键点的损失函数：
101.第一局部描述子的损失函数：
102.第一全局描述子的损失函数：
103.具体地，所述总损失函数l如下式：
[0104][0105]
其中dg为第一全局描述子，d
l
是第一局部描述子，p是第一关键点分数，其中s下标表示学生网络模型，t下标表示教师网络模型w
1，2，3
是优化的变量，是要自动学习的权重。
[0106]
上述损失函数采用多任务学习的方法，三项输出间的权重也是通过网络学习出来的，无需人工手动调节，可以在减小人工操作的同时，提升模型精度。
[0107]
步骤s37：根据所述总损失函数，更新所述第一主干网络、第二主干网络、解码器和聚合器的参数；
[0108]
步骤s38：对其余待训练图像依次执行从将所述待训练图像集中的一张待训练图
像输入所述视觉定位模型中，得到第一关键点、第一局部描述子和第一全局描述子到根据所述总损失函数，更新所述第一主干网络、第二主干网络、解码器和聚合器的参数，直至所述总损失函数收敛。
[0109]
步骤s22：将所述全局描述子与数据库中所有图像的描述子进行暴力匹配，得到第一相似度；
[0110]
具体地，将欧几里得距离作为第一相似度，所述欧几里得距离d的表达式为：
[0111][0112]
其中，全局描述子以n维向量的形式表示，x＝[x1，x2，...，xn]表示查询图像全局描述子，y＝[y1，y2，...，yn]表示数据库图像全局描述子。
[0113]
步骤s23：选取第一相似度最高的若干图像；
[0114]
具体地，选取的图像数量不作限制，在一实施例中，按照第一相似度降序排列，选取10张第一相似度最高的若干图像。
[0115]
步骤s24：计算所述查询图像与所述若干图像中每一张图像的匹配特征点间的基础矩阵；
[0116]
具体地，基础矩阵是两张图片中，每对匹配特征点求解出一个基础矩阵，每对图片中有大量的匹配特征点；
[0117]
步骤s25：计算所述基础矩阵中的内点数量，将所述内点数量作为第二相似度；
[0118]
具体地，结合ransac算法剔除异常值，计算基础矩阵中内点数量，内点数量越多表示两张图片的局部描述子之间相似度越高。
[0119]
步骤s26：将最高的所述第二相似度对应的图像作为与所述查询图像最相似的图像；
[0120]
步骤s27：将所述图像的语音导览信息作为所述查询图像对应的语音导览信息；
[0121]
在步骤s13的具体实施中，将所述图像对应的语音导览信息发送至移动终端以使得音频输出模块接收移动终端发送的所述语音导览信息并进行播放，从而进行景区电子导览；
[0122]
与前述的景区电子导览方法的实施例相对应，本技术还提供了景区电子导览装置的实施例。
[0123]
图5是根据一示例性实施例示出的一种景区电子导览装置框图。参照图5，该装置应用于云端服务器，可以包括：
[0124]
获取模块21，用于获取移动终端通过无线传输的压缩后的查询图像，所述压缩后的查询图像由所述移动终端接收处理器通过蓝牙传输的查询图像并对所述查询图像进行压缩得到，所述查询图像由所述处理器获取全景环带相机采集的全景图像并对所述全景图像进行处理得到；
[0125]
输入模块22，用于将所述压缩后的查询图像输入训练好的视觉定位模型中，得到数据库中与所述查询图像相似度最高的图像；
[0126]
发送模块23，用于将所述图像对应的语音导览信息发送至移动终端以使得音频输出模块接收移动终端发送的所述语音导览信息并进行播放，从而进行景区电子导览。
[0127]
关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法
的实施例中进行了详细描述，此处将不做详细阐述说明。
[0128]
对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本技术方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
[0129]
相应的，本技术还提供一种景区电子导览系统，包括：
[0130]
采集处理模块，包括全景环带相机和处理器，所述全景环带相机用于采集全景图像，所述处理器用于获取所述全景图像并对所述全景图像进行处理，得到查询图像；
[0131]
具体地，全景环带相机，由全景环带头部单元以及中继透镜组两部分组成，通过对入射光的两次反射和两次折射，将周围360
°
空间的景物投射形成环形虚像，经中继透镜组成像在图像传感器上。因此，全景环带具有单次大视场成像的特点，可以获取更加丰富的图像信息，同时相较与其他全景相机，其在边缘视场上的径向畸变更小。
[0132]
在具体实施中，所述全景环带相机可设置于整个系统的上方，近似位于使用者正确佩戴时头部正上，优选地，出于便携式的考虑，全景环带相机尽量选取体积小，分辨率高的可拆卸式镜头；所述处理器需要具备全景图像接收、编码、传递和解码等功能，同时包含蓝牙模块实现与手机间的通信，以传出编码图像信息和接收手机中转的语音信息，所述处理器可以为stm32开发板，树莓派，英伟达nx等，本发明中使用stm32开发板，该硬件在满足装置功能要求的前提下，体积小价格低。
[0133]
中转显示模块，所述中转显示模块包括移动终端，所述移动终端用于接收所述处理器通过蓝牙传输的查询图像并对所述查询图像进行压缩；
[0134]
具体地，所述移动终端包括手机和平板电脑，可调用本地算力对图像进行简单压缩预处理，以及和云端服务器的自动通信和高速接收服务器回传的语音信息，具有基本的语音播放暂停，选择性播放上一段和下一段的功能。
[0135]
存储计算模块，所述存储计算模块包括云端服务器，所述云端服务器上存储有景区各景点的图像和对应的语音导览信息的数据库和训练好的视觉定位模型，用于将所述移动终端通过无线传输的压缩后的查询图像输入所述训练好的视觉定位模型，得到所述图像数据库中与所述查询图像相似度最高的图像并将所述图像对应的语音导览信息发送至移动终端；
[0136]
音频输出模块，所述音频输出模块用于接收移动终端发送的所述语音导览信息并进行播放。
[0137]
具体地，所述音频输出模块可以为所述移动终端自带的扩音器或与所述移动终端相连接的耳机，优选地，本技术中使用无线蓝牙耳机，以提升使用者的沉浸式体验，同时避免了使用者外放语音导览信息时对他人产生的干扰和有线耳机对使用者行动的束缚；更优选地，使用者可使用自己的耳机，以避免多人交叉使用产生的卫生问题。
[0138]
需要说明的是，该系统流程的具体实施已在上述的景区电子导览方法中说明，此处不作赘述。
[0139]
相应的，本技术还提供一种电子设备，包括：一个或多个处理器；存储器，用于存储
一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上述的景区电子导览方法。
[0140]
相应的，本技术还提供一种计算机可读存储介质，其上存储有计算机指令，其特征在于，该指令被处理器执行时实现如上述的景区电子导览方法。
[0141]
本领域技术人员在考虑说明书及实践这里公开的内容后，将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本技术的真正范围和精神由下面的权利要求指出。
[0142]
应当理解的是，本技术并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种景区电子导览方法及装置、电子设备、存储介质与流程

相关文献

最热文献