文本纠错服务器、终端设备及文本纠错方法与流程

2022-12-07 03:31:28 来源：中国专利 TAG：

1.本技术实施例涉及语音识别
技术领域：
：。更具体地讲，涉及一种文本纠错服务器、终端设备及文本纠错方法。
背景技术：
：：2.文本纠错是指是对文本中存在的错误进行纠正。由于方言、口音、噪音等原因，将语音转换为文本的过程中常常会出现错误，而文本中的错误将极大地影响意图识别、文本检索等任务的效果。因此，文本纠错是语音识别领域的研究热点之一。3.目前，业界普遍使用的文本纠错方案为基于自然语言处理(naturallanguageprocessing，nlp)的文本纠错方案。例如：通过样本数据训练获取文本纠错模型，然后将待纠错语音文本输入文本纠错模型，以及获取文本纠错模型的输出作为待纠错文本的纠错结果。然而，基于nlp的文本纠错方案的开发周期普遍都非常长，常常无法满足相关产品的时限需求。技术实现要素：4.本技术示例性的实施方式提供一种文本纠错服务器、终端设备及文本纠错方法，用于解决文本纠错方案的开发周期长的问题。5.本技术实施例提供技术方案如下：6.第一方面，本技术实施例提供了一种文本纠错服务器，包括：7.通信器，被配置为接收第一终端设备发送的待纠错文本；8.控制器，被配置为在所述文本纠错服务器的纠错数据库中不包括用于对所述待纠错文本进行纠错的第一纠错数据的情况下，判断是否满足对所述待纠错文本进行标注的触发条件；9.所述通信器，还被配置为在满足所述触发条件的情况下，向至少一个终端设备发送用于请求对所述待纠错文本进行标注的标注请求，以及接收所述至少一个终端设备发送的标注数据；10.所述控制器，还被配置为根据所述至少一个终端设备发送的标注数生成所述待纠错文本对应的纠错数据，并将所述待纠错文本对应的纠错数据保存至所述纠错数据库。11.第二方面，本技术实施例提供了一种终端设备，包括：12.通信器，被配置为接收文本纠错服务器发送的用于请求对待纠错文本进行标注的标注请求；13.显示器，被配置为根据所述标注请求显示标注界面；14.用户接口，被配置为接收用户在所述标注界面中输入的标注操作，以及根据所述标注操作生成标注数据；15.所述通信器，还被配置为向所述文本纠错服务器发送所述标注数据。16.第三方面，本技术实施例提供了一种文本纠错方，应用于文本纠错服务器，所述方法包括：17.接收第一终端设备发送的待纠错文本；18.在所述文本纠错服务器的纠错数据库中不包括用于对所述待纠错文本进行纠错的第一纠错数据的情况下，判断是否满足对所述待纠错文本进行标注的触发条件；19.在满足所述触发条件的情况下，向至少一个终端设备发送用于请求对所述待纠错文本进行标注的标注请求，以及接收所述至少一个终端设备发送的标注数据；20.根据所述至少一个终端设备发送的标注数生成所述待纠错文本对应的纠错数据，并将所述待纠错文本对应的纠错数据保存至所述纠错数据库。21.第四方面，本技术实施例提供了一种文本纠错方法，应用于终端设备，所述方法包括：22.接收文本纠错服务器发送的用于请求对待纠错文本进行标注的标注请求；23.根据所述标注请求显示标注界面；24.接收用户在所述标注界面中输入的标注操作，以及根据所述标注操作生成标注数据；25.向所述文本纠错服务器发送所述标注数据。26.第五方面，本技术实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，当所述计算机程序被计算设备执行时，使得所述计算设备实现第三方面或第四方面所述的文本纠错方法。27.第六方面，本技术实施例提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机实现第三方面或第四方面所述的文本纠错方法。28.由以上技术方案可知，本技术实施例提供的文本纠错服务器和文本纠错方法在接收到第一终端设备发送的待纠错文本时，判断纠错数据库中是否包括用于对所述待纠错文本进行纠错的第一纠错数据，并在纠错数据库中不包括用于对所述待纠错文本进行纠错的第一纠错数据的情况下，判断是否满足对所述待纠错文本进行标注的触发条件；在满足所述触发条件的情况下，向至少一个终端设备发送用于请求对所述待纠错文本进行标注的标注请求，以及接收所述至少一个终端设备发送的标注数据；最后根据所述至少一个终端设备发送的标注数生成所述待纠错文本对应的纠错数据，并将所述待纠错文本对应的纠错数据保存至所述纠错数据库。由于本发明实施例中是基于纠错数据用于对待纠错文本进行纠错的，而纠错数据是根据终端设备发送的标注数生成的，因此本技术实施例可以通过用户标注的方式快速获取满足触发条件的待纠错文本的纠错数据，进而对待纠错文本进行纠错，因此本技术实施例可以解决文本纠错方案的开发周期长的问题。附图说明29.为了更清楚地说明本技术实施例或相关技术中的实施方式，下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本技术的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。30.图1示出了一些实施例中的文本纠错方法的场景架构图；31.图2示出了一些实施例中的终端设备的场景架构图；32.图3示出了一些实施例中的终端设备的硬件配置框图；33.图4示出了一些实施例中的终端设备的软件配置框图；34.图5示出了一些实施例中的语音交互网络架构示意图；35.图6示出了一些实施例中的文本纠错服务器的配置框图；36.图7示出了本技术实施例提供的文本纠错方法的交互流程图之一；37.图8示出了本技术实施例提供的标注界面的示意图之一；38.图9示出了本技术实施例提供的文本纠错方法的交互流程图之二；39.图10示出了本技术实施例提供的标注界面的示意图之二；40.图11示出了本技术实施例提供的文本纠错方法的交互流程图之三；41.图12示出了本技术实施例提供的用户情绪判断方法的流程图。具体实施方式42.为使本技术的目的和实施方式更加清楚，下面将结合本技术示例性实施例中的附图，对本技术示例性实施方式进行清楚、完整地描述，显然，描述的示例性实施例仅是本技术一部分实施例，而不是全部的实施例。43.需要说明的是，本技术中对于术语的简要说明，仅是为了方便理解接下来描述的实施方式，而不是意图限定本技术的实施方式。除非另有说明，这些术语应当按照其普通和通常的含义理解。44.术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的所有组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。45.图1为本技术实施例提供的文本纠错方法的场景架构示意图。如图1所示，本技术实施例提供的场景架构，包括：具有语音接收功能且配置为接收用户的语音输入的终端设备100、语义识别服务器200、文本纠错服务器300、以及配置为对待纠错文本进行标注的至少一个终端设备400(图1中以包括三个终端设备400为例示出)。46.终端设备100可以接收用户的语音输入，并将接收到的语音输入发送至语义识别服务器200。语义识别服务器200用于将终端设备100发送的语音输入转换为语音文本，并根据转换得到的语音文本进行用户意图的获取。语义识别服务器200在根据转换得到的语音文本进行用户意图获取的过程中，若转换得到的语音文本中不存在错误，语义识别服务器200可以获取用户意图，则语义识别服务器200根据获取的用户意图直接调用对应的业务系统，并将业务系统返回的业务数据返回终端设备100。然而，若转换得到的语音文本中存在错误，语义识别服务器200无法获取用户意图，则语义识别服务器200将转换得到的语音文本返回终端设备100。终端设备100接收到语义识别服务器200发送的语音文本后，将该语音文本作为待纠错文本向纠错服务器300发送，以便本纠错服务器300对待纠错文本进行纠错。纠错服务器300接收到终端设备100发送的待纠错文本后，首先判断纠错数据库中是否包括用于对待纠错文本进行纠错的纠错数据；若文本纠错服务器300的纠错数据库中包括用于对待纠错文本进行纠错的纠错数据，则基于纠错数据对待纠错文本进行纠错，并将纠错结果返回终端设备100；终端设备100重新根据纠错结果向语义识别服务器200进行业务请求。而若文本纠错服务器300的纠错数据库中不包括用于对待纠错文本进行纠错的纠错数据，则向终端设备100返回无法进行文本纠错的指示信息，并判断是否满足对待纠错文本进行标注的触发条件，若不满足对所述待纠错文本进行标注的触发条件，则仅缓存待纠错文本，不做其他处理，而若满足对所述待纠错文本进行标注的触发条件，则向各个终端设备400发送用于请求对待纠错文本进行标注的标注请求。终端设备400接收到文本纠错服务器300发送的标注请求后，根据标注请求显示标注界面，并接收用于在标注界面上输入的标注操作，根据标注操作生成标注数据，以及将标注数据返回文本纠错服务器300。文本纠错服务器接收到各个终端设备400返回的标注数据后，根据各个终端设备400返回的标注数据后生成待纠错文本对应的纠错数据，将待纠错文本对应的纠错数据保存至纠错数据库，以便后续对待纠错文本进行纠错。47.图2为本技术实施例提供的终端设备的架构示意图。如图1所示，本技术实施例提供的终端设备的架构，包括：终端设备100、控制装置500以及智能设备600。48.用户可通过智能设备1002或控制装置500控制和操作终端设备100，且可以通过智能设备1002或控制装置500接收用户的语音输入。本技术实施例提供的显示设备可以具有多种实施形式，例如，可以为电视、智能音箱、冰箱、具有显示功能的窗帘、个人计算机(personalcomputer，pc)、激光投影设备、显示器(monitor)、电子白板(electronicbulletinboard)、可穿戴设备、车载设备、电子桌面(electronictable)等。49.在一些实施例中，控制装置500可以是遥控器，遥控器和终端设备100的通信包括红外协议通信或蓝牙协议通信，及其他短距离通信方式，通过无线或有线方式来控制终端设备100。用户可以通过遥控器上按键、语音输入、控制面板输入等输入用户指令，来控制终端设备100。50.在一些实施例中，也可以使用智能设备600(如手机、平板电脑、笔记本电脑等)控制终端设备100。例如，使用在智能设备600上运行的应用程序控制终端设备100。51.在一些实施例中，终端设备100还可以采用除了控制装置500和智能设备600之外的方式进行控制，例如，可以通过终端设备100内部配置的获取语音指令的模块直接接收用户的语音指令控制。52.图3示出了示例性实施例中的终端设备的硬件配置框图。如图3所示终端设备100包括通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口280中的至少一种。53.控制器包250括中央处理器，音频处理器，ram，rom，用于输入/输出的第一接口至第n接口。54.通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如：通信器可以包括wifi模块，蓝牙模块，有线以太网模块等其他网络通信协议芯片或近场通信协议芯片，以及红外接收器中的至少一种。终端设备可以通过通信器220与语义识别服务器200建立控制信号和数据信号的发送和接收。55.用户接口280，可用于接收外部的控制信号。56.检测器230用于采集外部环境或与外部交互的信号。例如，检测器230包括光接收器，用于采集环境光线强度的传感器；或者，检测器230包括图像采集器，如摄像头，可以用于采集外部环境场景、用户的属性或用户交互手势，再或者，检测器230包括声音采集器，如麦克风等，用于接收外部声音。57.声音采集器可以是麦克风，也称“话筒”，“传声器”，可以用于接收用户的声音，将声音信号转换为电信号。终端设备可以设置至少一个麦克风。在另一些实施例中，终端设备可以设置两个麦克风，除了采集声音信号，还可以实现降噪功能。在另一些实施例中，终端设备还可以设置三个，四个或更多麦克风，实现采集声音信号，降噪，还可以识别声音来源，实现定向录音功能等。58.此外，麦克风可以是内置在终端设备上，或者麦克风通过有线或者无线的方式与终端设备相连接。当然，本技术实施例对麦克风在终端设备上的位置不作限定。或者，终端设备可以不包括麦克风，即上述麦克风并未设置于终端设备中。终端设备可以通过接口(如usb接口130)外接麦克风(也可以称为话筒)。该外接的话筒可以通过外部固定件(如带夹子的摄像头支架)固定在终端设备上。59.控制器250，通过存储在存储器上中各种软件控制程序，来控制显示设备的工作和响应用户的操作。控制器250控制终端设备的整体操作。60.在一些实施例中控制器包括中央处理器(centralprocessingunit，cpu)，视频处理器，音频处理器，ramrandomaccessmemory，ram)，rom(read-onlymemory,rom)，用于输入/输出的第一接口至第n接口，通信总线(bus)等中的至少一种。61.在一些示例中，终端设备100的操作系统为android系统为例，如图4所示，终端设备100从逻辑上可以分为应用程序(applications)层(简称“应用层”)21，内核层22和硬件层23。62.其中，如图4所示，硬件层可包括图2所示的通信器220、控制器250、检测器230、显示器260等。应用层21包括一个或多个应用。应用可以为系统应用，也可以为第三方应用。如，应用层21包括语音识别应用，语音识别应用可以提供语音交互界面和服务，用于终端设备100与语义识别服务器200的连接。63.内核层22作为硬件层和应用层21之间的软件中间件，用于管理和控制硬件与软件资源。64.在一些示例中，内核层22包括检测器驱动，检测器驱动用于将检测器230采集的语音数据发送至语音识别应用。示例性的，终端设备100中的语音识别应用启动，终端设备100与语义识别服务器200建立了通信连接的情况下，检测器驱动用于将检测器230采集的用户输入的语音数据发送至语音识别应用。之后，语音识别应用将包含该语音数据的查询信息发送至语义识别服务器200中的通信控制模块101。通信控制模块101用于将终端设备100发送的语音数据输入至意图识别模块102和数据存储模块103。65.为清楚说明本技术的实施例，下面结合图5对本技术实施例提供的一种语音识别网络架构进行描述。66.参见图5，图5为本技术实施例提供的一种语音交互网络架构示意图。图5中，语音交互设备用于接收输入的信息以及输出对该信息的处理结果。语音识别模块部署有语音识别服务，用于将音频识别为文本；语义理解模块部署有语义理解服务，用于对文本进行语义解析；业务管理模块部署有业务指令管理服务，用于提供业务指令；语言生成模块部署有语言生成服务(nlg)，用于将指示语音交互设备执行的指令转化为文本语言；语音合成模块部署有语音合成(tts)服务，用于将指令对应的文本语言处理后发送至扬声器进行播报。在一个实施例中，图5所示架构中可存在部署有不同业务服务的多个实体服务设备，也可以一个或多个实体服务设备中集合一项或多项功能服务。67.一些实施例中，下面对基于图5所示架构处理输入语音交互设备的信息的过程进行举例描述，以输入语音交互设备的信息为通过语音输入的语音指令为例：68.[语音识别][0069]语音交互设备可在接收到通过语音输入的语音指令后，对语音指令的音频进行降噪处理和特征提取，这里的降噪处理可包括去除回声和环境噪声等步骤。[0070][语义理解][0071]利用声学模型和语言模型，对识别出的候选文本和相关联的上下文信息进行自然语言理解，将文本解析为结构化的、机器可读的信息，业务领域、意图、词槽等信息以表达语义等。得到可执行意图确定意图置信度得分，语义理解模块基于所确定的意图置信度得分选择一个或者多个候选可执行意图，[0072][业务管理][0073]语义理解模块根据对语音指令的文本的语义解析结果，向相应的业务管理模块下发执行指令以执行语音指令对应的操作，以及完成用户请求此操作，并对语音指令对应的操作的执行结果进行反馈。[0074]在一些示例中，如图6所示，图6为文本纠错服务器300的配置框图。语义识别服务器200将音频转换为文本时，文本中存在错误，语义识别服务器200会将转换得到的文本返回终端设备100。之后，终端设备100又会将转换得到的文本作为待纠错文本发送至文本纠错服务器300中的通信控制模块301，通信控制模块301将接收到的待纠错文本输出至纠错模块302；纠错模块302，用于查询纠错数据库303中是否包含待纠错文本的纠错数据，若纠错数据库303中包含待纠错文本的纠错数据，则根据纠错数据对待纠错文本进行纠错，以及通过通信控制模块301将纠错结果返回终端设备100。而若纠错数据库303中不包含待纠错文本的纠错数据，则调用决策模块304确定是否满足对所述待纠错文本进行标注的触发条件。在满足所述触发条件的情况下，投票模块305向终端设备400发送用于请求对所述待纠错文本进行标注的标注请求，并接收终端设备400发送的标注数据。决策模块304还用于根据所述至少一个终端设备发送的标注数生成待纠错文本对应的纠错数据，以及将所述待纠错文本对应的纠错数据保存到纠错数据库303中。[0075]在一些实施例中，如图5所示，本技术实施例提供的一种文本纠错方法包括如下步骤：[0076]s701、第一终端设备向文本纠错服务器发送待纠错文本。[0077]对应的，文本纠错服务器接收第一终端设备发送的待纠错文本。[0078]在一些实施例中，第一终端设备向文本纠错服务器发送待纠错文本的实现方式可以包括：第一终端设备向语义识别服务器发送待识别语音，并接收语义识别服务器返回的语义识别结果；若所述语义识别结果中仅包括待识别语音对应的文本，而不包括待识别语音对应的用户意图，则将待识别语音对应的文本作为待纠错文本向文本纠错服务器发送。[0079]例如：用户向第一终端设备输入了一段对应文本内容为“松花蛋怎么做”的语音输入，第一终端设备将该语音输入发送到语义识别服务器后，语义识别服务器将该语音输入转换为了文本“送花旦怎么做”，且因为无法根据文本“送花旦怎么做”获取该语音输入对应的用户意图，而将文本“送花旦怎么做”返回了第一终端设备，则第一终端设备将文本“送花旦怎么做”作为待纠错文本发送至文本纠错服务器。[0080]在一些实施例中，第一终端设备可以通过通信器向文本纠错服务器发送待纠错文本，文本纠错服务器可以通过通信器接收第一终端设备发送的所述待纠错文本。[0081]s702、文本纠错服务器判断所述文本纠错服务器的纠错数据库中是否包括用于对所述待纠错文本进行纠错的第一纠错数据。[0082]在上步骤s702中，若所述文本纠错服务器的纠错数据库中不包括用于对所述待纠错文本进行纠错的第一纠错数据，则执行如下步骤s703。[0083]s703、文本纠错服务器判断是否满足对所述待纠错文本进行标注的触发条件。[0084]即，本技术实施例中并不会对所有未获取用户意图的文本进行标注，而是只会对满足触发条件的文本进行标注。[0085]例如：触发条件为累积未识别次数超过5次，待纠错文本为“送花旦怎么做”，则在纠错数据库中不包括用于对“送花旦怎么做”进行纠错的第一纠错数据时，判断终端设备向文本纠错服务器发送待纠错文本“送花旦怎么做”的次数是否超过了5次，若超过了5次，确定满足对“送花旦怎么做”进行标注的触发条件；而若未超过5次，确定不满足对“送花旦怎么做”进行标注的触发条件。[0086]在一些实施例中，文本纠错服务器可以通过控制器执行上步骤s702和s703(判断所述文本纠错服务器的纠错数据库中是否包括用于对所述待纠错文本进行纠错的第一纠错数据，在所述文本纠错服务器的纠错数据库中不包括用于对所述待纠错文本进行纠错的第一纠错数据的情况下，判断是否满足对所述待纠错文本进行标注的触发条件)。[0087]在上步骤s703中，若文本纠错服务器确定满足对所述待纠错文本进行标注的触发条件，则执行如下步骤s704。[0088]s704、文本纠错服务器向至少一个终端设备发送用于请求对所述待纠错文本进行标注的标注请求。[0089]对应的，所述至少一个终端设备分别接收所述文本纠错服务器发送的用于请求对所述待纠错文本进行标注的标注请求。[0090]在一些实施例中，所述至少一个终端设备可以包括所述第一终端设备。即，文本纠错服务器向发送所述待纠错数据的终端设备发送用于请求对所述待纠错文本进行标注的标注请求。例如：终端设备a向文本纠错服务器了待纠错文本“送花旦怎么做”，则文本纠错服务器向包括终端设备a的多个终端设备发送用于请求对待纠错文本“送花旦怎么做”进行标注的标注请求。[0091]在一些实施例中，文本纠错服务器可以通过通信器执行上述步骤s704(向至少一个终端设备发送用于请求对所述待纠错文本进行标注的标注请求)。[0092]s705、所述至少一个终端设备分别根据所述标注请求显示标注界面。[0093]示例性的，参照图8所示，图8中以待纠错文本为“送花旦怎么做”为例标注界面进行说明，如图8所示，标注界面上可以显示有提示文本81以及待纠错文本82，提示文本81可以为“请输入如下文本含义”，待纠错文本82为“送花旦怎么做”。[0094]在一些实施例中，所述至少一个终端设备可以分别通过显示器执行上步骤s705(根据所述标注请求显示标注界面)。[0095]s706、所述至少一个终端设备分别接收用户在所述标注界面中输入的标注操作，以及根据所述标注操作生成标注数据。[0096]在一些实施例中，用户在所述标注界面中输入的标注操作可以为文本输入操作。例如：用户在所述标注界面中通过文本输入操作输入了文本“松花蛋怎么做”，则根据文本“松花蛋怎么做”生成标注数据。[0097]在一些实施例中，所述至少一个终端设备可以分别通过用户接口执行上步骤s706(接收用户在所述标注界面中输入的标注操作，以及根据所述标注操作生成标注数据)。[0098]s707、所述至少一个终端设备分别向所述文本纠错服务器发送所述标注数据。[0099]对应的，文本纠错服务器接收所述至少一个终端设备发送的标注数据。[0100]在一些实施例中，所述至少一个终端设备可以分别通过通信器向所述文本纠错服务器发送所述标注数据，所述文本纠错服务器可以通过通信器接收所述至少一个终端设备发送标注数据。[0101]s708、文本纠错服务器根据所述至少一个终端设备发送的标注数生成所述待纠错文本对应的纠错数据。[0102]例如：待纠错文本为“送花旦怎么做”，所述至少一个终端设备向所述文本纠错服务器发送的标注数据均为“松花蛋怎么做”，则可以生成的纠错数据可以为“松花蛋怎么做”。[0103]s709、文本纠错服务器将所述待纠错文本对应的纠错数据保存至所述纠错数据库。[0104]在一些实施例中，文本纠错服务器可以通过控制器执行上述步骤s708和s709(根据所述至少一个终端设备发送的标注数生成所述待纠错文本对应的纠错数据，并将所述待纠错文本对应的纠错数据保存至所述纠错数据库)。[0105]本技术实施例提供的文本纠错方法在文本纠错服务器接收到第一终端设备发送的待纠错文本时，判断纠错数据库中是否包括用于对所述待纠错文本进行纠错的第一纠错数据，并在纠错数据库中不包括用于对所述待纠错文本进行纠错的第一纠错数据的情况下，判断是否满足对所述待纠错文本进行标注的触发条件；在满足所述触发条件的情况下，向至少一个终端设备发送用于请求对所述待纠错文本进行标注的标注请求，以及接收所述至少一个终端设备发送的标注数据；最后根据所述至少一个终端设备发送的标注数生成所述待纠错文本对应的纠错数据，并将所述待纠错文本对应的纠错数据保存至所述纠错数据库。由于本发明实施例中是基于纠错数据用于对待纠错文本进行纠错的，而纠错数据是根据终端设备发送的标注数生成的，因此本技术实施例可以通过用户标注的方式快速获取满足触发条件的待纠错文本的纠错数据，进而对待纠错文本进行纠错，因此本技术实施例可以解决文本纠错方案的开发周期长的问题。[0106]作为对上实施例的扩展和细化，本发明实施例提供了另一种文本纠错方法，参照图9所示，该文本纠错方法，包括如下步骤：[0107]s901、第一终端设备接收用户的语音输入。[0108]在一些实施例中，第一终端设备接收到接收用户的语音输入后，还可以对语音输入进行降噪处理。[0109]s902、第一终端设备向语义识别服务器发送所述语音输入。[0110]相应的，语义识别服务器接收所述第一终端设备发送的语音输入。[0111]s903、语义识别服务器将所述语音输入转换为文本，并根据所述文本进行用户意图的获取。[0112]在上述步骤s903中，若语义识别服务器成功根据所述文本获取了用户意图，则语义识别服务器直接调用相关业务系统进行业务数据的获取，并向第一终端设备返回获取的业务数据。[0113]例如：语义识别服务器转换语音输入得到的文本为“播放静夜思”，则调用业务系统获取与《静夜思》相关的音频资源或视频资源，并将获取的与《静夜思》相关的音频资源或视频资源发送至第一终端设备，以便第一终端设备播放与《静夜思》相关的音频资源或视频资源。[0114]在上述步骤s903中，若语义识别服务器根据所述文本获取用户意图失败，则语义识别服务器执行如下步骤s904。[0115]s904、语义识别服务器向第一终端设备发送转换语音输入得到的文本。[0116]相应的，第一终端设备接收语义识别服务器发送的转换语音输入得到的文本。[0117]例如：语义识别服务器转换语音输入得到的文本为“荷兰的省会在哪里？”，由于无法根据文本“荷兰的省会在哪里？”获取用户意图，因此将转换语音输入得到的文本“荷兰的省会在哪里？”返回第一终端设备。[0118]s905、第一终端设备将转换语音输入得到的文本确定为待纠错文本，并向文本纠错服务器发送待纠错文本。[0119]相应的，文本纠错服务器接收第一终端设备发送的待纠错文本。[0120]s906、文本纠错服务器判断所述文本纠错服务器的纠错数据库中是否包括用于对所述待纠错文本进行纠错的第一纠错数据。[0121]在一些实施例中，所述第一纠错数据为用于对所有终端设备发送的所述待纠错文本进行纠错的纠错数据。[0122]例如：待纠错文本为“胡建有多大？”，纠错数据库中包括用于对所有终端设备发送的文本“胡建有多大？”进行纠错的纠错数据“福建有多大？”，则可以确定纠错数据库中包括用于对所述待纠错文本进行纠错的第一纠错数据，且第一纠错数据为用于对所有终端设备发送的所述待纠错文本进行纠错的纠错数据。[0123]在一些实施例中，所述第一纠错数据为配置为仅用于对所述第一终端设备发送的所述待纠错文本进行纠错的纠错数据。[0124]例如：待纠错文本为“知不道”，纠错数据库中包括用于对第一终端设备发送的文本“知不道”进行纠错的纠错数据“不知道？”，则可以确定纠错数据库中包括用于对所述待纠错文本进行纠错的第一纠错数据，且第一纠错数据为仅用于对所述第一终端设备发送的所述待纠错文本进行纠错的纠错数据。[0125]再例如：待纠错文本为“两只黄鹂鸣翠柳”，纠错数据库中包括用于对第二终端设备发送的文本“两只黄鹂鸣翠柳”进行纠错的纠错数据“两个黄鹂鸣翠柳”，则可以确定纠错数据库中不包括用于对所述待纠错文本进行纠错的第一纠错数据。[0126]在上步骤s906中，若所述文本纠错服务器的纠错数据库中包括用于对所述待纠错文本进行纠错的第一纠错数据，则执行如下步骤s907至s910。[0127]s907、文本纠错服务器根据所述第一纠错数据对所述第一文本进行纠错，以获取第二文本。[0128]示例性的，待纠错文本为“胡建有多大？”，纠错数据库中包括用于“胡建有多大？”进行纠错的第一纠错数据“福建有多大？”，则可以根据第一纠错数据对所述第一文本进行纠错，以获取第二文本“福建有多大？”。[0129]在一些实施例中，文本纠错服务器可以通过控制器执行上步骤s907(文本纠错服务器根据所述第一纠错数据对所述第一文本进行纠错，以获取第二文本)。[0130]s908、文本纠错服务器向所述第一终端设备发送所述第二文本。[0131]相应的，第一终端设备接收所述文本纠错服务器发送的第二文本。[0132]s909、第一终端设备向语义识别服务器发送所述第二文本。[0133]相应的，语义识别服务器接收所述第一终端设备发送的第二文本。[0134]s910、语义识别服务器根据所述第二文本进行用户意图的获取。[0135]例如：第二文本为“福建有多大？”，则语义识别服务器可以根据第二文本为获取用户意图“查询福建省的面积”，进而调用相关业务系统获取福建省的面积，并将查询到的福建省的面积返回第一终端设备。[0136]在上步骤s906中，若所述文本纠错服务器的纠错数据库中不包括用于对所述待纠错文本进行纠错的第一纠错数据，则执行如下步骤s911至s918。[0137]s911、文本纠错服务器判断是否满足对所述待纠错文本进行标注的触发条件。[0138]在上述步骤s911中，若文本纠错服务器确定满足对所述待纠错文本进行标注的触发条件，则执行如下步骤s912。[0139]s912、文本纠错服务器向至少一个终端设备发送标注请求。[0140]对应的，所述至少一个终端设备分别接收所述文本纠错服务器发送的标注请求。[0141]其中，所述标注请求用于请求对所述待纠错文本进行标注，所述标注请求携带有至少一个标注选项。[0142]s913、所述至少一个终端设备分别根据所述标注请求显示标注界面。[0143]示例性的，参照图10所示，图10中以待纠错文本为“这个我知不道”为例标注界面进行说明，如图10所示，标注界面上可以显示有提示文本1001、待纠错文本1002以及标注选项1003和标注选项，提示文本1001可以为“请选择如下文本的正确含义”，待纠错文本1002为“这个我知不道”，标注选项1003的内容为“这个我知道”标注选项1004的内容为“这个我不知道”。[0144]s914、所述至少一个终端设备分别接收用户对所述至少一个标注选项的选择操作，以及根据用户选择的标注选项生成标注数据。[0145]例如：所述至少一个终端设备1接收到了用户对所述至少一个标注选项中的标注选项a的选择操作，则终端设备1根据标注选项a生成标注数据，所述至少一个终端设备2接收到了用户对所述至少一个标注选项中的标注选项b的选择操作，则终端设备2根据标注选项b生成标注数据。[0146]s915、所述至少一个终端设备分别向所述文本纠错服务器发送所述标注数据。[0147]对应的，文本纠错服务器接收所述至少一个终端设备发送的标注数据。[0148]s916、文本纠错服务器判断所述至少一个终端设备分别向所述文本纠错服务器发送的标注数据中是否存在占比超过阈值占比的标注数据。[0149]示例性的，阈值占比为60％，终端设备包括：终端设备1至终端设备10，且终端设备1至终端设备10返回的标注数据如下表1所示：[0150]表1[0151]终端设备标注数据终端设备1标注数据a终端设备2标注数据a终端设备3标注数据b终端设备4标注数据a终端设备5标注数据a终端设备6标注数据c终端设备7标注数据c终端设备8标注数据a终端设备9标注数据a终端设备10标注数据a[0152]由上表1可知：标注数据a的占比为70％，标注数据b的占比为10％，标注数据c的占比为20％，其中，标注数据a的占比(70％)大于阈值占比(60％)，因此文本纠错服务器确定可以所述至少一个终端设备分别向所述文本纠错服务器发送所述标注数据中存在占比超过阈值占比的标注数据，且超过阈值占比的标注数据为标注数据a。[0153]示例性的，阈值占比为75％，终端设备包括：终端设备1至终端设备10，且终端设备1至终端设备10返回的标注数据如下表2所示：[0154]表2[0155]终端设备标注数据终端设备1标注数据a终端设备2标注数据e终端设备3标注数据a终端设备4标注数据a终端设备5标注数据c终端设备6标注数据e终端设备7标注数据b终端设备8标注数据c终端设备9标注数据b终端设备10标注数据d[0156]由上表2可知：标注数据a的占比为30％，标注数据b的占比为20％，标注数据c的占比为20％，，标注数据c的占比为10％，，标注数据e的占比为20％，标注数据a、标注数据b、标注数据c、标注数据d、标注数据e的占比均小于阈值占比(75％)，因此文本纠错服务器确定可以所述至少一个终端设备分别向所述文本纠错服务器发送所述标注数据中不存在占比超过阈值占比的标注数据。[0157]在上述步骤s916中，若所述至少一个终端设备发送的标注数据中目标标注数据的占比超过阈值占比，则执行如下步骤s917：[0158]s917、文本纠错服务器根据所述目标标注数据生成用于对所有终端设备发送的所述待纠错文本进行纠错的纠错数据。[0159]承上表1所示示例，终端设备1至终端设备10发送的标注数据中的标注数据a的占比大于阈值占比，因此根据标注数据a生成用于对所有终端设备发送的所述待纠错文本进行纠错的纠错数据。[0160]在上述步骤s916中，若所述至少一个终端设备发送的标注数据中各个标注数据的占比均小于所述阈值占比，则执行如下步骤s918：[0161]s918、文本纠错服务器根据所述至少一个终端设备中的各个终端设备的标注数据生成仅用于对对应的终端设备发送的所述待纠错文本进行纠错的纠错数据。[0162]承上表1所示示例，终端设备1至终端设备10发送的标注数据中各个标注数据的占比均小于所述阈值占比，因此根据终端设备1发送的标注数据a生成仅用于对终端设备1发送的所述待纠错文本进行纠错的纠错数据，根据终端设备2发送的标注数据e生成仅用于对终端设备2发送的所述待纠错文本进行纠错的纠错数据，……终端设备10发送的标注数据d生成仅用于对终端设备10发送的所述待纠错文本进行纠错的纠错数据。[0163]s919、文本纠错服务器将所述待纠错文本对应的纠错数据保存至所述纠错数据库。[0164]在一些实施例中，参照图11所示，在图9所示实施例的基础上，在若所述文本纠错服务器的纠错数据库中不包括用于对所述待纠错文本进行纠错的第一纠错数据的情况下，本发明实施例提供的文本纠错方法还包括如下步骤：[0165]s111、文本纠错服务器向第一终端设备发送用于指示所述待纠错文本纠错失败的指示信息。[0166]相应于的，第一终端设备接收文本纠错服务器发送的用于指示所述待纠错文本纠错失败。[0167]s112、第一终端设备输出用于指示语音输入识别失败的指示信息。[0168]在一些实施例中，第一终端设备输出用于指示语音输入识别失败的指示信息的实现方式可以为：播放用于指示语音输入识别失败的音频文件。例如：播放对应文本为“我没有明白你的意思”的音频文件。[0169]在一些实施例中，第一终端设备输出用于指示语音输入识别失败的指示信息的实现方式可以为：显示指示语音输入识别失败的文本信息。例如：显示文本信息“你说的我还没学会”。[0170]在一些实施例中，判断是否满足对所述待纠错文本进行标注的触发条件的实现方式可以包括：[0171]若所述第一终端设备连续向所述文本纠错服务器发送所述待纠错文本的次数超过第一阈值次数；或者，[0172]若目标地理区域内的终端设备在第一预设时长内向所述文本纠错服务器发送所述待纠错文本的次数超过第二阈值次数，所述目标地理区域为所述第一终端设备所属的地理区域；或者，[0173]若所述第一终端设备在第二预设时长内向所述文本纠错服务器发送文本的次数超过第三阈值次数；或者，[0174]若所述待纠错文本对应的用户情绪为负面情绪；[0175]则，确定满足对所述待纠错文本进行标注的触发条件。[0176]即，判断如下条件1至条件4是否满足，以及在满足以下条件1至条件4中的至少一个条件时，确定满足对所述待纠错文本进行标注的触发条件：[0177]条件1、所述第一终端设备连续向所述文本纠错服务器发送所述待纠错文本的次数超过第一阈值次数。[0178]其中，第一阈值次数可以由文本纠错服务器的后台配置下发。[0179]例如：将第一阈值次数配置为3次，则通过判断所述第一终端设备连续向所述文本纠错服务器发送所述待纠错文本的次数是否超过3次来判断是否满足对所述待纠错文本进行标注的触发条件。[0180]条件2、目标地理区域内的终端设备在第一预设时长内向所述文本纠错服务器发送所述待纠错文本的次数超过第二阈值次数。其中，所述目标地理区域为所述第一终端设备所属的地理区域。[0181]即，文本纠错服务器预先进行地理区域的划分，然后在判断是否满足对所述待纠错文本进行标注的触发条件时，首先获取第一终端设备所属的地理区域，然后获取第一预设时长内第一终端设备所属的地理区域内所有终端设备的文本纠错历史数据，以及通过判断第一预设时长内第一终端设备所属的地理区域内所有设备的文本纠错历史数据中所述待纠错文本的发送次数是否超过第二阈值来判断是否满足对所述待纠错文本进行标注的触发条件。其中，第一终端设备所属的地理区域可以根据第一终端设备的网络协议(internetprotocol，ip)地址获取。[0182]例如：第一预设时长为24小时，第一终端设备所属的地理区域为xx镇，第二阈值次数为10，则获取xx镇的所有终端设备在过去24小时内向所述文本纠错服务器发送所述待纠错文本的次数是否超过10次来判断是否满足对所述待纠错文本进行标注的触发条件。[0183]条件3、所述第一终端设备在第二预设时长内向所述文本纠错服务器发送文本的次数超过第三阈值次数。[0184]例如：第二预设时长为7天，第三阈值次数为5，则通过判断第一终端设备在过去7天内向所述文本纠错服务器发送文本的次数超是否超过5次来判断是否满足对所述待纠错文本进行标注的触发条件。[0185]条件4、所述待纠错文本对应的用户情绪为负面情绪。[0186]即，获取所述待纠错文本对应的用户情绪，并通过判断所述待纠错文本对应的用户情绪是否为负面情绪来判断是否满足对所述待纠错文本进行标注的触发条件。在一些实施例中，参照图12所示，获取所述待纠错文本对应的用户情绪的实现方式可以包括如下步骤a至步骤b：[0187]s121、对所述待纠错文本进行分词，获取所述待纠错文本的分词结果。[0188]例如：待纠错文本为“我喜欢打游戏”，则可以则所述待纠错文本的分词结果可以包括：“我”、“喜欢”、“打”、“游戏”。[0189]s122、加载脏字数据库。[0190]s123、判断所述待纠错文本的分词结果中是否包含所述脏字数据库中的脏字。[0191]在上述步骤c中，若所述待纠错文本的分词结果中包含所述脏字数据库中脏字，则执行如下步骤d：[0192]s124、确定所述待纠错文本对应的用户情绪为负面情绪。[0193]在上述步骤c中，若所述待纠错文本的分词结果中不包含所述脏字数据库中脏字，则执行如下步骤e：[0194]s125：基于情绪分析模型确定所述待纠错文本对应的用户情绪是否为负面情绪。[0195]在一些实施例中，情绪分析模型可以为基于样本数据对机器学习模型进行训练获取的模型，样本数据包括样本文本以及样本文本的情绪标签，所述情绪标签为负面情绪或非负面情绪，机器学习模型可以为深度神经网络模型、卷积神经网络模型等。[0196]在一些实施例中，本技术实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，当所述计算机程序被计算设备执行时，使得所述计算设备实现上述任一实施例所述的文本纠错方法。[0197]在一些实施例中，本技术实施例提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机实现上述任一实施例所述的文本纠错方法。[0198]最后应说明的是：以上各实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述各实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。[0199]为了方便解释，已经结合具体的实施方式进行了上述说明。但是，上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导，可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用，从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。当前第1页12当前第1页12

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种基于CNN-LSTM运动模式识别的自适应步频检测方法

文本纠错服务器、终端设备及文本纠错方法与流程

相关文献

最热文献