一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于自然语言处理和问答匹配的实验室管理系统的制作方法

2022-02-19 06:40:56 来源:中国专利 TAG:


1.本发明涉及自然语言处理和语音识别领域,特别涉及一种基于自然语言处理和问答匹配的实验室管理系统。


背景技术:

2.实验室信息管理系统为实验室提供了信息化的管理模式,给实验室带来了极大地便利,对于实验室来说,不管是科研实验室还是检测检验实验室,都离不开庞大而复杂的数据记录体系,但是现有的实验室管理系统大多采用人工记录数据,存在数据记录不及时、不可控的人为因素造成的记录错误的数据安全问题,同时还会浪费不必要的人力。
3.自然语言处理是实现人与计算机之间用自然语言进行交流的理论和方法,语音识别技术是让机器识别和理解自然语言并把语音信号转换为文字的技术,随着自然语言处理方法的不断发展和日益成熟的语音识别技术,现有的许多终端设备都具备了语音识别功能,将自然语言处理和语音识别技术运用到实验室管理系统中,通过自然语言命令系统,进行查询数据和记录数据的操作,减少了实验人员双手对系统的操作,对于实验室提高工作效率、保证数据的原始性与准确性具有重要意义。


技术实现要素:

4.本发明为了解决上述问题,提出了一种基于自然语言处理和问答匹配的实验室管理系统,通过语音输入向系统发出操作指令,查询数据和辅助实验人员在实验过程中记录数据,减少了实验人员双手对系统的操作,实现了实验操作和数据记录同步进行,且不用消耗不必要的人力资源,极大地提高了工作效率,节约了实验时间,同时避免了人工记录数据会产生的数据安全隐患问题。
5.为了实现上述目的,本发明提供技术方案如下:一种基于自然语言处理和问答匹配的实验室管理系统,包括:语音识别模块、语料库模块、指令处理模块,功能匹配模块,控制器模块。
6.进一步地,所述语音识别模块,用于获取语音指令并转换为文字指令,用户通过连接系统的终端设备的语音识别组件输入语音指令,并且由语音识别组件自动将识别到的语音指令转换为文字指令。
7.进一步地,所述终端设备包括但不限于手机、电脑、实验室仪器。
8.进一步地,所述语料库模块,用于存放语料数据,语料数据内容具体分为三部分,分别为实验室数据、制药行业最新动态、连接系统的终端设备的功能说明,三种数据经过收集、分析、整理组成初始语料数据,使用bert模型进行向量化处理,生成对应的初始语料向量,共同组成语料库的语料数据。
9.进一步地,所述实验室数据,指实验室数据库中存储的实验记录报告或其他实验室相关数据。
10.进一步地,所述行业最新动态,指系统使用网络爬虫技术,定期在互联网上通过正
规途径选取的生物制药行业标准的种子url。
11.进一步地,所述终端设备的功能说明,指实验室人员或技术人员根据连接系统的各种终端设备所具备的具体功能编写。
12.进一步地,所述语料库中语料数据的分类以初始语料向量的距离为标准进行分类,技术人员根据实验室的需求和实际情况选取第一分类中心向量,计算初始预料向量与第一分类中心向量的距离,规定一个阈值,将超过阈值的初始语料向量归为一类。
13.进一步地,距离计算方式采用余弦相似度。
14.进一步地,所述指令处理模块,用于对文字指令的处理,包括文字指令向量化和获取文字指令对应的特征向量。
15.进一步地,所述对文字指令的处理,将文字指令输入经过训练的bert模型中,bert模型将文字指令进行向量化处理,并输出文字指令对应的特征向量。
16.进一步地,所述功能匹配模块用于计算特征向量与语料数据的相似度,系统选择相似度最高的指令执行。
17.进一步地,首先计算特征向量与语料库第一分类中心向量的余弦相似度确定用户操作类型,再计算特征向量与对应类型下的语料数据的余弦相似度,对应不同的操作类型设置不同的问答匹配规则。
18.进一步地,用户操作类型包括查询数据和记录数据。
19.进一步地,所述控制器模块,用于控制上述各个模块协同工作,负责接收各个模块的消息和发布执行命令到各个模块,控制终端设备的显示屏显示最终结果。
20.与现有技术相比,本发明所提供的一种基于自然语言处理和问答匹配的实验室管理系统,实现了系统通过用户的语音输入进行数据查询和数据记录的功能,减少了用户双手对系统的操作,提高了工作效率,避免了由人工记录数据不及时不准确所产生的数据安全隐患,同时通过系统自动填入数据将使实验记录更加标准化,为实验人员管理和存储实验记录提供了极大地便利。
附图说明
21.下面结合附图对本发明做进一步的说明。
22.图1为基于自然语言处理和问答匹配的实验室管理系统的逻辑示意图。
23.图2为语料数据的组成示意图。
24.图3为语料库的结构示意图。
具体实施方式
25.为了实现本发明的最终目的,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行完整、明确地描述。
26.本发明提出的一种基于自然语言处理和问答匹配的实验室管理系统,包括:语音识别模块、语料库模块、指令处理模块,功能匹配模块、控制器模块。
27.参照图1所示,基于自然语言处理和问答匹配的实验室管理系统,控制器模块与语音识别模块、语料库模块、指令处理模块、功能匹配模块相连,负责接收各个模块的消息和控制各个模块的工作运行,语料库中的数据包括制药行业最新动态、实验室数据、终端设备
的功能说明。
28.语音识别模块用于获取用户的语音指令并将语音指令转换为文字指令,在一个可选的实施例中,用户通过连接系统的终端设备的语音识别组件输入语音指令,当系统成功检测到用户的语音输入时,由语音识别组件将语音指令自动转换为文字指令,所述终端设备包括但不限于手机、电脑、实验室仪器。
29.语料库模块用于存放语料数据,是系统进行问答匹配的基础,语料库中的语料数据组成参照图2所示,包括制药行业最新动态、实验室数据、终端设备的功能说明。
30.在一个可选的实施例中,制药行业最新动态通过网络爬虫技术定期在互联网上通过正规渠道爬取,技术人员根据实际情况和实验室需求制定规则,选取生物制药行业标准的种子url,并分析已抓取url队列中的url,获得实验室需要的数据,时间为6个月一次;实验室数据为实验室数据库中存储的实验记录报告或其他与实验室相关的数据;终端设备的功能说明由实验室人员或技术人员根据使用终端设备的用语习惯或公认的用语标准编写。
31.选用上述实施例,将三种数据经过收集、分析、整理后形成初始语料数据,通过bert模型将初始语料数据进行向量化处理,生成对应的初始语料向量,共同组成语料库的语料数据,用于匹配用户的指令。
32.选用上述实施例,将三种数据进行分类存储,类型相似或者语义相近的初始语料数据对应的初始语料向量也拥有较近的距离,因此将初始语料向量之间的距离作为分类依据,本发明采用余弦相似度的计算方法计算距离,技术人员根据实验室的需求和实际情况选取第一分类中心向量,计算初始语料向量与第一分类中心向量的距离,规定一个阈值,将超过阈值的初始语料向量归为一类,技术人员可根据需要在第一分类中心向量区域下继续选取第二分类中心向量,进行更细致的分类。
33.选用上述实施例,参照图3所示,选取两个第一分类中心向量,分别为查询类操作和记录类操作,实验室数据和制药行业最新动态归类于查询类操作,终端设备的功能说明归类于记录类操作,具体地,在查询类操作下继续选取第二分类中心向量,区分实验室数据和制药行业最新动态。
34.指令处理模块,用于对文字指令的处理,包括文字指令向量化和获取文字指令对应的特征向量。
35.在一个可选实施例中,将文字指令输入经过训练的bert模型中,对文字指令进行分词、解析、向量化处理,输出一组由词向量组成的具备语义的句子向量,即文字指令对应的特征向量。
36.功能匹配模块用于计算所述特征向量与语料数据的相似度,系统选择相似度最高的指令执行,对应用户不同的操作类型设置不同的问答匹配规则,所述用户操作类型包括查询数据和记录数据。
37.在一个可选实施例中,系统首先计算特征向量与语料库中的第一分类中心向量的余弦相似度,确认用户的操作类型是查询类操作还是纪录类操作。
38.选用上述实施例,对应用户的查询类操作,功能匹配模块计算特征向量与查询类操作的语料数据的余弦相似度,设置一个阈值,将余弦相似度按大小排序,选取k个超过阈值的语料数据对应的答案建立候选答案集,系统选取余弦值相似度最高的答案返回给用户。
39.所述k为一个正整数,由实验室人员或技术人员根据实际需求设置,若超过阈值的语料数据个数小于k值,则将选取所有超过阈值的语料数据对应的答案;若超过阈值的语料数据个数大于k值,则根据余弦相似度由大到小选取k个语料数据对应的答案。
40.其中,当系统检测到用户查询的数据属于实验室数据库中的内容时,系统将调用身份认证体系对用户进行认证,用户身份符合查询要求则将答案返回给用户;当系统检测到用户查询的数据属于网络爬虫技术获取的数据,则不用进行身份验证直接将答案返回给用户。
41.当最大余弦相似度小于设置的阈值或系统认证用户身份不合格时,系统显示查询失败,并通过终端设备的扬声器发出提示音。
42.优选的,身份认证方式采用人脸识别和指纹识别。
43.特别地,根据用户的使用情况建立常用答案集,将用户经常检索的语料数据对应的答案以检索次数为依据选进常用答案集,根据实际情况选择n个常用答案,所述n为正整数,由技术人员根据实际情况设置,当用户再次查询时优先检索常用问题集,若是在常用问题集中检索不到目标答案,再通过语料库检索。
44.选用上述实施例,对应用户的记录类操作,功能匹配模块计算特征向量于语料库中记录类操作的语料数据的余弦相似度,系统跳转余弦相似度最高的功能说明对应的功能界面,在终端设备的显示屏上显示待填入数据,并由终端设备的扬声器提示用户继续通过语音录入数据,系统识别后自动填入数据。
45.其中,当用户没有切换操作界面时,用户输入语音数据,系统只会在当前操作界面的待填入处填写数据,当数据填写完成发出完成提示音,并跳转到下一个待填入数据处提示用户继续录入,直至用户结束记录操作。
46.控制器模块,用于控制各个模块协同工作,协调和指挥整个系统的运行,基于本发明,其控制过程如下:用户通过终端设备启动系统,使用终端设备的语音识别组件录入语音指令,控制器模块调动语音识别模块,识别用户语音并转换为文字指令,控制器模块接收语音识别模块的识别信息调动指令处理模块将文字指令向量化,提取特征向量,控制器接收指令处理模块的转换信息调动语料库模块和功能匹配模块检索目标答案,控制器接收功能匹配模块的匹配结果,并在终端设备的显示屏上显示匹配结果。
47.综上所述,本发明涉及的一种基于自然语言处理和问答匹配的实验室管理系统,采用自然语言处理技术和语音识别技术,使实验室人员可以通过自然语言操作系统,减少实验室人员手动输入操作指令的频率,实现了实验操作和数据记录同步进行,将辅助记录人员的工作转交给机器,即可避免数据填入不及时产生的误差,也可以规范化实验记录,通过自然语言查询数据、记录数据,对实验室节约时间、提高工作效率、保证数据的准确性与及时性、标准化管理实验记录具有重要意义。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献