一种基于编辑距离的记忆能力评价方法

2022-06-02 13:01:47 来源：中国专利 TAG：

1.本发明涉及记忆评价的技术领域，尤其涉及一种基于编辑距离的记忆能力评价方法。

背景技术：

2.在工作记忆相关实验中常常出现对记忆能力度量的需求，例如在n-back实验范式中选择通过被试的判断准确率来反映其记忆能力，这种判断方式在单一的图像或者位置记忆任务中足以满足需求，但一旦实验涉及两者皆有的混合记忆任务，这种简单的判断方式就会因为难以控制变量而失去了科学性。假设在一个混合记忆任务的n-back范式中，被试需要记忆一串随机无逻辑数字，被试既需要对每个数字进行记忆，也需要对每个数字的位置进行记忆，若想计算平均准确率来代表记忆能力，则需要保证每次判断对错的难度是一样的，那么假如待记忆数字串为123456，对123457和123465进行判断的难度是否一样呢，如果不一样，那么哪个难度更大一些呢？可以看出，在混合记忆任务中，这些问题很难得到科学的解决。
3.目前涉及到混合记忆任务的实验中，在记忆能力上并没有一个统一且合适的标准，大都是套用n-back范式中的准确率评价法，但该方法在之前的论证中已经说明不适合于混合记忆任务，或者参考记忆广度的定义设计一些标准，但都没有给出这些标准的科学性论证。

技术实现要素：

4.本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊，而这种简化或省略不能用于限制本发明的范围。
5.鉴于上述现有存在的问题，提出了本发明。
6.因此，本发明提供了一种基于编辑距离的记忆能力评价方法，解决了现有技术方案可解释性差的问题，能够更好的扩充n-back范式的刺激类型和评价方式。
7.为解决上述技术问题，本发明提供如下技术方案，包括：采集被试记忆的原本数字串、被试作答出的数字串以及间隔的时间；利用编辑距离算法计算被试记忆的原本数字串、被试作答出的数字串的最短编辑距离；选取核函数，通过核函数计算遗忘信息比例，结合遗忘信息比例和间隔的时间，获得数据点；利用曲线拟合算法将数据点和对应艾宾浩斯遗忘曲线上的点进行拟合；若拟合结果符合期望条件，则根据所述拟合结果，对核函数的参数进行调整，获得最佳核函数；否则，则根据拟合失败的原因进行重新拟合/重新选择核函数；通过所述最佳核函数计算被试者的记忆率以对记忆能力进行评价；其中，数据点的横坐标为遗忘信息比例，纵坐标为间隔的时间。
8.作为本发明所述的基于编辑距离的记忆能力评价方法的一种优选方案，其中：包括：基于艾宾浩斯的原本记忆实验的关键点，选取间隔的时间。
9.作为本发明所述的基于编辑距离的记忆能力评价方法的一种优选方案，其中：包括：计算编辑距离时，若被试作答出的数字串长度大于被试记忆的原本数字串长度，则会将被试记忆的原本数字串依次与被试作答出的数字串中长度相等的长度进行编辑距离计算，编辑距离最小的作为最终结果。
10.作为本发明所述的基于编辑距离的记忆能力评价方法的一种优选方案，其中：包括：计算编辑距离时，若被试作答出的数字串长度小于被试记忆的原本数字串长度，则会根据所有的可能填充情况，在被试作答出的数字串前后分别填充无意义符号，将其补全至等长，并将其分别与被试记忆的原本数字串进行编辑距离计算，取编辑距离最小的作为最终结果。
11.作为本发明所述的基于编辑距离的记忆能力评价方法的一种优选方案，其中：选取核函数包括：选取拟合曲线函数作为核函数。
12.作为本发明所述的基于编辑距离的记忆能力评价方法的一种优选方案，其中：包括：由于记忆的特性，将完整记忆和完全忘记两种特殊情况纳入边界条件，即：
13.f(0,0,0)＝0
14.f(0,0,n)＝1
15.其中，在完全忘记情况下，所有编辑操作应为替换；n为记忆数字串的位长。
16.作为本发明所述的基于编辑距离的记忆能力评价方法的一种优选方案，其中：期望条件包括：核函数在预设的误差允许范围内贴合待拟合曲线；拟合结果可解释性高。
17.作为本发明所述的基于编辑距离的记忆能力评价方法的一种优选方案，其中：包括：基于n-back实验范式，并通过最佳核函数的函数类型与各权值大小设计混合记忆任务形式。
18.本发明的有益效果：本发明适用于混合记忆任务评价，并给出科学的理论支持，更好的扩充n-back范式的刺激类型和评价方式，为工作记忆相关研究提供新的方向。
附图说明
19.为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。其中：
20.图1为本发明第二个实施例所述的训练过程损失函数变化示意图；
21.图2为本发明第二个实施例所述的传统的技术方案与艾宾浩斯曲线的拟合效果示意图；
22.图3为本发明第二个实施例所述的本方法与艾宾浩斯曲线的拟合效果示意图。
具体实施方式
23.为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合说明书附图对本发明的具体实施方式做详细的说明，显然所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明的保护的范围。
24.在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。
25.其次，此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例，也不是单独的或选择性的与其他实施例互相排斥的实施例。
26.本发明结合示意图进行详细描述，在详述本发明实施例时，为便于说明，表示器件结构的剖面图会不依一般比例作局部放大，而且所述示意图只是示例，其在此不应限制本发明保护的范围。此外，在实际制作中应包含长度、宽度及深度的三维空间尺寸。
27.同时在本发明的描述中，需要说明的是，术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一、第二或第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。
28.本发明中除非另有明确的规定和限定，术语“安装、相连、连接”应做广义理解，例如：可以是固定连接、可拆卸连接或一体式连接；同样可以是机械连接、电连接或直接连接，也可以通过中间媒介间接相连，也可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。
29.实施例1
30.本提供了一种基于编辑距离的记忆能力评价方法，包括：
31.s1：采集被试记忆的原本数字串、被试作答出的数字串以及间隔的时间。
32.其中需要说明的是，为了能采集到更多的数据，需要在采集数据之前进行实验设计；因为最终需要通过艾宾浩斯曲线进行拟合，因此在实验设计上需要尽可能贴近艾宾浩斯的原本记忆实验；例如，实验可采用一种数字记忆方案：被试需要记忆一串无意义的数字串，例如541862等，在一定时间后被试者需要根据记忆对该数字串尽量进行回忆并记录自己的记忆部分。
33.为了后面更好的拟合曲线，本实施例基于参考艾宾浩斯的原本记忆实验的关键点，选取间隔的时间，如5分钟、30分钟、12小时、一天等；采集的数据包括被试记忆的原本数字串、被试作答出的数字串以及间隔的时间。
34.s2：利用编辑距离算法计算被试记忆的原本数字串、被试作答出的数字串的最短编辑距离。
35.其中需要说明的是，编辑距离是指两个字串之间，由一个转成另一个所需的最少编辑操作次数，如果它们的距离越大，说明它们越是不同；许可的编辑操作包括将一个字符替换成另一个字符，插入一个字符，删除一个字符；编辑距离多用于抄袭检测、拼字检测等方面；它将三种编辑操作以同一权值纳入统计，且只统计最少编辑情况的数据，例如计算12345和13425之间的编辑距离时，根据最少编辑情况视13425为12345先删除2：12345-》1345，再在4后面添加2：1345-》13425共两步编辑，而非将234依次替换为342的三步编辑。
36.将试记忆的原本数字串、被试作答出的数字串输入编辑距离算法计算编辑距离，算法依据编辑距离原理编写而成，能计算出最短编辑距离以及对应的三种编辑的次数。
37.例如：计算12345和13425的编辑距离，得到结果为最短编辑距离：2，其中替换编辑：0次，插入编辑：1次，删除编辑：1次。
38.为了更加贴合实际记忆情况，计算编辑距离时：
39.(1)若被试作答出的数字串长度大于被试记忆的原本数字串长度，则会将被试记忆的原本数字串依次与被试作答出的数字串中长度相等的长度进行编辑距离计算，编辑距离最小的作为最终结果。
40.例如：记忆的原本数字串为12345，被试作答出的数字串为123456，则会先后进行计算12345-12345以及12345-23456两组编辑距离，取最小，也就是第一组的结果作为最终结果。
41.(2)若被试作答出的数字串长度小于被试记忆的原本数字串长度，则会根据所有的可能填充情况，在被试作答出的数字串前后分别填充无意义符号，将其补全至等长，并将其分别与被试记忆的原本数字串进行编辑距离计算，取编辑距离最小的作为最终结果。
42.例如：记忆的原本数字串为12345，被试作答出的数字串为1234，用无意义符号*进行填充，则会先后进行计算12345-*1234以及12345-1234*两组编辑距离，取最小，也就是第二组的结果作为最终结果。
43.s3：选取核函数，通过核函数计算遗忘信息比例，结合遗忘信息比例和间隔的时间，获得数据点。
44.由于本方法需将函数与艾宾浩斯遗忘曲线相拟合，而遗忘曲线坐标点代表的含义是当前时间间隔后的遗忘信息比例，因此本实施例的核函数是一种使用编辑距离表示遗忘信息比例的模型。
45.本实施例选取拟合曲线函数作为核函数，拟合曲线函数根据函数类型不同可以分为线性函数以及对数函数、指数函数等，本实施例选择最简单的线性函数类型作为实例进行说明，记遗忘信息比例为f(x,y,z)，则有：
[0046][0047]
其中，x、y和z分别代表插入、删除和替换编辑的次数，a、b、c分别为其对应权值，n为被试记忆的原本数字串代表的记忆数据总信息量，在此公式中n使用被试记忆的原本数字串的长度(此处仅为演示性核函数)。
[0048]
若通过心理学角度对该公式进行解释，该公式将人的记忆信息失真分为三种情况：分别为信息缺失(删除)、信息增加(插入)以及信息错误(替换)，每一种情况均有一个权值表征发生该情况时对应信息的丢失率，而总的信息丢失率可以用三者线性表示。
[0049]
进一步的，将采集的数据代入选取的核函数中，获得遗忘信息比例，结合遗忘信息比例和间隔的时间，获得数据点，其中，数据点的横坐标为遗忘信息比例，纵坐标为间隔的时间。
[0050]
s4：利用曲线拟合算法将数据点和对应艾宾浩斯遗忘曲线上的点进行拟合。
[0051]
曲线拟合算法可以选择一些常用工具包，例如matlab的cftool工具库，或者选择蚁群算法、遗传算法等，一些深度学习算法也能起到不错的效果，例如线性神经网络去拟合线性函数等。
[0052]
在选择好曲线拟合算法后，需要对数据点和对应艾宾浩斯遗忘曲线上的点进行拟
合，而其拟合目的就是寻找一个确定的核函数，通过该核函数计算某一个时间间隔的遗忘信息比例。
[0053]
根据拟合结果，不断调整核函数的参数，若核函数选取的是s3提到的线性函数，则根据拟合结果不断调整参数a、b、c，参数的变化能改变函数的形态，最佳的参数组合能使得核函数形态最为接近待拟合曲线，即使得拟合曲线更接近原本的艾宾浩斯曲线。
[0054]
另外，由于记忆的特性，将完整记忆和完全忘记两种特殊情况纳入边界条件，即：
[0055]
f(0,0,0)＝0
[0056]
f(0,0,n)＝1
[0057]
其中，在完全忘记情况下，所有编辑操作应为替换；n为记忆数字串的位长。
[0058]
s5：若拟合结果符合期望条件，则根据拟合结果，对核函数的参数进行调整，获得最佳核函数f(x,y,z)；否则，则根据拟合失败的原因进行重新拟合/重新选择核函数。
[0059]
期望条件：
[0060]
(1)核函数在预设的误差允许范围内贴合待拟合曲线；
[0061]
(2)拟合结果可解释性高。
[0062]
例如：因为核函数为线性函数，所以三个参数的权值都不宜大于1，这意味着“完全忘记”情况的边界条件f(0，0，n)＝1将不再成立，插入和删除的权值和最好等于替换，因为从编辑操作角度，一次替换操作其实就是插入和删除的组合。
[0063]
s6：通过最佳核函数计算被试者的记忆率以对记忆能力进行评价。
[0064]
较佳的是，最佳核函数在心理学研究与记忆相关范式研究中都有巨大的意义，例如可以通过最佳核函数的函数类型与各权值大小深入研究工作记忆的机理，或者提出新的工作记忆模型，也可以基于n-back实验范式，并通过最佳核函数的函数类型与各权值大小设计混合记忆任务形式。
[0065]
实施例2
[0066]
为了对本方法中采用的技术效果加以验证说明，本实施例选择传统的技术方案和采用本方法进行对比测试，以科学论证的手段对比试验结果，以验证本方法所具有的真实效果。
[0067]
传统的技术方案：在记忆广度测量实验中，采用被试能回忆起的最长连续序列长度作为其记忆广度来评价被试的记忆能力，该方法存在较大误差，难以与艾宾浩斯遗忘曲线拟合。
[0068]
为验证本方法相对传统的技术方案具有较高科学性，本实施例中将采用传统的技术方案和本方法分别对实测的记忆数据进行记忆率计算，并与艾宾浩斯曲线进行对比。
[0069]
测试环境：首先设计记忆实验，参考艾宾浩斯的记忆实验进行设计，在每个trial中，被试被要求记忆一个无意义的单词，该单词由10个随机的字母排列组成；所有单词均无发音规律以避免被试产生逻辑联想，被试需要通过对每个字母按照一定频率进行标准朗读的方式对整个单词进行记忆，直到能够完全默诵出单词为止，此后开始计时，在计时时间内被试不允许在脑内重复单词或者任何其他的方式对单词进行复习强化记忆，在计时结束后被试被要求将单词复现并将答案写在纸张上，采集被试被要求记忆的单词、被试复现的单词以及记忆间隔时间作为一次实验数据；实验一共采集了40组数据，记忆间隔从5s到20min不等；采用上述实验采集到的测试样本，分别利用传统的技术方案与本文基于编辑距离的
记忆能力评价法。
[0070]
采用本方法，则运用python编写bp线性神经网络对线性核函数与艾宾浩斯遗忘曲线进行拟合，学习率为0.001，每个数据均重复学习1000次，计算平均点线距离作为损失函数，结果如图1所示；为了提高说服力，将数据中5min到20min时间间隔的20组数据作为训练集，将5到30s时间间隔的20组数据作为测试集，在拟合完成得到对应核函数后将测试数据分别带入核函数与传统记忆广度计算方式分别计算记忆率，并绘制对应时间间隔的艾宾浩斯遗忘曲线进行对比；根据两种方法计算出记忆率与艾宾浩斯遗忘曲线对应值之间的误差可以直观反映方法的优劣，结果如图2、图3所示，图2为传统的技术方案与艾宾浩斯曲线的拟合效果，图3为本方法与艾宾浩斯曲线的拟合效果，可见，本方法获得的拟合效果明显优于传统的技术方案。
[0071]
应当认识到，本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现，其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而，若需要，该程序可以以汇编或机器语言实现。在任何情况下，该语言可以是编译或解释的语言。此外，为此目的该程序能够在编程的专用集成电路上运行。
[0072]
此外，可按任何合适的顺序来执行本文描述的过程的操作，除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行，并且可作为共同地在一个或多个处理器上执行的代码(例如，可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
[0073]
进一步，所述方法可以在可操作地连接至合适的任何类型的计算平台中实现，包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现，无论是可移动的还是集成至计算平台，如硬盘、光学读取和/或写入存储介质、ram、rom等，使得其可由可编程计算机读取，当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外，机器可读代码，或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时，本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时，本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能，从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中，转换的数据表示物理和有形的对象，包括显示器上产生的物理和有形对象的特定视觉描绘。
[0074]
如在本技术所使用的，术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体，该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如，组件可以是，但不限于是：在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例，在计算设备上运行的应用和该计算设备都可以是组件。
一个或多个组件可以存在于执行中的过程和/或线程中，并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外，这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如，来自一个组件的数据，该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号，以本地和/或远程过程的方式进行通信。
[0075]
应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：磁盘阵列卡连接链路扩展方法、系统、终端及存储介质与流程

一种基于编辑距离的记忆能力评价方法

相关文献

最热文献