一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

质谱分析数据显示处理装置及计算机可读介质的制作方法

2022-03-05 00:13:46 来源:中国专利 TAG:


1.本发明涉及一种质谱分析数据显示处理装置。


背景技术:

2.近年来,开发了一种利用了质谱分析的微生物的识别方法。在该方法中,首先,利用使用了maldi(matrix assisted laser desorption/ionization:基质辅助激光解吸离子化法)等软离子化法的质谱分析装置对含有从被检微生物提取出的蛋白质的溶液或被检微生物的悬浮液等进行分析。此外,“软”离子化法是指不易发生高分子量化合物的分解的离子化法。然后,通过将得到的质谱与已知微生物的质谱进行对照,来确定被检微生物的属、种或株等。这种方法将质谱图案作为各微生物所特有的信息(即指纹)来利用,因此被称为指纹法。
3.但是,在指纹法中,没有针对在质谱上出现的各峰逐一地确定源自哪种蛋白质,在鉴定的理论依据和可靠性方面存在问题。因此,为了解决该问题,开发了以下方法:利用对微生物体进行质谱分析而得到的峰的大约一半源自核糖体蛋白质这一点,将通过质谱分析得到的峰的质荷比与根据翻译核糖体蛋白质基因的碱基序列信息得到的氨基酸序列而推测出的计算质量建立关联,由此使作为该峰的来源的蛋白质的种类归属于该峰(例如,参照专利文献1)。根据该方法,能够使用质谱分析进行基于理论依据的可靠性高的微生物鉴定。
4.现有技术文献
5.专利文献
6.专利文献1:日本特开2007-316063号


技术实现要素:

7.发明要解决的问题
8.为了使作为质谱峰的来源的蛋白质的种类归属于该质谱峰,需要各种微生物的基因组信息或蛋白质信息。近年来,微生物的基因组解析正在发展,如果获知微生物的种等,则能够容易地获知该微生物的基因组碱基序列、该基因组碱基序列上的各基因的位置、各基因的碱基序列、由各基因进行编码的蛋白质名称、各蛋白质的氨基酸序列等信息(以下,称为“基因组关联信息”)。
9.但是,在以往的利用了质谱分析的微生物解析中存在以下问题:解析担当者难以直观地理解通过被检微生物的质谱分析得到的质谱与如上述那样的现有的基因组关联信息之间的关系。
10.本发明是鉴于上述问题而完成的,其目的在于,呈现被检微生物的质谱和现有的基因组关联信息,使得解析担当者能够容易地理解两者的关系。
11.用于解决问题的方案
12.为了解决上述问题而完成的本发明所涉及的质谱分析数据显示处理装置使通过质谱分析得到的数据显示在显示装置的画面上,所述质谱分析数据显示处理装置具有:
13.谱获取部,其获取对被检微生物进行质谱分析而得到的质谱;
14.基因组关联信息获取部,其获取基因组关联信息,所述基因组关联信息包含由根据所述质谱而被估计为与所述被检微生物相同或相关的已知微生物的基因组进行编码的多个蛋白质的信息、以及表示对所述多个蛋白质的各个蛋白质进行编码的多个基因在所述基因组上的位置的信息;
15.对应关系确定部,其基于所述质谱和所述基因组关联信息,来确定所述质谱上的多个峰与所述多个蛋白质的对应关系;以及
16.显示控制部,其使标识符及基因组图谱与所述质谱一起显示在所述画面上,其中,所述标识符是对所述多个峰中的至少一部分峰赋予的、表示被赋予的峰与由所述对应关系确定部确定的所述多个蛋白质中的某一个蛋白质的对应关系的标识符,所述基因组图谱是基于所述基因组关联信息制作出的、表示所述多个基因在所述基因组上的位置的基因组图谱。
17.发明的效果
18.根据上述本发明所涉及的质谱分析数据显示处理装置,能够呈现被检微生物的质谱与现有的基因组关联信息,使得解析担当者能够容易地理解两者的关系。
附图说明
19.图1是本发明的一个实施方式所涉及的质谱分析系统的概要结构图。
20.图2是示出该实施方式所涉及的质谱分析系统的处理过程的流程图。
21.图3是示出该实施方式的画面显示的一例的图。
22.图4是示出在该实施方式中由用户进行峰选择后的画面显示的一例的图。
23.附图标记说明
24.10:质谱分析部;20:解析部;30:存储部;32:谱制作程序;33:微生物识别程序;34:微生物识别用数据库;35:显示处理程序;36:对应关系存储部;41:谱获取部;42:基因组关联信息获取部;43:对应关系确定部;44:基因组图谱生成部;45:显示控制部;52:基因组数据库;60:显示画面;70:基因组图谱;80:质谱;81:峰标签;82:标记;90:蛋白质信息显示栏。
具体实施方式
25.下面,参照附图对用于实施本发明的方式进行说明。图1是本实施方式所涉及的质谱分析系统的概要结构图。该质谱分析系统包括质谱分析部10和解析部20(作为本发明所涉及的质谱分析数据显示处理装置的一个方式)。
26.质谱分析部10具备:离子化部11,其通过基质辅助激光解吸离子化法(maldi)将试样中的分子、原子进行离子化;以及飞行时间型质量分离器(tof)12,其根据质荷比将从离子化部11射出的各种离子分离。tof 12具备:引出电极13,其用于从离子化部11引出离子并将其导入tof 12内的离子飞行空间;以及检测器14,其检测在离子飞行空间内被进行质量分离后的离子。但是,质谱分析部10的结构不限于此,能够进行各种变形。
27.解析部20的实体是工作站、个人计算机等计算机,作为中央运算处理装置的cpu(central processing unit:中央处理单元)21与存储器22、由lcd(liquid crystal display:液晶显示器)等构成的显示部23、由键盘、鼠标等构成的输入部24及由硬盘、ssd
(solid state drive:固态驱动器)等大容量存储装置构成的存储部30相互连接。在存储部30中存储有os(operating system:操作系统)31、谱制作程序32、微生物识别程序33以及显示处理程序35(作为本发明所涉及的程序的一个方式)。另外,在存储部30中存储有微生物识别用数据库34,并且设置有对应关系存储部36。解析部20还具备接口(i/f)25,该接口(i/f)25用于负责与外部装置的直接连接或经由lan(local area network:局域网)或因特网等网络与外部装置等的连接,解析部20从该接口25经由网络线缆nw(或无线lan)或者因特网51与质谱分析部10及基因组数据库52连接。
28.在图1中,以与显示处理程序35相关联的方式示出了谱获取部41、基因组关联信息获取部42、对应关系确定部43、基因组图谱生成部44以及显示控制部45。它们基本上都是通过由cpu 21执行显示处理程序35来以软件形式实现的功能单元。此外,显示处理程序35未必需要是单个程序,例如也可以是嵌入在微生物识别程序33中或嵌入在用于控制质谱分析部10的程序的一部分程序中的功能,其形式没有特别地限制。此外,作为微生物识别程序33,例如能够利用通过现有的指纹法进行微生物识别的程序等。
29.另外,在图1中设为以下结构:在用户操作的终端中搭载谱制作程序32、微生物识别程序33、显示处理程序35、微生物识别用数据库34以及对应关系存储部36,但也可以设为以下结构:将其中的显示处理程序35以外的一部分或全部程序设置在通过计算机网络与所述终端连接的其它装置内,按照来自所述终端的指示来执行基于设置在所述其它装置内的程序的处理和/或对数据库的访问。另外,在图1中,设为基因组数据库52经由因特网51与用户操作的终端进行连接,但不限于此,也可以在与所述用户操作的终端配置在同一设施内的其它终端中搭载基因组数据库52,或者在设置于所述用户操作的终端的存储部30中搭载基因组数据库52。
30.在微生物识别用数据库34中登记有与多个已知微生物有关的质量列表。该质量列表是列举了在对各已知微生物进行质谱分析时所检测出的离子的m/z的列表,该质量列表除了包含该m/z的值以外,还至少包含该已知微生物所属的分类群(科、属、种或株等)的信息(分类信息)。能够基于预先通过与所述质谱分析部10所使用的方法相同的离子化法及质量分离法对各种已知微生物实际进行质谱分析所得到的数据(实测数据)来制作这样的质量列表。在根据所述实测数据制作质量列表时,首先,从作为所述实测数据而获取到的质谱中提取在规定的m/z范围内出现的峰。此时,通过将所述m/z范围设为2,000~35,000左右,能够提取主要源自蛋白质的峰。另外,通过仅提取峰的高度(相对强度)为规定的阈值以上的峰,能够排除不期望的峰(噪声)。此外,由于核糖体蛋白质群在细胞内大量地表达,因此通过适当地设定所述阈值,能够将质量列表中记载的m/z的大部分设为源自核糖体蛋白质的部分。然后,按每种所述已知微生物将通过以上方式提取出的峰的m/z及该峰的强度进行列表化,在附加了所述分类信息等之后登记到微生物识别用数据库34中。此外,为了抑制由培养条件引起的基因表达的偏差,期望预先将用于采集所述实测数据的各已知微生物的培养条件进行标准化。
31.在基因组数据库52中登记有与多个已知微生物中的各个已知微生物相关的多个基因组关联信息。在所述基因组关联信息中例如包含基因组碱基序列、基因组碱基序列上的各基因的位置、各基因的碱基序列、由各基因进行编码的蛋白质的名称以及这些蛋白质的氨基酸序列等。这些基因组关联信息与所述已知微生物的标识符(例如,该微生物的登记
编号等)、微生物名称(属名称、种名称或株名称等)等相关联地存储。作为这样的基因组数据库52,例如能够利用国际组织所提供的公共的数据库(genbank、embl或ddbj等)等。
32.参照图2的流程图对使用了本实施方式所涉及的质谱分析系统的微生物的解析过程以及质谱分析数据的显示过程进行说明。
33.首先,用户对含有被检微生物的构成成分的试样进行制备,将其放置在质谱分析部10的离子化部11中来执行质谱分析。此时,作为所述试样,除了能够使用被检微生物的微生物体提取物或将核糖体蛋白质等的细胞构成成分从微生物体提取物中纯化所得到的物质以外,还能够直接使用微生物体或细胞悬浮液。
34.当由质谱分析部10执行被检试样的分析时,解析部20的谱制作程序32经由接口25获取由质谱分析部10的检测器14获取到的检测信号,并基于该检测信号制作被检微生物的质谱(步骤s11)。
35.接着,微生物识别程序33将在步骤s11中生成的所述被检微生物的质谱与在微生物识别用数据库34中收录的各已知微生物的质量列表进行对照,提取具有与所述被检微生物的质谱类似的m/z模式的质量列表、例如含有大量的、m/z与所述被检微生物的质谱中的各峰在规定的误差范围内一致的离子的质量列表(步骤s12)。
36.接着,微生物识别程序33通过参照与在步骤s12中提取出的质量列表相对应地存储在微生物识别用数据库34中的分类信息,来确定与该质量列表对应的已知微生物的分类(例如,种或属)(步骤s13)。
37.此外,在预先通过其它方法确定了被检微生物的分类的情况下,不经过基于微生物识别程序33的处理(即,步骤s12和s13)就进入以下的基于显示处理程序35的处理(即,步骤s14~s19)即可。
38.接着,显示处理程序35的谱获取部41获取在步骤s11中生成的被检微生物的质谱。
39.接着,基因组关联信息获取部42经由接口25和因特网51访问基因组数据库52,来获取与在步骤s13中确定的分类对应的已知微生物(即,被估计为与所述被检微生物相同或相关的已知微生物)的基因组关联信息(步骤s14)。具体地说,例如,在步骤s13中确定了被检微生物所属的种的情况下,基因组关联信息获取部42以该种名称为查询条件来检索基因组数据库52,获取属于该种的已知微生物的基因组关联信息。
40.此外,在基因组数据库52中登记有与属于在步骤s13中确定的分类的多个微生物种或多个微生物株有关的基因组关联信息的情况下,获取与所述多个微生物种或微生物株中的模式种(type species)或模式株(type strain)有关的基因组关联信息。另外,在基因组数据库中登记有表示与各已知微生物有关的基因组关联信息的可靠性的信息的情况下,可以获取所述多个微生物种或微生物株的基因组关联信息中的可靠性最高的信息。例如,在上述公共数据库中有时登记有表示各微生物株的基因组解析的进展状况的“finished(完成)”、“permanent draft(永久草案)”或“draft(草案)”等状态信息。在这种情况下,基因组关联信息的可靠性按“finished”、“permanent draft”、“draft”的顺序从高到低。此外,在存在多个基因组关联信息的可靠性为相同程度的微生物种或微生物株的情况下,可以获取其中的模式种或模式株的基因组关联信息。
41.此外,在此,在步骤s14中,设为基因组关联信息获取部42自动地检索基因组数据库52来获取恰当的基因组关联信息,但不限于此,也可以设为通过用户利用输入部24进行
规定的操作来进行以在步骤s13中确定的分类名称为查询条件的基因组数据库52的检索,基因组关联信息获取部42从基因组数据库52获取与用户从该检索结果中选择出的已知微生物有关的基因组关联信息。
42.另外,在图1中仅示出了单个基因组数据库52,但本实施方式的基因组关联信息获取部42也可以从相互独立的多个基因组数据库(例如,各不相同的组织所提供的数据库等)获取如上所述的基因组关联信息。
43.接着,对应关系确定部43基于在步骤s11中生成的质谱和在步骤s14中获取到的基因组关联信息,来确定所述质谱上的各峰与在所述已知微生物中表达(或被估计为表达)的蛋白质的对应关系(步骤s15)。具体地说,首先,对应关系确定部43从在步骤s14中获取到的所述基因组关联信息中提取规定的蛋白质的氨基酸序列。此外,所述规定的蛋白质既可以是与该已知微生物相关地被登记在基因组数据库52中的所有蛋白质,也可以是用户预先指定的一部分蛋白质(例如核糖体蛋白质的全部或一部分)。接着,对应关系确定部43通过根据所述氨基酸序列进行计算来求出所述规定的蛋白质的计算分子量,再将该计算分子量转换为所述规定的蛋白质的理论m/z。在此,理论m/z是指被推测为在对该蛋白质进行质谱分析时会被检测出的离子的m/z。已知在通过伴随基于maldi进行的试样的离子化进行的质谱分析来分析生物体试样时,主要检测出[m h]

(m为分子,h为氢原子)、[m-h]-或[m na]

(na为钠原子)等分子量关联离子。因而,只要确定了质谱分析条件,就能够容易地进行从各蛋白质的计算分子量向所述理论m/z的转换。此外,在基因组数据库52中收录有在所述已知微生物中表达(或被估计为表达)的蛋白质的计算分子量的情况下,也可以使用该计算分子量来计算所述理论m/z。接着,对应关系确定部43针对各个所述规定的蛋白质,从所述被检试样的质谱中搜索在规定的误差范围内与以上求出的理论m/z一致的峰。然后,针对发现了一致的峰的蛋白质,判断为该蛋白质是与该峰对应的蛋白质,并将该蛋白质与峰的对应关系存储在对应关系存储部36中。
[0044]
接着,基因组图谱生成部44基于在步骤s14中获取到的基因组关联信息,来生成表示所述已知微生物的基因组碱基序列上的各基因的位置的基因组图谱(步骤s16)。
[0045]
接着,在显示控制部45的控制下,在显示部23的画面上显示在步骤s11中生成的质谱80、表示在步骤s15中确定的对应关系的峰标签(相当于本发明中的标识符)81以及在步骤s16中生成的基因组图谱70(步骤s17)。
[0046]
图3示出此时的画面显示的一例。在该图的例子中,在显示画面60的上部显示有基因组图谱70,在显示画面60的下部显示有所述被检微生物的质谱80。
[0047]
并且,在质谱80上的多个峰中的在步骤s15中被确定了所对应的蛋白质的峰处显示有表示与该峰对应的蛋白质的名称的峰标签81。例如,在该图的例子中用字符串“l36”表示的峰标签81意味着该峰是与“核糖体蛋白质l36”对应的峰。
[0048]
在显示部23中显示有这样的显示画面60的状态下,当用户经由输入部24选择质谱80上的某一个峰(在步骤s18中为“是”)时,如图4所示那样在显示画面60上强调显示该峰(以下称为“选择峰”)(即,在选择峰的附近显示标记82),并且,在步骤s15中确定了与所述选择峰对应的蛋白质的情况下,在显示画面60的上部右侧显示蛋白质信息显示栏90,该蛋白质信息显示栏90用于显示与对应于所述选择峰的蛋白质(以下称为“选择蛋白质”)有关的信息(步骤s19)。此外,例如通过用户在显示画面60上点击任意的峰或峰标签81来进行用
户对峰的选择。在此,本实施方式的显示控制部45和输入部24相当于本发明中的峰选择受理部。
[0049]
此外,在图4中,作为所述强调显示的一例,示出了在选择峰的附近赋予表示该峰是选择峰的标记82的情况,但所述强调显示不限定于此,例如也可以用与其它峰不同的颜色或粗细来显示选择峰,或者用与其它峰标签不同的颜色或字体来显示对选择峰赋予的峰标签。另外,也可以除了所述选择峰的强调显示以外,还强调显示对选择蛋白质进行编码的基因在基因组图谱70上的位置。
[0050]
蛋白质信息显示栏90具有从基因组图谱70上的对所述选择蛋白质进行编码的基因的位置延伸出的对话框状的形状。在蛋白质信息显示栏90中显示作为与所述选择蛋白质有关的信息的、该选择蛋白质的名称、对该选择蛋白质进行编码的基因的碱基序列、基因组数据库52上的该基因的识别编号、所述选择蛋白质的氨基酸序列及理论m/z以及基因组数据库52上的该选择蛋白质的识别编号等信息。
[0051]
这样,根据本实施方式所涉及的质谱分析系统,被检微生物的质谱和现有的基因组关联信息以用户能够容易地理解两者的关系的方式进行显示,因此例如即使是对质谱解析不熟练的微生物研究者等,也能够容易地掌握被检微生物的质谱分析结果。
[0052]
[各种方式]
[0053]
本领域技术人员能够理解的是,上述例示性的实施方式是以下方式的具体例。
[0054]
(第一项)本发明的一个方式所涉及的质谱分析数据显示处理装置使通过质谱分析得到的数据显示在显示装置的画面上,所述质谱分析数据显示处理装置具有:
[0055]
谱获取部,其获取对被检微生物进行质谱分析而得到的质谱;
[0056]
基因组关联信息获取部,其获取基因组关联信息,所述基因组关联信息包含由根据所述质谱而被估计为与所述被检微生物相同或相关的已知微生物的基因组进行编码的多个蛋白质的信息、以及表示对所述多个蛋白质的各个蛋白质进行编码的多个基因在所述基因组上的位置的信息;
[0057]
对应关系确定部,其基于所述质谱和所述基因组关联信息,来确定所述质谱上的多个峰与所述多个蛋白质的对应关系;以及
[0058]
显示控制部,其使标识符及基因组图谱与所述质谱一起显示在所述画面上,其中,所述标识符是对所述多个峰中的至少一部分峰赋予的、表示被赋予的峰与由所述对应关系确定部确定的所述多个蛋白质中的某一个蛋白质的对应关系的标识符,所述基因组图谱是基于所述基因组关联信息制作出的、表示所述多个基因在所述基因组上的位置的基因组图谱。
[0059]
根据第一项所述的质谱分析数据显示处理装置,用户能够一次性地掌握所述质谱的各峰对应于哪种蛋白质以及对该蛋白质进行编码的基因存在于所述基因组上的何处。
[0060]
(第二项)关于本发明的另一方式所涉及的质谱分析数据显示处理装置,在第一项所述的质谱分析数据显示处理装置中,
[0061]
还具有峰选择受理部,所述峰选择受理部用于使用户在所述画面上显示的所述质谱上从所述多个峰中选择某一个峰,
[0062]
在借助所述峰选择受理部选择了所述某一个峰时,所述显示控制部在所述基因组图谱上强调显示对所述多个蛋白质中的与该峰对应的蛋白质进行编码的基因的位置。
[0063]
根据第二项所述的质谱分析数据显示处理装置,用户仅通过选择某一个峰,就能够直观地理解与该峰对应的基因在所述基因组上的位置。
[0064]
(第三项)关于本发明的另一方式所涉及的质谱分析数据显示处理装置,在第一项所述的质谱分析数据显示处理装置中,
[0065]
还具有峰选择受理部,所述峰选择受理部用于使用户在所述画面上显示的所述质谱上从所述多个峰中选择某一个峰,
[0066]
所述基因组关联信息还包含所述多个蛋白质的氨基酸序列或对该蛋白质进行编码的基因的碱基序列的信息,
[0067]
在借助所述峰选择受理部选择了所述某一个峰时,所述显示控制部还在所述画面上显示所述多个蛋白质中的与该峰对应的蛋白质的氨基酸序列或对该蛋白质进行编码的基因的碱基序列。
[0068]
根据第三项所述的质谱分析数据显示处理装置,用户仅通过选择某一个峰,就能够容易地参照与该峰对应的蛋白质的氨基酸序列或基因的碱基序列。
[0069]
(第四项)本发明的另一方式所涉及的程序是一种用于使计算机作为根据第一项~第三项中的任一项所述的质谱分析数据显示处理装置发挥功能的程序。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献