基于质谱的核酸指纹识别技术
仪器网 · 2012-07-14 23:42 · 55998 次点击
随着基因组计划的完成,对于基因的表达分析是后基因组时代所面临的迫切任务。而转录作为基因功能及与功能相关性研究的基础和出发点得到广泛关注,甚至提出转录组(transcriptome)这一概念。所谓转录组,就是一种生物表达的全部转录产物的总称;转录组研究是基因功能研究的最基本层次。转录组研究是复杂的大科学,离不开强有力的方法学支持,目前使用的转录组分析法来源于经典的基因组研究方法,包括分子杂交(hybridization)、PCR、测序(sequence)以及由此衍生的新方法,包括差异显示法(differentialdisplay)、基因表达系列分析法(serialanalysisofgeneexpression,SAGE)和DNA芯片技术等。上述方法应用于RNA的检测时,一般要把相应的RNA通过逆转录的方法转化为相应的DNA。但这些方法存在一些局限,如仅限于分析基因数量和现象,逆转录过程还会出现错误率高、模板二级结构干扰以及不能解析出RNA转录后的修饰等问题。转录组学的研究迫切需要更有力的方法。质谱作为检测物质的一种基本属性分子量的工具,不需要额外的染色和标记,容易自动化,因此质谱作为重要的研究手段得到广泛的关注。近年来,随着多项新技术的应用,质谱的分辨率、灵敏度及准确度达到很高的水平,ESI和MALDI离子化技术的发现为质谱的生物应用奠定基础;质谱在蛋白领域得到广泛的应用,积累丰富的经验;质谱在核酸研究领域也逐渐发挥重要的作用,在核酸的测序、定量、转录后修饰、蛋白和核酸相互作用等方面都有成功应用的范例。这里将介绍一种基于质谱的核酸分析新方法,可用于未知核酸样品基因组的定位和鉴别,称为核酸指纹识别技术,在介绍该技术之前,有必要首先介绍肽质量指纹图(peptidemassfingerprinting,PMF)技术,因为核酸指纹识别技术的研发,借鉴肽质量指纹图技术的许多思想。
1肽质量指纹图技术
肽质量指纹图技术是目前蛋白鉴定最常用的方法,在蛋白鉴定中发挥巨大作用。肽质量指纹技术的思路产生于1989年,直到1992年MALDI-TOF质谱的应用,该技术才得到广泛应用。该技术应用特异性的酶如胰蛋白酶、溶菌酶C等酶解蛋白质或肽后,再用质谱进行酶解产物的质量测定,得到一套具有特征性的肽质量图,通过与数据库中蛋白质理论酶解的肽质量相匹配来鉴定蛋白质。由于肽质量指纹图谱在鉴定蛋白质方面的巨大成功,科学家们试图把肽质量指纹图技术策略用于核酸研究。
2基于质谱的核酸指纹识别技术的历史
1985年,在DNA研究中就提出“指纹”概念,随后相继开发限制性片段长度多态性和小卫星等多种核酸指纹技术,这些技术被迅速广泛地应用于法医、人口学以及疾病诊断等领域。早期的核酸指纹技术,一般都使用色谱或电泳等分离手段,受到这些分离方法分辨率的限制。质谱作为核酸的检测工具,不依赖上述的分离方法。但质谱应用一直受离子加合作用、离子化技术以及分辨率低等问题的困扰。到上个世纪90年代,随着上述问题的解决,质谱在核酸研究领域中的应用快速增长。最近几年,质谱在核酸指纹识别方面的研究逐渐增多,从核酸的酶解、高分辨率核酸质谱以及核酸质谱分析算法等方面在理论和实践上都做积极的探索,终于成功地开发基于质谱的核酸指纹识别技术。
2.1开发基于质谱的核酸指纹识别技术基础和条件成功地开发基于质谱的核酸指纹识别技术,至少需具备如下几个条件:(1)获得适合质谱检测的核酸样品;(2)获得高质量的质谱图;(3)丰富的核酸序列数据库。
质谱检测的质量范围有限,而核酸的分子量差异很大,从几个核苷酸到上千个核苷酸,目前的质谱,虽然已成功应用于低于80个核苷酸的核酸分析,对上千个核苷酸的核酸,质谱还不能准确采集其分子量。因此,用质谱检测,就必须把高分子量的核酸剪切成小片段,使质谱检测成为可能。在brenda酶数据库中,共收集25种核酸内切酶,它们来源于311不同的生物种属,这些都是可供选择的工具酶。Hahner等系统研究核酸酶T1、U2、PhyM、A、CL3、cusativin,在不同条件下对核酸的酶解效果,发现含Na、K的缓冲液对随后的MALDI-TOF质谱分析干扰很大,而用Tris-HCl以及铵盐缓冲液干扰很小。T1、U2核酸酶解后的5'端离子质谱峰明显,而3'端的离子信号较弱。而核酸酶CL3、cusativin对切割条件的要求苛刻,核酸酶PhyM(ApN和UpN)、核酸酶A(UpN和CpN)为多位点切割。Zhang等用计算机模拟核酸酶T1、A切割1921条完整的16s核糖体RNA,发现9个碱基及其以上序列可以提供关于核酸来源的信息,根据其独特的质谱图可判断微生物的种类。通过比较,发现核酸酶T1在产生特征性的寡核苷酸方面优于核酸酶A。Zhang的同事们通过质谱检测核酸酶T1处理的大约400bp左右16srRNA的PCR产物,成功用于细菌的聚类分析(Clusteranalysis)。Mahmud等用计算机模拟RNA酶T1、A、U2切割46个E.coli的转运RNA,预测到31/46产生特异性的RNA酶T1标签,40/46产生特异性RNA酶U2标签,32/46产生RNA酶A特异性标签,当组合使用多种酶时,特异性标签比例更高。从理论上证明通过RNA酶解的方法可以识别不同的tRNA。为验证该方法的可行性,把不同的tRNA混合、酶解,质谱分析可以证实混合物中各tRNA的存在,接着研究细菌的总tRNA,发现RNA酶A可发现19个不同的tRNA家族,RNA酶T1可发现13个不同的tRNA家族。获得高质量核酸质谱图对核酸质谱技术的应用也非常关键。和蛋白的20多种氨基酸种类相比,
核酸只含有4种碱基,而且U和C的分子量差别为1Da,在质谱分析时,常由于大量的分子量相等或仅差1Da的谱峰的出现,导致结果分析的不确定性。因此质谱的质量准确度对其在核酸研究中的应用起决定作用。问题的解决依赖于质谱技术的进步。最近质谱技术取得很大进展,新技术的使用使质谱达到很高的分辨率及质量准确度。傅立叶变换-离子回旋共振质谱(FourierTransformionCyclotronResonanceMassSpectrometer,FT-ICR-MS)具有超高质谱分辨率,分辨率超过105,质量准确度达1~2ppm。但FT-ICR-MS高昂的价格和运行成本阻碍其广泛的应用。TOF在分辨率方面稍差一些,但质量准确度方面和傅立叶变换-离子回旋共振质谱类似,由于其有很宽的质量检测范围,且使用方便,在核酸领域应用广泛。ThermoFisher科学仪器公司最近推出LTQorbitrap质谱仪。该机器使用线性离子阱实现离子分离、裂解以及多级质谱功能。它在质量准确度、分辨率、动态范围、灵敏度以及多级质谱能力等方面具有明显优势,具有高达300000的分辨率,质量准确度为2~5ppm。通过在样品内加入标准品,还可以进一步提高质谱准确度。对核酸指纹技术开发具有巨大贡献的另一个重要领域是基因测序技术的发展,从而获得多种生物体的大量序列信息,通过生物信息学的处理,建立包括核糖体RNA、转运RNA、非编码RNA、小RNA、不同生物体的mRNA数据库。通过计算机程序,调用这些数据库的数据,可以模拟这些RNA的酶解产物,通过和质谱采集的核酸数据比对,可以获得样品的相关信息。
2.2基于质谱的核酸的指纹识别技术
随着上述领域的发展,已经具备核酸指纹技术所需的条件,最近有两个机构几乎同时报告基于质谱的核酸的指纹识别技术。Nakayama等设计思想(见图1)。
他们建立一个网络数据库搜索工具—Aridne,
[attach]50578[/attach]
工具客户端主要是输入搜索参数和质谱数据,而在服务器端提供核酸的模拟数据库。客户端输入的质谱数据来自于质谱采集的RNA酶T1处理的样品;服务器端数据库是通过调用公共数据库的数据,经过处理,形成模拟的RNA酶T1处理的RNA酶解数据库。通过比对质谱数据和模拟数据库,获得所有匹配的目标片断。但单纯和质谱数据匹配的片断,还不足以用来确定RNA的类别。因此进一步通过概率计分算法,把多个匹配的片断排列到数据库中,计算每个匹配序列的排列计分(mappingscore),所谓的排列计分,就是根据所有片断的相对频率计算出的概率的自然对数的负数,该数值大于一定的阈值后,可以特异性的挑选出数据库中的匹配序列,从而可以判断出所检测的RNA的种类。为验证该方法的可靠性,用RNA酶T1处理的体外转录的已知RNA标本,通过纳升级的电喷雾离子泵把样品送入LTQ-orbitrap或四极杆TOF串联质谱采集质谱数据,通过该方法,他们成功地从数据库中搜索到该RNA。该方法还成功应用于从tRNA混合物中发现未知RNA成分,并可以分析出序列中是否含有转录后的修饰。如果想了解更多有关信息,可以浏览http://aridane.riken.jp/。Matthiesen等也在同一期杂志上独立地发表与Nakayama等类似的成果,同样用RNA酶T1处理核酸样品(里面含有所来源核酸的特异性指纹),同样充分利用目前公开的核酸数据库作为搜索对象。他们都是计算每个片断的概率以及某序列中所有匹配片断的总概率,但两研究组之间计算概率的方法不同。还有,Matthiesen和Nakayama在挑选目标RNA的算法上也不一样。Nakayama采用排列计分(mappingscore)的阈值挑选出目标RNA,而Matthiesen采用计算Z分的方式。Matthiesen成功开发出软件RMM(RNAMassMapping),该软件可以用来判定所测定的RNA序列种类和其在基因组中的位置。其策略如下:首先通过酶解的方法把所测定的RNA剪切成小片段,用MALDI-TOF读出分子量,得到该序列不同片段RNA的分子量列表;同时获取该RNA来源种属的全基因序列。把上述质谱分子量列表和全基因序列同时调入RMM软件,软件会自动完成如下任务:(1)产生基因组全序列的互补序列;(2)找出各不同RNA片段在基因组中的位置;(3)按一定的算法以及用户定义的RNA片段长度对匹配的片段计分;(4)对所有可能的RNA序列进行计分;(5)输出结果。他们也通过实验对该软件的实际应用进行验证。考虑到用RNA酶T1裂解的核酸比RNA酶A的大,可以提供更多有价值的信息,在本实验中,选用RNA酶T1处理核酸,用perspetivevoyagerSTR质谱仪以反射TOF模式检测分子量。首先把来源于H.marismortui的23srRNA的酶解核酸片段和H.marismortui的基因组进行比对,3个最佳匹配均位于2305~2627,这说明该方法在基因定位方面很可靠。然后用该软件分析来源于B.stearothermophilus的5srRNA,因为缺乏B.stearothermophilus基因组数据,选择与其基因相近的Geobacillusthermodenitrificans的基因组,所发现的序列全为该种属的5srRNA,这说明用该方法可以从相近种属的数据库中获得目标序列的种类。他们还把来源于T.thermophilus和E.coli的16srRNA的酶解质谱数据和核糖体数据库项目中的模拟酶解数据库进行比较。在来源于T.thermophilus序列的数据库搜索的结果中,20个最好的匹配中有19个为T.thermophilus序列,而来源与E.coli的搜索结果中3个最佳匹配分别来源与E.coli、hafniaalvei和shigelladysenteriaesd197,而这3个种属的序列同源性达到98%以上。这说明通过该方法,可以判断目标片段的种属来源。该软件可以从HTTP://yass.sdu.dk/RMM/下载。
3总结和展望
在众多科学家不懈努力下,成功地开发基于质谱的核酸指纹识别技术,就像多肽指纹技术在蛋白质组学中巨大贡献一样,相信基于质谱的核酸指纹识别技术的强大功能将在核酸领域里得到广泛应用。当然,作为一个新技术,目前还不完善,比如RMM软件,随着基因组数据增加,计算越来越复杂,目前只在基因组相对简单的原核细胞中应用,是否可以用于复杂的真核细胞,还不确定;质谱的采集、标记、软件输入等自动化、集成化数据处理方面也略显不足。随着更多的研究者研究和使用这一技术,将会得到更大发展。还有,随着大量的核酸质谱数据的获得,对数据的总结和共享,建立基于核酸质谱数据的核酸数据库及其搜索技术,将会进一步丰富和完善核酸指纹识别技术。相信在未来几年内,将会有大量关于这一技术应用的成果出现。
来源:《现代仪器》,转载请注明出处-仪器信息网(www.cncal.com)