近红外显微图像的主成分法图像处理
仪器网 · 2012-07-14 23:42 · 58381 次点击
引言
近红外光谱分析是一种对样品不需要复杂的预处理,能进行原位分析,扫描速度快,而且不需要大量的有机溶剂,对环境友好的现代仪器分析技术,目前已经成熟地被应用于农产品、中草药等诸多领域的分析中。显微近红外图像的分析是基于近红外光谱分析技术的一种将图像学和光谱学相结合的仪器分析方法。微区分析是分析化学领域里一个具有挑战性的课题,近红外显微成像技术是其中之一。近红外显微镜同时记录样品的空间和光谱的信息,包含四个变量:平面位置的两个坐标、波长和对应的吸光度。一般显微红外光谱图像采用总吸收光谱成像和特征波长下的吸光度值成像。在红外光谱中特征波长总是与分子官能团相联系的,特征波长吸光度值与样品中所含的化学成分相关,因此特定波长的吸光度图像也是样品中特定化学成分分布,该图像也称为化学成像。
但是近红外光谱重叠严重,光谱峰特征不显著,一般每个波长的吸收值都是多种化学成分吸收值的加和,因此不能直接采用化学成像方法获得单一化学成分分布图像。主成分分析(principlecomponentanalysis,PCA)是一种常用的数据特征提取方法,它把原始数据矩阵的协方差阵进行分解,得到各特征值λ以及相应的特征向量(也称主成分PC),然后用样本在特征向量所构成的主成分空间中的投影值(也称得分值SCORE)来描述原来光谱的特征信息,即原光谱可以看成是特征向量的线性组合,线性组合系数为得分值。将主成分分析算法引入近红外光谱图像分析的目的是对原光谱进行剥离,消除光谱峰重叠的影响,以特征向量的得分值成像代替单一波长吸收值化学成像,从而获得单一化学成分分布图像。本文将主成分分析算法应用于近红外显微成像的图像处理中,目的是从鸡胸部肌肉样品的原始总吸收图像中提取出与蛋白质相关的光谱信息,并去除噪声和污染物的干扰,获得样品中蛋白质成分分布图。
1实验部分
1.1试剂、仪器与实验样品
实验使用的样品是6个周龄鸡的胸部肌肉,经混合液(福尔马林∶水=1∶9)固定,用石蜡包埋,垂直肌纤维方向制作横切切片,进行苏丹-苏木素染色(见图1)。肌肉细胞组织制作成切片后厚度大约为30μm。
[attach]50568[/attach]
图1鸡的胸部细胞肌肉经染色制作成细胞组织切片
测试仪器为傅立叶近红外显微镜Spotlight350(MCT二极管阵列检测器)和配套软件Spotlightv.1.1和Spectrumv.303(PerkinElmer公司)。
1.2近红外光谱图像的采集
近红外光谱图像采集使用透射图像测定模式。检测空间分辨率6.25×6.25μm,波长范围5500~4000cm-1,波数分辨率为16cm-1,每个象素点的扫描次数为64次,背景扫描240次。
样品可见光预览图像扫描范围为1000×1000μm(见图2A)。选定其中红框区域进行近红外图像扫描,扫描区域大约为400×350μm,总吸收图像结果(见图2B),其中的横纵坐标代表样品的空间位置坐标。可以看出,近红外显微镜直接扫描出来的总吸收图像并不能够很好地描述肌肉细胞组织结构,因为总吸收图像既包含各种化学成分信息,也包含有很多干扰因素,包括光谱噪声、外界环境和仪器本身因素的干扰,要排除这些干扰,获得清晰准确的肌肉细胞组织结构图像,就需要对总吸收图像做进一步的处理。
[attach]50569[/attach]
2数据处理与分析
2.1光谱预处理
为提高图像中原光谱质量,对原始光谱进行5点B-A平滑和归一化处理(Normalize)。平滑作用是去除光谱中的随机噪声(见图3),归一化处理可以消除光谱之间的易变性,减少散射光谱背景影响。可看出处理后光谱上的噪声信号明显减少。
[attach]50570[/attach]
2.2近红外光谱图像特征的主成分分析提取主成分分析是一种提取信息特征的方法,它将光谱信息分解,以有限的因子数(factor)来描述光谱的主要信息。每个因子相对独立,与其对应的因子得分图像(scoreimage)可以很好表达样品的显微结构特征和成分分布的信息。因子个数的确定因样品的复杂程度不同而异,如样品组成很复杂,则应多设因子数,样品简单便可少设几个。因子个数的选择非常重要,如果因子个数过多,可能将有用的信息分散;如果因子个数过少会使信息重叠,相对弱一点的信息就表达不出来。
本实验对图2A中的红色矩形区域扫描显微近红外图像,采用6.25×6.25μm的空间分辨率,共采集近红外光谱3192张。对这些近红外光谱进行主成分分析,得到光谱第一到第八主成分载荷向量图(见图4),与其对应的得分图像(Scoremap)(见图5)。
[attach]50571[/attach]
[attach]50572[/attach]
2.3图像分析
从图5中可以看出,factor3的得分图像与图2A中选择区域的轮廓大致相当,由此推测,原光谱主成分分析后的第三个主成分向量与肌肉细胞组织化学成分相对应。为验证这个推测,测定烘干后的鸡蛋清粉沫的光谱(见图6A)作对比,鸡蛋清干粉的光谱可视为是蛋白质的特征光谱图,从图6上可以看到,第三主成分向量(见图6B)与鸡蛋清的光谱(见图6A)在5150cm-1,4865cm-1,4600cm-1处的三个峰的形状非常相似,这说明两张光谱图所对应的物质有相似之处,即第三主成分的信息与蛋白质有关。因此采用第三主成分因子得分的化学图像与蛋白质成分分布有关,该图像与图2A中选择区域的染色组织显微结构图像一致。
[attach]50573[/attach]
第一主成分的因子得分图像(见图5)与样品的总吸收图(见图2B)相似,这说明第一主成分是样品光谱的最主要信息,它并不能很好地表达样品中蛋白质分布信息;第二主成分向量图(见图4)几乎是一条斜线,没有明显的吸收峰存在,这个向量并不反映样品的组成成分信息,它只是光谱整体变化的趋势。第五到第八主成分因子的光谱的透过率几乎是接近100%,变化范围也只是0.05%,这么小的变化所含的样品主要成分的信息已经很少。值得一提的是第七主成分的得分图像中出现的那个红点,可能是样品在制作过程中产生的一个污染物。在第七主成分向量图(见图4)上表现在4320cm-1处出现一个单峰,第七个主成分因子将这个微小的特征表现出来。由此可见,主成分分析提取图像信息不仅可以反映样品主要成分分布,还可以反映一些微小的成分变化,将样品中的“异物”突显出来,这在产品质量检测方面有一定的意义。
3结论
通过对傅立叶近红外图像进行主成分分析,可以将所需要的信息从化学图像总吸收图中提取出来,克服近红外光谱谱峰重叠严重不能直接采用特征波长成像的问题,同样获得肌肉细胞组织显微结构中蛋白质成分分布图,从而得到肌肉细胞组织显微结构图像。不仅如此,通过采用不同主成分向量,可以将总吸收图像进行特征分离处理,可以突出一些微小成分的图像。但样品分布图像的分界不够明显,如何提高图像的整体清晰度,获得更多组分的化学图像有待于进一步的研究。
来源:《现代仪器》,转载请注明出处-仪器信息网(www.cncal.com)