單細(xì)胞微生物生長(zhǎng)時(shí)期可分為滯后期(lag phase)、對(duì)數(shù)期(log phase)、穩(wěn)定期(stationary phase)和衰亡期(apoptosis phase)4個(gè)時(shí)期,在不同的生長(zhǎng)時(shí)期表現(xiàn)出不同的代謝和生產(chǎn)能力,由于細(xì)胞的異質(zhì)性,導(dǎo)致了微生物菌落中不同生長(zhǎng)時(shí)期的細(xì)胞共存,傳統(tǒng)群體水平上的細(xì)胞生長(zhǎng)代謝研究,得到的是系統(tǒng)平均值,掩蓋了每個(gè)細(xì)胞的獨(dú)特性。在單細(xì)胞水平上觀測(cè)細(xì)胞生長(zhǎng)是非常重要的,在發(fā)酵工程中,單細(xì)胞的生理狀態(tài)是決定發(fā)酵產(chǎn)品產(chǎn)量的唯一因素,發(fā)酵環(huán)境隨著底物消耗和產(chǎn)物合成不斷變化,導(dǎo)致不同生長(zhǎng)時(shí)期的發(fā)酵細(xì)胞代謝不同,產(chǎn)量也不同。隨著發(fā)酵原料成本的增加和環(huán)保意識(shí)的增強(qiáng),對(duì)發(fā)酵過程的精準(zhǔn)控制要求越來(lái)越高,從單細(xì)胞水平上檢測(cè)發(fā)酵細(xì)胞生長(zhǎng)時(shí)期,并進(jìn)行特定干預(yù)措施改造發(fā)酵環(huán)境,可以使發(fā)酵細(xì)胞處于最佳的生長(zhǎng)和生產(chǎn)狀態(tài)。準(zhǔn)確檢測(cè)單細(xì)胞所處生長(zhǎng)時(shí)期,可為發(fā)酵工程獲得最佳產(chǎn)量提供更加精準(zhǔn)、實(shí)時(shí)的調(diào)控指導(dǎo)。
單細(xì)胞拉曼光譜(single-cell Raman spectroscopy,SCRS)是細(xì)胞的指紋圖譜,蘊(yùn)含著細(xì)胞在特定生長(zhǎng)狀態(tài)下豐富的表型信息,SCRS技術(shù)以快速、靈敏和無(wú)標(biāo)記的優(yōu)勢(shì)可以實(shí)時(shí)監(jiān)測(cè)單細(xì)胞的生長(zhǎng)代謝變化。以監(jiān)督學(xué)習(xí)為代表的模式識(shí)別技術(shù)通過對(duì)SCRS數(shù)據(jù)學(xué)習(xí)并生成經(jīng)驗(yàn)?zāi)P?,可以指?dǎo)細(xì)胞生長(zhǎng)時(shí)期鑒定,已有研究人員應(yīng)用隨機(jī)森林算法實(shí)現(xiàn)了群體水平上的細(xì)胞生長(zhǎng)檢測(cè),相較于監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)只需要定義相似度計(jì)算方法就可以直接根據(jù)SCRS數(shù)據(jù)特征結(jié)構(gòu)進(jìn)行建模,就能從單細(xì)胞尺度上實(shí)時(shí)監(jiān)測(cè)細(xì)胞生長(zhǎng)代謝變化。
本文提出基于譜聚類與SCRS的細(xì)胞生長(zhǎng)分析方法,首先,采集同步培養(yǎng)下不同生長(zhǎng)時(shí)間的微生物SCRS數(shù)據(jù),對(duì)應(yīng)培養(yǎng)時(shí)間的OD600生長(zhǎng)曲線作為微生物群體水平生長(zhǎng)時(shí)期標(biāo)簽;其次,應(yīng)用t分布隨機(jī)鄰居嵌入(t-distributed stochastic neighbor embedding,t-SNE)對(duì)群體細(xì)胞SCRS數(shù)據(jù)進(jìn)行可視化分析,指導(dǎo)譜聚類對(duì)高維SCRS數(shù)據(jù)聚類分析,并應(yīng)用輪廓系數(shù)和CH系數(shù)(calinski-harabasz index,CH index)評(píng)估最佳聚類簇,賦予每個(gè)SCRS數(shù)據(jù)簇標(biāo)簽;最后,應(yīng)用三次樣條插值擬合統(tǒng)計(jì)SCRS數(shù)據(jù)簇標(biāo)簽和生長(zhǎng)時(shí)期標(biāo)簽交集,精準(zhǔn)識(shí)別群體中共存的生長(zhǎng)時(shí)期異質(zhì)數(shù)據(jù),實(shí)現(xiàn)對(duì)單細(xì)胞微生物生長(zhǎng)時(shí)期精準(zhǔn)鑒定。
1實(shí)驗(yàn)部分
1.1 SCRS數(shù)據(jù)采集
1.1.1分光光度計(jì)檢測(cè)和SCRS檢測(cè)條件
在細(xì)胞培養(yǎng)實(shí)驗(yàn)中,提取不同培養(yǎng)時(shí)間點(diǎn)各3 mL菌液,應(yīng)用紫外分光光度計(jì)檢測(cè),檢測(cè)條件為OD600,記錄細(xì)菌生長(zhǎng)狀態(tài),圖1分別為實(shí)驗(yàn)組(大腸桿菌)和驗(yàn)證組(枯草芽孢桿菌)各3次重復(fù)測(cè)量同步培養(yǎng)的OD600生長(zhǎng)曲線,將其作為群體水平生長(zhǎng)時(shí)期標(biāo)簽。同時(shí)在各培養(yǎng)時(shí)間點(diǎn)提取1μL菌液,應(yīng)用HOOKE P300共聚焦拉曼光譜儀進(jìn)行SCRS采集(由于微生物SCRS在600~1 800 cm-1波段具有明顯的光譜模式,往往作為其表型指紋區(qū)域,故光譜儀主要參數(shù)設(shè)置為,激發(fā)波長(zhǎng)(excitation wavelength):532 nm,光柵(Grating):1 200 g·mm-1,激發(fā)功率(laser power):3 mW,積分時(shí)間(integration time):8 s。SCRS檢測(cè)可以獲取單個(gè)細(xì)胞生長(zhǎng)過程的實(shí)時(shí)變化信息,提供了用于生物分析的化學(xué)組成和結(jié)構(gòu)信息的指紋圖譜,蘊(yùn)含著細(xì)胞在特定生長(zhǎng)狀態(tài)下豐富的表型信息,檢測(cè)SCRS特征峰強(qiáng)變化是細(xì)胞生長(zhǎng)定性、定量檢測(cè)的主要依據(jù),可以通過檢測(cè)細(xì)胞代謝活躍的核酸(I785.5、I1 047.5、I1 097.2等)、蛋白(I624.3、I831.2、I1 034等)、脂質(zhì)(I878、I1 075)等相關(guān)特征峰強(qiáng)度變化,實(shí)時(shí)檢測(cè)單細(xì)胞的生長(zhǎng)代謝狀態(tài)。SCRS是進(jìn)行單細(xì)胞活體生長(zhǎng)檢測(cè)的實(shí)用工具,本文將SCRS技術(shù)和無(wú)監(jiān)督聚類技術(shù)相結(jié)合,為單細(xì)胞微生物生長(zhǎng)檢測(cè)研究提供新的檢測(cè)方法。
圖1單細(xì)胞微生物同步培養(yǎng)與OD600生長(zhǎng)曲線
1.1.2微生物樣品選擇與同步培養(yǎng)
將常用的發(fā)酵工程菌-大腸桿菌進(jìn)行同步培養(yǎng)實(shí)驗(yàn),以獲取不同生長(zhǎng)時(shí)期的單細(xì)胞樣品,作為模式生物突出的代表,大腸桿菌具有繁殖迅速,培養(yǎng)代謝易于控制的優(yōu)勢(shì),是目前生命科學(xué)研究最為公認(rèn)的微生物材料。準(zhǔn)確檢測(cè)發(fā)酵過程中工程菌生長(zhǎng)狀態(tài),是獲取最佳發(fā)酵產(chǎn)量的前提。為了驗(yàn)證本文方法的適用性,同時(shí)選用了一種常用發(fā)酵益生菌-枯草芽孢桿菌作為細(xì)胞生長(zhǎng)研究驗(yàn)證組樣品。
大腸桿菌的培養(yǎng)基為L(zhǎng)B(luria-bertani),而枯草芽孢桿菌的培養(yǎng)基為牛肉膏蛋白胨,分別在其對(duì)應(yīng)的培養(yǎng)基進(jìn)行同步培養(yǎng),記錄細(xì)菌的培養(yǎng)時(shí)間。根據(jù)圖1不同培養(yǎng)時(shí)間OD600生長(zhǎng)曲線,確定培養(yǎng)2 h為滯后期,該時(shí)期菌體增大,代謝活躍,合成并積累充足的酶和代謝產(chǎn)物;3~4 h為對(duì)數(shù)期(驗(yàn)證組為3~5 h),細(xì)菌在該時(shí)期生長(zhǎng)迅速,呈現(xiàn)指數(shù)生長(zhǎng)趨勢(shì),增代時(shí)間最少;培養(yǎng)6 h(驗(yàn)證組為8 h)至14 h,即進(jìn)入穩(wěn)定期,隨著培養(yǎng)時(shí)間延長(zhǎng),未發(fā)現(xiàn)明顯的凋亡期界限,但這并不影響生長(zhǎng)曲線的走向以及對(duì)單細(xì)胞生長(zhǎng)時(shí)期的識(shí)別,本文僅涉及細(xì)胞前三個(gè)時(shí)期檢測(cè)。應(yīng)用SCRS檢測(cè)條件分別從實(shí)驗(yàn)組和驗(yàn)證組提取的菌液采集SCRS數(shù)據(jù),實(shí)驗(yàn)組6個(gè)培養(yǎng)時(shí)間點(diǎn)共采集600個(gè)(6時(shí)間點(diǎn)×100個(gè)/時(shí)間點(diǎn))SCRS數(shù)據(jù),驗(yàn)證組6個(gè)培養(yǎng)時(shí)間點(diǎn)共采集300個(gè)(6時(shí)間點(diǎn)×50個(gè)/時(shí)間點(diǎn))SCRS數(shù)據(jù)。
1.2 SCRS數(shù)據(jù)預(yù)處理
SCRS數(shù)據(jù)預(yù)處理是準(zhǔn)確鑒定細(xì)胞生長(zhǎng)時(shí)期的前提,通過拉曼光譜儀采集的SCRS數(shù)據(jù)包含大量的干擾信息,如光譜儀噪聲、熒光背景等,干擾信息使得檢測(cè)模型的識(shí)別性能降低,在數(shù)據(jù)分析之前,需要對(duì)SCRS數(shù)據(jù)進(jìn)行預(yù)處理。本文應(yīng)用HOOKE intP拉曼光譜分析軟件對(duì)SCRS數(shù)據(jù)預(yù)處理,包括:應(yīng)用基于Savitzky-Golay卷積平滑對(duì)SCRS數(shù)據(jù)進(jìn)行濾波處理,窗口寬度為7個(gè)光譜像素點(diǎn),采用三階多項(xiàng)式擬合;應(yīng)用基于airPLS(自適應(yīng)迭代重加權(quán)懲罰最小二乘)算法去除拉曼光譜背景信號(hào),Lambda=15,最大迭代次數(shù)ItermaxAirPls=12;應(yīng)用Min-Max對(duì)SCRS數(shù)據(jù)歸一化處理。
1.3檢測(cè)模型
基于譜聚類與SCRS的細(xì)胞生長(zhǎng)分析方法應(yīng)用的主要技術(shù)包括:(1)應(yīng)用t-SNE對(duì)群體細(xì)胞SCRS數(shù)據(jù)進(jìn)行可視化分析;(2)應(yīng)用譜聚類對(duì)SCRS數(shù)據(jù)聚類分析;(3)應(yīng)用輪廓系數(shù)和CH index評(píng)估最佳聚類簇。
1.3.1 t-SNE
t-SNE算法是一種適合于高維SCRS數(shù)據(jù)的非線性降維方法,該方法首先將高維空間中任意兩個(gè)光譜數(shù)據(jù)間的歐氏距離轉(zhuǎn)換為相似概率,其次用高維空間數(shù)據(jù)點(diǎn)與相應(yīng)低維空間的模擬數(shù)據(jù)點(diǎn)之間的聯(lián)合概率替換隨機(jī)鄰域嵌入算法中的條件概率,并在低維空間中使用t分布,有效解決低維空間中數(shù)據(jù)點(diǎn)擁擠的問題。以二維可視化為例,t-SNE將SCRS指紋特征向具有最大投影信息量的二維平面上投影,以高維空間相同概率分布的TSNE1和TSNE2特征分量均勻分布在平面中,有效解決低維空間中數(shù)據(jù)點(diǎn)擁擠的問題,用于直觀顯示不同培養(yǎng)時(shí)間單細(xì)胞分布效果,指導(dǎo)無(wú)監(jiān)督聚類分析。
1.3.2譜聚類
譜聚類(spectral clustering)是一種基于兩點(diǎn)間相似關(guān)系的無(wú)監(jiān)督聚類算法,首先對(duì)SCRS數(shù)據(jù)樣本高維矩陣進(jìn)行低維嵌入,然后進(jìn)行聚類。其本質(zhì)是將聚類問題轉(zhuǎn)化為圖的最優(yōu)劃分問題,相較于其他傳統(tǒng)聚類算法,譜聚類能在任意形狀的SCRS數(shù)據(jù)樣本空間上聚類且易于收斂到全局最優(yōu),并且通過構(gòu)造稀疏相似性圖譜,使其對(duì)于高維SCRS數(shù)據(jù)集表現(xiàn)出更快的計(jì)算速度。特別的,相較于監(jiān)督學(xué)習(xí)的分類算法,譜聚類無(wú)需SCRS數(shù)據(jù)標(biāo)簽,只需要定義相似度計(jì)算方法就可以直接根據(jù)SCRS數(shù)據(jù)特征進(jìn)行建模,能有效檢測(cè)微生物群體中不同生長(zhǎng)時(shí)期共存的單細(xì)胞信息。
1.3.3聚類評(píng)估
聚類評(píng)估是對(duì)聚類方法產(chǎn)生結(jié)果的質(zhì)量進(jìn)行評(píng)估,主要任務(wù)包括:估計(jì)聚類趨勢(shì)、確定數(shù)據(jù)集劃分簇?cái)?shù)以及評(píng)估聚類質(zhì)量,應(yīng)用輪廓系數(shù)和CH index兩個(gè)維度來(lái)評(píng)估譜聚類在SCRS數(shù)據(jù)集劃分最佳簇?cái)?shù)和聚類質(zhì)量。
(1)輪廓系數(shù)(silhouette coefficient)是聚類效果好壞的一種評(píng)價(jià)方式,它結(jié)合內(nèi)聚度和分離度兩種因素,在SCRS數(shù)據(jù)上評(píng)價(jià)譜聚類對(duì)聚類結(jié)果所產(chǎn)生的影響,式(1)是輪廓系數(shù)聚類得分計(jì)算原理
式(1)中,A(i)為SCRS數(shù)據(jù)樣本i到同簇其他樣本的平均距離,B(i)為SCRS數(shù)據(jù)樣本i到其他簇的所有樣本的平均距離。
(2)CH index也被稱為方差比準(zhǔn)則,用來(lái)評(píng)價(jià)譜聚類在SCRS數(shù)據(jù)集上的聚類效果,聚類質(zhì)量由CH index得分表征,CH index得分通過計(jì)算簇間方差和簇內(nèi)方差計(jì)算得到的,式(2)是CH index得分計(jì)算原理(2)
式(2)中,k為譜聚類在SCRS數(shù)據(jù)集上聚類簇?cái)?shù),N為全部SCRS數(shù)據(jù)樣本個(gè)數(shù),VB是簇間方差,VW是簇內(nèi)方差。
單細(xì)胞微生物生長(zhǎng)時(shí)期精準(zhǔn)鑒定與實(shí)時(shí)監(jiān)測(cè)方法(一)
單細(xì)胞微生物生長(zhǎng)時(shí)期精準(zhǔn)鑒定與實(shí)時(shí)監(jiān)測(cè)方法(二)
相關(guān)新聞推薦
1、水體擾動(dòng)對(duì)藻生長(zhǎng)機(jī)制與QCS水庫(kù)富營(yíng)養(yǎng)化控制的影響研究
2、橄欖苦苷體外抗氧化活性、抑菌活性分析及對(duì)細(xì)菌生長(zhǎng)曲線的影響
3、基于乳酸菌發(fā)酵技術(shù)強(qiáng)化蒲公英提取液的生物活性功能