2. 桂林电子科技大学 电子工程和自动化学院, 广西 桂林 541004;
3. 杭州博之锐生物制药有限公司, 浙江 杭州 311404
2. School of Electronic Engineering and Automation, Guilin University of Electronic Technology, Guilin 541004, China;
3. Bioray Pharmaceutical (Hangzhou) Co., Ltd., Hangzhou 311404, China
近年来,抗体药物发展迅速,产能不断扩大,但是传统的批次生产存在固有局限,投资巨大、风险高、设备效率低,难以适应未来生产的需要。改变批次生产方式,实现集成化的连续制造,促进高产、低耗、低排放,是发展的必然趋势。以周期性逆流层析为代表的连续流层析实现抗体连续捕获,是目前研究最多的抗体连续分离新方法。采用双柱串联上样,前柱穿透蛋白被后柱捕获,并且可以在高穿透点终止上样,提高了介质利用率和过程产率,降低了生产成本[1-6]。在连续抗体捕获过程中,关键在于对穿透点的实时监控,保证工艺稳定和产品质量。然而,目前的连续流层析设备主要使用紫外检测器进行在线监测,无法区分抗体与细胞培养液中的杂质,所以当上游细胞表达抗体浓度发生变化时,可能导致连续捕获过程失控或目标蛋白损失[7]。因此,需要合适的在线监测技术,实现复杂料液中抗体浓度的实时测量。
拉曼光谱作为一种非侵入式分析化学技术,可以准确区分溶液中不同分子。其基本原理:光子的能量部分传递给分子,导致分子表面的散射光频率相对于入射光产生位移,不同的拉曼位移代表不同的分子结构。因此,通过分析拉曼光谱就可以获得不同分子的定量信息。研究表明,拉曼光谱可以用于定量分析发酵液中葡萄糖、乳酸等组分,还可用于监测产物浓度、渗透压以及其他细胞相关参数[8-14]。拉曼光谱可以准确区分目标分子与杂质,也已用于抗体下游分离过程监测[15-16]。不过,拉曼光谱图谱通常包含数千个数据点,传统的一元统计方法难以处理这种海量信息,一般采用多元统计方法建立模型,应用最广泛的是偏最小二乘法(PLS)[17-21]。PLS模型通过提取自变量和因变量之间的主成分来解释它们之间的相关性,其中主成分是原始变量的线性组合,在样本数量较少时可以有效处理样本之间的高度相关性[22-24]。基于PLS模型的拉曼光谱已被用于生物制药的下游分离过程监测。例如,Wang等[25]建立了层析过程的目标蛋白与聚集体的PLS模型,平均预测误差为0. 28 g ·L-1。Feidl等[15-16]使用PLS对亲和层析穿透曲线的单抗浓度建模,预测均方根误差为0. 12 g ·L-1。对于连续捕获过程,起始穿透点会影响过程控制的稳定性,所以模型的预测精度尤为重要。目前常用的PLS模型拟合误差较大[26-27],需要引入其他方法来降低过拟合风险,为连续捕获过程控制提供更精准的单抗浓度在线监测。
岭回归法在PLS的基础上引入了惩罚项,使得模型在优化过程中能平衡模型复杂度与模型精度,减小模型过拟合的风险。Fuller等[28]比较了支持向量机、PLS和岭回归模型预测葡萄酒中的总糖、乙醇浓度和pH值,发现岭回归模型误差较小,表现出更好的预测性能。Tanemura等[29]对上游中国仓鼠卵巢细胞(CHO细胞)培养过程中的多种组分分别进行PLS和岭回归建模,发现岭回归模型明显提高了多种组分的浓度检测精度。Han等[30]对比了PLS、主成分回归法和岭回归模型对细胞培养液中葡萄糖含量的预测精度,发现岭回归模型的平均预测精度提高了约30 %。因此,引入岭回归模型有望改善PLS建模存在的问题,提高拉曼光谱在线监测的检测精度。
本研究针对蛋白A亲和层析过程的单抗浓度监测,建立拉曼光谱在线分析方法,比较PLS和岭回归建模,实现复杂细胞培养液中单抗浓度的拉曼光谱检测。首先探讨拉曼光谱数据预处理方法,然后分别进行PLS与岭回归建模,结合交叉验证均方根误差(RMSECV)和预测均方根误差(RMSEP)两个指标,比较和评价两种建模方法的优劣。在此基础上,进一步分析两种模型在不同数据集划分条件下的模型稳定性,为稳健的下游连续捕获过程监测提供基础。
2 材料与方法 2.1 主要材料与仪器主要材料:CHO细胞培养澄清液,含单抗质量浓度为5. 90 g ·L-1,来自国内某生物制药公司;其他试剂均为市售分析纯。
主要仪器:WP-01158拉曼光谱仪,亚波光子(深圳)科技有限公司;ÄKTA purifier 10 plus层析系统,Cytiva公司;Vantage L11层析柱,柱径为1. 1 cm,Merck Millpore公司;MabSelect PrismA蛋白A亲和层析介质,Cytiva公司;高效液相色谱仪LC3000,北京创新通恒科技有限公司;ProAqa Excel分析柱,苏州赛分科技股份有限公司。
2.2 穿透曲线测定与拉曼光谱信号采集以不同单抗质量浓度(1、2、3、5 g ·L-1)的细胞培养液作为监测对象,采用ÄKTA purifier 10 plus层析系统进行单抗穿透曲线测定,保留时间为1. 5 min。将MabSelect PrismA介质填装于Vantage L11层析柱,柱直径为1. 1 cm,柱高为5 cm。用5倍柱体积缓冲液(20 mmol ·L-1磷酸盐缓冲液,pH=7. 4,150 mmol ·L-1 NaCl)平衡层析柱;上样不同单抗浓度的细胞培养液,达到80 % ~90 % 时停止上样;流穿液采用自动收集器分管收集,为与拉曼光谱采集时间匹配,分管收集间隔时间为20 s。收集液经0. 22 μm滤膜过滤后,采用高效液相色谱仪(HPLC)测定单抗浓度。在层析柱出口与自动收集器之间加装流通池型拉曼光谱检测器,采集参数:激光波长为785 nm,拉曼位移为72. 4~3 229. 1 cm-1,积分时间为5 000 ms,平均次数为4次,每20 s得到一张拉曼光谱图。不同单抗上样浓度的穿透曲线实验的拉曼图谱样本数量见表 1。
|
|
表 1 不同上样浓度的蛋白A亲和层析实验 Table 1 Experimental conditions of affinity chromatography with different sample concentrations |
采用Savitzky-Golay(S-G)平滑对拉曼光谱原始数据进行平滑处理,去除噪声,增加数据信噪比[31-32]。S-G平滑窗口筛选范围为3~99,取值间隔为2,平滑拟合时使用多项式拟合,其中多项式阶数筛选范围包括一阶、二阶和三阶。在S-G平滑后对光谱信号进行求导,减少基线的影响,求导阶数筛选范围包括一阶、二阶和三阶。最后使用标准正则变化(SNV)对光谱数据进行标准化处理,使每张光谱数据的均值为0,标准差为1,消除拉曼光谱中由样品浓度不同引起的基线漂移和多普勒效应,以及不同样品之间由于浓度变化而引起的光谱强度差异。预处理后共得到441组数据,每组预处理后数据都包括数据集BT#1-4。
2.4 PLS建模采用PLS建模方法,对不同浓度下亲和层析流穿液的拉曼光谱与单抗浓度之间建立多元校正模型。对样本进行划分时,以一条穿透曲线对应的拉曼光谱数据集作为一组数据。针对441组样本数据,以BT#1、3、4数据作为模型训练集,BT#2作为模型预测集。通过网格搜索法,探究PLS建模的最佳预处理参数,以RMSECV为评价指标,评价模型的拟合精度,确定最优预处理方法,并通过RMSEP评价模型的预测能力。
2.5 岭回归建模对预处理后的441组数据分别进行岭回归模型建模。样本划分与PLS模型相同,使用与PLS模型相同的评价指标,确定最佳预处理参数。此外,模型的岭参数通过两步法获得,先在1×10-9~1×1020内进行大范围初步筛选,针对RMSECV较小的部分进一步减小取值间隔进行精确筛选,加快建模速度,减小算力负担,获得最佳岭回归模型。另外,使用最佳岭回归模型的预处理参数与模型参数,分别以BT#1和BT#3作为预测集进行建模与预测,综合评估岭回归和PLS两个模型的泛化能力。
3 结果与讨论 3.1 拉曼光谱数据预处理典型的单抗料液拉曼光谱图见图 1(a)。由于拉曼信号具有强荧光背景,且浓度接近的料液拉曼信号存在系统性偏移,通过直接测量的拉曼光谱难以建立准确的在线监测模型[33-34]。为此,需要对拉曼信号进行预处理,包括S-G平滑、求导和SNV处理3个步骤,降低背景和噪声,提高模型精度[31-32]。上样抗体质量浓度为2. 0 g ·L-1亲和层析穿透曲线BT#2的原始拉曼光谱图及其预处理结果见图 1(b)。可以发现,经过S-G平滑与一阶求导后,基本消除了荧光背景对拉曼信号的影响。进一步通过SNV预处理,对光谱数据中的系统性偏移进行了校正。以不同上样浓度穿透曲线中,单抗质量浓度为0. 2 g ·L-1的拉曼光谱为例(图 2),对比发现,经SNV处理,消除了不同批次数据间的系统性差异,提高了不同批次光谱数据的可比性。
|
图 1 拉曼光谱数据预处理前后对比(BT#2) Fig.1 Comparison of Raman spectral data before and after preprocessing (BT#2) |
|
图 2 不同上样质量浓度条件下0. 2 g ·L-1收集液的拉曼光谱预处理前后对比 Fig.2 Comparison of Raman spectral data of different load concentrations before and after preprocessing at 0. 2 g ·L-1 breakthrough mass concentration |
PLS模型通过构建主成分,将自变量(光谱数据)和因变量(单抗浓度)分别转换成主成分,然后使自变量和因变量的协方差最大,得到自变量和因变量之间的线性关系组合。PLS模型的目标函数J表达如式(1)。
| $ J=\max\limits_\boldsymbol{w, q} \operatorname{Cov}\left(\boldsymbol{X}_\boldsymbol{w}, \boldsymbol{Y}_\boldsymbol{q}\right) $ | (1) |
式中: X为自变量矩阵;Y为因变量矩阵;w和q分别为两个单位向量。
基于不同预处理条件下的拉曼光谱数据,建立PLS模型,以RMSECV和RMSEP为评价指标,筛选最优的预处理参数,获得最佳的PLS模型。最优的预处理参数汇总于表 2,最优PLS模型的RMSECV为0. 088 g ·L-1,RMSEP为0. 112 g ·L-1。图 3给出了不同上样浓度条件下,单抗穿透曲线的模型计算与预测情况。可以发现,PLS拉曼模型的拟合结果与实验测量值较为吻合(图 3(a)~(c))。然而,对预测集数据BT#2进行外推预测时,模型预测在低单抗浓度时偏小,高单抗浓度时偏高(图 3(d)和图 4)。此外,模型的RMSEP明显高于RMSECV。以上结果表明基于PLS的拉曼模型模型预测能力较差,可能是PLS模型优化目标单一,过度拟合训练集数据中的噪声,导致提取主成分数量过多。
|
|
表 2 最佳PLS和岭回归模型的模型精度及预处理参数 Table 2 Model accuracy and preprocessing parameters of optimized PLS model and ridge regression model |
|
图 3 最佳PLS模型的预测值和实验值比较 Fig.3 Comparison of the predicted and experimental data with the optimized PLS model (BT#1, BT#3, BT#4 are the training set, and BT#2 is the prediction set) |
|
图 4 最佳PLS模型预测BT#2穿透曲线与实验值比较 Fig.4 Comparison of the predicted and experimental BT#2 breakthrough curves with the optimized PLS model |
为了避免PLS模型的过拟合现象,本研究引入岭回归模型,平衡模型的复杂性和精度,从而减小模型过拟合的风险[29, 35]。岭回归模型的目标函数是在PLS模型的基础上引入包含提取主成分数项的惩罚项,使模型在优化过程中能平衡主成分数与模型精度,减小模型的复杂性和过拟合的风险。岭回归模型的目标函数w(β)表达如式(2)。
| $ w(\beta)=\sum\limits_{i=1}^n\left(y_{i-\mathrm{obs}}-y_{i-\mathrm{pre}}\right)^2+\lambda \sum\limits_{j=1}^p \beta_j^2 $ | (2) |
式中:n是样本数量;p是主成分数量;yi-obs是第i个样本的实验值;yi-pre是第i个样本的预测值;β是第j个主成分的回归系数;λ是岭回归中的岭参数。
目标函数w(β)由两项组成,第一项是误差项,是实际单抗浓度与模型预测值的残差平方和,该项越小模型拟合越好;第二项是惩罚项,是模型参数的平方和,该项越小模型复杂度越低。通过惩罚项回归系数(岭参数)的调整,限制模型参数的复杂程度,防止模型过拟合。
不同岭参数λ条件下模型评价指标RMSECV和RMSEP如图 5所示。模型RMSECV和RMSEP随着λ的增大都呈现先减小后增大的趋势,其中RMSECV在λ为5. 0时达到最小值。可能的原因:(1)当λ较小时,惩罚项较小,岭回归模型近似于PLS模型,过拟合导致RMSECV和RMSEP较高;(2)当λ达到5. 0左右时,惩罚项大小适当,拟合得到的系数矩阵使模型既不过拟合也不过度简化,RMSECV和RMSEP都较低,且两者的趋势几乎相同;(3)当λ继续增大,模型趋于简化,导致欠拟合,所以RMSECV和RMSEP都增加。相较PLS模型,引入岭参数后,RMSECV(0. 097 g ·L-1)基本接近,但岭回归模型的RMSEP显著降低,减小至0. 055 g ·L-1。结果表明,岭回归模型在保证拟合效果的基础上,预测性能显著增强。岭回归模型计算和实验结果比较见图 6和图 7,可以发现岭回归模型预测得到的数据点均匀分布于实测单抗浓度值的两侧,不仅对训练集具有较好的拟合效果,而且对于BT#2预测更加精确(图 7),在高浓度和低浓度条件下,没有出现明显的预测偏差。结果证实,岭回归模型通过引入岭参数,控制了模型的复杂度,有效防止模型过拟合,模型预测精度提高了39 %。
|
图 5 岭回归模型中岭参数对RMSECV和RMSEP的影响 Fig.5 Effects of ridge parameter on RMSECV and RMSEP in ridge regression model |
|
图 6 最佳岭回归模型的预测值和实验值比较 Fig.6 Comparison of the predicted and experimental data with the optimized ridge regression model. (BT#1, BT#3, BT#4 are the training set, and BT#2 is the prediction set) |
|
图 7 最佳岭回归模型预测BT#2穿透曲线与实验值比较 Fig.7 Comparison of the predicted and experimental BT#2 breakthrough curves with the optimized ridge regression model |
对4个数据集(BT#1-4)进行不同方式的划分并分别建模,考察PLS与岭回归模型在面对不同数据集时的拟合和预测能力,结果如表 3和图 8所示,发现岭回归模型在不同数据集划分条件下的预测值与实际值都较为吻合。以BT#1和BT#3为预测集时,岭回归模型的RMSEP较PLS模型分别降低了约25 % 和41 %。对比表 2和表 3,发现引入岭回归模型后,在预测高浓度数据集时更准确。总的来说,在不同数据集划分条件下,PLS模型的拟合能力都较好,但其无法准确预测;而岭回归模型不仅拟合效果良好,且预测精度也优于PLS模型。
|
|
表 3 最佳PLS和岭回归模型的模型精度及预处理参数 Table 3 Model accuracy and prepossessing parameters of optimized PLS and ridge regression models |
|
图 8 不同数据集划分条件下最佳PLS模型与岭回归模型的预测值和实验值比较 Fig.8 Comparison of the the predicted and experimental data of different batchs with optimized PLS and ridge regression models |
以细胞培养液的单抗浓度为检测对象,建立了蛋白A亲和层析过程中单抗浓度的拉曼光谱在线监测。采用S-G平滑、求导与SNV方法对拉曼光谱数据进行预处理,得到441组处理后数据,分别进行了PLS与岭回归建模。结果表明,相较于PLS模型,岭回归模型在保证拟合效果的同时,预测性能显著提升,RMSEP达到0. 055 g ·L-1。岭回归模型引入了惩罚项,平衡了主成分数与模型精度,增加了模型的预测能力。基于岭回归模型的拉曼光谱在线分析,有望为单抗药物连续捕获的在线监测提供技术支撑。在连续抗体生产过程中,上游细胞培养液经过固液分离后与本研究所用料液组成类似,且本研究建立方法的检测时间小于0. 2 s,可以用于连续生产过程中准确及时地在线检测。后续可以通过调整激光功率并缩短拉曼光谱获取时间,进一步加快检测频率,提高检测精度。
| [1] |
KAPLON H, CRESCIOLI S, CHENOWETH A, et al. Antibodies to watch in 2023[J]. MAbs, 2023, 15(1): 2153410. DOI:10.1080/19420862.2022.2153410 |
| [2] |
荆淑莹, 史策, 姚善泾, 等. 连续流层析及用于抗体分离的新进展[J]. 高校化学工程学报, 2021, 35(1): 1-12. JING S Y, SHI C, YAO S J, et al. Progress on continuous chromatography and its application in antibody separation[J]. Journal of Chemical Engineering of Chinese Universities, 2021, 35(1): 1-12. DOI:10.3969/j.issn.1003-9015.2021.01.001 |
| [3] |
RATHORE A S, ZYDNEY A L, ANUPA A, et al. Enablers of continuous processing of biotherapeutic products[J]. Trends in Biotechnology, 2022, 40(7): 804-815. DOI:10.1016/j.tibtech.2021.12.003 |
| [4] |
DAVID L, SCHWAN P, LOBEDANN M, et al. Side-by-side comparability of batch and continuous downstream for the production of monoclonal antibodies[J]. Biotechnology and Bioengineering, 2020, 117(4): 1024-1036. DOI:10.1002/bit.27267 |
| [5] |
HUMMEL J, PAGKALIWANGAN M, GJOKA X, et al. Modeling the downstream processing of monoclonal antibodies reveals cost advantages for continuous methods for a broad range of manufacturing scales[J]. Biotechnology Journal, 2019, 14(2): 1700665. DOI:10.1002/biot.201700665 |
| [6] |
KARST D J, STEINEBACH F, MORBIDELLI M. Continuous integrated manufacturing of therapeutic proteins[J]. Current Opinion in Biotechnology, 2018, 53: 76-84. DOI:10.1016/j.copbio.2017.12.015 |
| [7] |
FAN Y, SUN Y N, QIAO L Z, et al. Evaluation of dynamic control of continuous capture with periodic counter-current chromatography under feedstock variations[J]. Journal of Chromatography A, 2024, 1713: 464528. DOI:10.1016/j.chroma.2023.464528 |
| [8] |
MEHDIZADEH H, LAURI D, KARRY K M, et al. Generic Raman-based calibration models enabling real-time monitoring of cell culture bioreactors[J]. Biotechnology Progress, 2015, 31(4): 1004-1013. DOI:10.1002/btpr.2079 |
| [9] |
ANDRÉ S, LAGRESLE S, HANNAS Z, et al. Mammalian cell culture monitoring using in situ spectroscopy: Is your method really optimised?[J]. Biotechnology Progress, 2017, 33(2): 308-316. DOI:10.1002/btpr.2430 |
| [10] |
ABU-ABSI N R, KENTY B M, CUELLAR M E, et al. Real time monitoring of multiple parameters in mammalian cell culture bioreactors using an in-line Raman spectroscopy probe[J]. Biotechnology and Bioengineering, 2011, 108(5): 1215-1221. DOI:10.1002/bit.23023 |
| [11] |
WHELAN J, CRAVEN S, GLENNON B. In situ Raman spectroscopy for simultaneous monitoring of multiple process parameters in mammalian cell culture bioreactors[J]. Biotechnology Progress, 2012, 28(5): 1355-1362. DOI:10.1002/btpr.1590 |
| [12] |
BERRY B, MORETTO J, MATTHEWS T, et al. Cross-scale predictive modeling of CHO cell culture growth and metabolites using Raman spectroscopy and multivariate analysis[J]. Biotechnology Progress, 2015, 31(2): 566-577. DOI:10.1002/btpr.2035 |
| [13] |
KOZMA B, HIRSCH E, GERGELY S, et al. On-line prediction of the glucose concentration of CHO cell cultivations by NIR and Raman spectroscopy: Comparative scalability test with a shake flask model system[J]. Journal of Pharmaceutical and Biomedical Analysis, 2017, 145: 346-355. DOI:10.1016/j.jpba.2017.06.070 |
| [14] |
吴韬, 梁立鹏, 张冉, 等. 基于过程分析技术细胞培养中多指标实时检测[J]. 高校化学工程学报, 2023, 37(3): 441-448. WU T, LIANG L P, ZHANG R, et al. Real-time monitoring of multiple properties in cell culture processes using processing analysis technology[J]. Journal of Chemical Engineering of Chinese Universities, 2023, 37(3): 441-448. |
| [15] |
FEIDL F, GARBELLINI S, VOGG S, et al. A new flow cell and chemometric protocol for implementing in-line Raman spectroscopy in chromatography[J]. Biotechnology progress, 2019, 35(5): e2847. DOI:10.1002/btpr.2847 |
| [16] |
FEIDL F, GARBELLINI S, LUNA M F, et al. Combining mechanistic modeling and Raman spectroscopy for monitoring antibody chromatographic purification[J]. Processes, 2019, 7(10): 683. DOI:10.3390/pr7100683 |
| [17] |
LOPES M B, CALADO C R C, FIGUEIREDO M A T, et al. Does nonlinear modeling play a role in plasmid bioprocess monitoring using Fourier transform infrared spectra?[J]. Applied Spectroscopy, 2017, 71(6): 1148-1156. DOI:10.1177/0003702816670913 |
| [18] |
LIU R H, SUN Q F, HU T, et al. Multi-parameters monitoring during traditional Chinese medicine concentration process with near infrared spectroscopy and chemometrics[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2018, 192: 75-81. DOI:10.1016/j.saa.2017.10.068 |
| [19] |
LI W L, YAN X C, PAN J, et al. Rapid analysis of the Tanreqing injection by near-infrared spectroscopy combined with least squares support vector machine and Gaussian process modeling techniques[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 218: 271-280. DOI:10.1016/j.saa.2019.03.110 |
| [20] |
ROLINGER L, RVDT M, HUBBUCH J. Comparison of UV-and Raman-based monitoring of the Protein A load phase and evaluation of data fusion by PLS models and CNNs[J]. Biotechnology and Bioengineering, 2021, 118(11): 4255-4268. DOI:10.1002/bit.27894 |
| [21] |
阎续, 沈丽娟, 胥文彦, 等. 拉曼光谱用于CHO细胞培养液多指标快速分析[J]. 高校化学工程学报, 2019, 33(4): 872-877. YAN X, SHEN L J, XU W Y, et al. Rapid analysis of multiple parameters of CHO cell culture media using Raman spectroscopy[J]. Journal of Chemical Engineering of Chinese Universities, 2019, 33(4): 872-877. |
| [22] |
SANTOS R M, KESSLER J M, SALOU P, et al. Monitoring mAb cultivations with in-situ raman spectroscopy: The influence of spectral selectivity on calibration models and industrial use as reliable PAT tool[J]. Biotechnology Progress, 2018, 34(3): 659-670. DOI:10.1002/btpr.2635 |
| [23] |
KOZMA B, SALGÓ A, GERGELY S. Comparison of multivariate data analysis techniques to improve glucose concentration prediction in mammalian cell cultivations by Raman spectroscopy[J]. Journal of Pharmaceutical and Biomedical Analysis, 2018, 158: 269-279. DOI:10.1016/j.jpba.2018.06.005 |
| [24] |
ANDRÉ S, LAGRESLE S, DA SLIVA A, et al. Developing global regression models for metabolite concentration prediction regardless of cell line[J]. Biotechnology and Bioengineering, 2017, 114(11): 2550-2559. DOI:10.1002/bit.26368 |
| [25] |
WANG J R, CHEN J Y, STUDTS J, et al. Automated calibration and in-line measurement of product quality during therapeutic monoclonal antibody purification using Raman spectroscopy[J]. Biotechnology and Bioengineering, 2023, 120(11): 3288-3298. DOI:10.1002/bit.28514 |
| [26] |
MATTHEWS T E, SMELKO J P, BERRY B, et al. Glucose monitoring and adaptive feeding of mammalian cell culture in the presence of strong autofluorescence by near infrared Raman spectroscopy[J]. Biotechnology Progress, 2018, 34(6): 1574-1580. DOI:10.1002/btpr.2711 |
| [27] |
GUO S X, RÖSCH P, POPP J, et al. Modified PCA and PLS: Towards a better classification in Raman spectroscopy-based biological applications[J]. Journal of Chemometrics, 2020, 34(4): e3202. DOI:10.1002/cem.3202 |
| [28] |
FULLER H, BEAVER C, HARBERTSON J. Alcoholic Fermentation Monitoring and PH Prediction in Red and White Wine by Combining Spontaneous Raman Spectroscopy and Machine Learning Algorithms[J]. Beverages, 2021, 7(4): 78. DOI:10.3390/beverages7040078 |
| [29] |
TANEMURA H, KITAMURA R, YAMADA Y, et al. Comprehensive modeling of cell culture profile using Raman spectroscopy and machine learning[J]. Scientific Reports, 2023, 13(1): 21805. DOI:10.1038/s41598-023-49257-0 |
| [30] |
HAN N R, RAM R J. Bayesian modeling and computation for analyte quantification in complex mixtures using Raman spectroscopy[J]. Computational Statistics & Data Analysis, 2020, 143: 106846. |
| [31] |
GERRETZEN J, SZYMAŃSKA E, JANSEN J J, et al. Simple and effective way for data preprocessing selection based on design of experiments[J]. Analytical Chemistry, 2015, 87(24): 12096-12103. DOI:10.1021/acs.analchem.5b02832 |
| [32] |
GERRETZEN J, SZYMAŃSKA E, BART J, et al. Boosting model performance and interpretation by entangling preprocessing selection and variable selection[J]. Analytica Chimica Acta, 2016, 938: 44-52. DOI:10.1016/j.aca.2016.08.022 |
| [33] |
CADUSCH P J, HLAING M M, WADE S A, et al. Improved methods for fluorescence background subtraction from Raman spectra[J]. Journal of Raman Spectroscopy, 2013, 44(11): 1587-1595. DOI:10.1002/jrs.4371 |
| [34] |
ZHANG D M, BEN-AMOTZ D. Enhanced chemical classification of Raman images in the presence of strong fluorescence interference[J]. Applied Spectroscopy, 2000, 54(9): 1379-1383. DOI:10.1366/0003702001951066 |
| [35] |
MCDONALD G C. Ridge regression[J]. WIREs Interdisciplinary Reviews: Computational Statistics, 2009, 1(1): 93-100. DOI:10.1002/wics.14 |


