疾病蛋白组学怎么做?一文看懂

admin 54 2024-12-29 编辑

 

近期,来自美国弗吉尼亚联邦大学的Stravitz-Sanyal肝病和代谢健康研究所的科研人员在在肝病领域top期刊《Journal of Hepatology》(IF:25.7)发表了题为Defining the serum proteomic signature of hepatic steatosis, inflammation, ballooning and fibrosis in non-alcoholic fatty liver disease(定义非酒精性脂肪性肝病中肝脂肪变性、炎症、气球样和纤维化的血清蛋白质组学特征)的文章。该研究通过绘制非酒精性脂肪性肝病的血清蛋白组轮廓,识别并验证与NAFLD肝活检关键成分相对应的蛋白特征。研究人员发现血清蛋白组轮廓与NAFLD的各种表型相关,并且可以识别多种治疗干预引起的组织学变化。

一、 研究背景

非酒精性脂肪性肝病(nonalcoholic fatty liver disease, NAFLD)影响了全球20~30%成人的健康。单纯性非酒精性脂肪肝(non-alcoholic fatty liver, NAFL)患者的病情相对稳定,而非酒精性脂肪性肝炎(non-alcoholic steatohepatitis, NASH)患者可能会发展为肝硬化。专家推测,到2030年NAFLD导致的终末期肝病负担将增加2-3倍。因此亟需通过可靠的检测方法确定有可能进展或正在进展期的肝病患者,以便尽早治疗。

肝组织学是识别肝脏相关结局风险增加的NAFLD患者的参考标准。但基于活检的方法存在局限性,如侵入性、风险相对较高和高成本等,因此该技术在常规临床实践中的应用并不理想。在非侵入性测试(Non-intrusive testing, NIT)中,目前只有增强型肝纤维化测试被批准用于预后生物标志物,尚无其它可用于NAFLD早诊、表型区分等用途的NIT。

近年来,大规模血清/血浆蛋白质组学分析已被成功应用于鉴定疾病状态下蛋白质组的变化。在该研究中,作者使用SomaScan®平台识别和验证蛋白质组学特征,以达下述早诊目标:(1)用于辅助诊断NAFLD组织学组分的临床相关严重程度;(2)疾病监测。

二、 研究思路

研究使用了来自NASH CRN NAFLD数据库、Adult DB2注册、PIVENS和FLINT临床试验的成年参与者的血清样本,并要求受试者已通过活检确诊NAFLD,并提供血清样本。为实现目标(1),研究者分别从试验参与者和自然史研究参与者中选取了559份血清样本组成训练集。验证模型性能使用了两个独立的验证集,通过血清样本开发模型,以协助NAFLD患者进行组织学诊断,并评估病情。为实现目标(2),研究者从PIVENS和FLINT受试者处收集基线、结束治疗等时间点的血清样本。通过对上述样本的分析,了解在治疗过程中NAFLD患者的生物标志物和血清变化,以更好地监测疾病的发展和治疗效果。

三、主要研究结果

1 建立基于蛋白质横截面的肝脏组织学模型

研究使用肝组织的结果,将其分为不同层次,如脂肪肝、小叶炎症、肝细胞膨胀和纤维化。考虑到纤维化阶段2及以上可能增加肝相关风险,研究建立了基于蛋白质的模型,用于预测这些组织学结果。为了达到目标(1),分别为每个组织学组分开发了模型,并在训练集上进行了各种分析,包括使用单变量t检验评估分子与每个组织学参数的关联性,进行多重检验校正,并使用稳定性选择方法进行特征选择。最后,通过交叉验证评估模型性能,确定最终的预测模型。使用Benjamini-Hochberg程序对错误发现率(FDR, False Discovery Rate)进行多次校正。在初始特征选择阶段,选择α=0.1,根据最小FDR校正p值对分析物进行过滤。结果显示,初始单变量分析产生了大量潜在靶点,包括:532种与脂肪肝相关的蛋白、1408种与肝细胞膨胀相关的蛋白、809种与小叶炎症相关的蛋白和2201种与纤维化相关的蛋白。

研究采用了稳定性选择和弹性网络正则化方法,选择了用于建立最终模型的分析物(表1)。在进一步的分析中,这些分析物按照它们与研究终点的统计关联程度进行排名。分别有12个、14个、5个和8个分析物被选择用于脂肪肝、小叶炎症、肝细胞膨胀和纤维化的最终模型。最终的四个模型中共涉及了与NAFLD有关的37个蛋白质,其中14个之前已与NAFLD的多个方面相关联,而18个是在该研究中首次被发现与NAFLD相关。

表1 4个模型中涵盖的蛋白

表2所示结果显示各个模型在脂肪肝、小叶炎症、肝细胞膨胀和纤维化方面在训练集中的AUC值较高,但在验证集中预期较低,符合机器学习中的典型模式。其次,对于小叶炎症、肝细胞膨胀和纤维化模型,在使用基线和研究结束时的样本时,安慰剂组和主动治疗组的AUC值相似,表明模型对治疗的影响不敏感。脂肪肝模型在验证集中AUC值下降较大,可能是由于验证集中脂肪肝样本数量不足造成的。最后,通过评估各个模型在其预期用途与对其他NAFLD特征的诊断性能之间的表现,发现模型在评估非预期特征时准确性下降,这表明模型的构建特异性。例如,将纤维化模型用于评估小叶炎症、肝细胞膨胀或脂肪肝时,准确性下降到52-66%。类似地,其他模型用于评估纤维化时,准确性也下降。这些结果对于理解模型在NAFLD研究中的实际应用和局限性具有重要意义。

表2 在训练集和两种不同的验证方法中的性能指标。

2 建立用于监测疾病过程的蛋白质组学模型

研究使用目标1中开发的模型,对治疗和安慰剂组在时间上的变化进行监测。使用四个蛋白质模型预测NASH患者的组织学特征概率,对PIVENS和FLINT试验的参与者进行了基线、治疗结束和中期访问的样本进行分析。在PIVENS队列中,四个模型都显示了时间和治疗之间的显著交互作用。对于纤维化,治疗组和安慰剂在第32周开始显著差异,两种治疗在第16周开始对脂肪肝、肝细胞膨胀和小叶炎症产生显著影响。在FLINT队列中,与组织学评估相反,治疗组与安慰剂相比,脂肪肝概率得分在时间上没有显著差异,但在第24周开始,治疗组的纤维化概率得分显著下降,与个体水平的组织学改善一致。类似的变化也在第12周开始出现在小叶炎症和肝细胞膨胀的概率得分中()。

3 事后分析

使用四个组成模型的输出值相乘的方法来识别NASH患病风险的性能。在训练队列中,该模型的AUC为0.93,在验证队列中为0.84-0.85()。在所有队列中,使用0.0625的阈值,该模型表现出较高的灵敏度(0.87-0.92),在经过生物检验证实的患有风险的NASH的患病率为31-39%时,特异度在0.6-0.77之间。

此外,研究人员考察了训练集和两个验证集中对肝硬化的诊断表现。在训练集中,成功识别了所有患有肝硬化的病例,而在两个验证集中,分别成功识别了2/3例和7/10例。对于诊断肝硬化,特异性在93-95%之间,但在病理分期为2-3的个体中,有14%被错误分类为肝硬化。利用纤维化模型中的95%概率截断值,依据当前数据集能够识别出17/25个。

四、 小结

这项研究证明血清蛋白质谱可识别NAFLD特征和监测治疗引起的组织学变化。模型的稳健性和生物学合理性得到验证,但样本涉及的种族和病程分布有限。这些蛋白质模型对NAFLD患者的生物标志物和治疗效果敏感,为进一步用于NAFLD生物标志物的验证奠定了基础,可以说为发展NAFLD生物标志物提供了重要的初步支持。

 

参考文献:Sanyal AJ, Williams SA, Lavine JE, et al. Defining the serum proteomic signature of hepatic steatosis, inflammation, ballooning and fibrosis in non-alcoholic fatty liver disease. J Hepatol. 2023;78(4):693-703. DOI: 10.1016/j.jhep.2022.11.029  

 

疾病蛋白组学怎么做?一文看懂

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: PASA:提升基因预测的利器
相关文章