研究背景:食管癌是世界范围内高发恶性肿瘤之一,在我国主要以食管鳞状细胞癌(Esophageal squamous cell carcinoma,ESCC)为主,占食管癌的 90%以上。其早期症状较为隐匿,发现时多为中晚期,导致预后较差,5年生存率较低。ESCC的早期筛查与早诊早治是防控最有效的途径。在ESCC筛查中,课题组前期通过“国家食管癌早诊早治示范基地(山东省肥城市)”,对年龄在40-69岁的常住居民进行内镜筛查,发现高危人群并建立筛查队列进行随访。目前,虽然已经知晓癌变率,但是由食管炎、不典型增生进展到癌症的过程中,机体内代谢物的变Testis biopsy化过程尚不清楚。此外,ESCC代谢组学研究多是在横断面的基础上鉴别癌症人群和非癌症人群之间的差异代谢物,无法预测高危人群的疾病进展。针对上述科学问题,本研究拟基于前瞻性病例队列设计,运用超高效液相色谱串联质谱联用仪平台(Ultra-High Performance Liquid Chromatography-Mass Spectrometry,UPLC-MS),对由食管炎、不典型增生进展到食管原位癌、ESCC或胃癌的患者进行非靶向代谢组学测量,筛选疾病进展相关差异代谢物,研究相关代谢通路,利用差异代谢物前瞻性预测癌变,探索由食管炎、不典型增生进展到癌症过程中代谢物的变化,并在筛查队列中靶向验证代谢物的筛查效果。材料与方法:本研究基于“国家食管癌早诊早治示范基地(山东省肥城市)”筛查队列,将食管炎以及不典型增生的研究对象作为随访人群,按照病例队列设计(casecohortdesign),将随访过程中进展到食管原位癌、ESCC或胃癌的患者作为病例组,在筛查队列中按照1:1随机抽取研究人群作为子队列,构建病例队列,进行UPLC-MS非靶向代谢组学测量,并对代谢图谱数据进行数据预处理。通过相对标准偏差(Relative Standard Deviation,RSD)对代谢组学数据进行质量控制。运用主成分分析(Principal Component Analysis,PCA)和偏最小二乘判别分析(PartialLeast Squares Discrimination Analysis,PLS-DA)探索不同组间的代谢轮廓差异。以变量投影重要性(Variable NSC 125973供应商Importance for the Projection,更多VIP)>1.0且假发现率(False Discovery Rate,FDR qvalue)<0.05为标准筛选差异代谢物。使用Metaboanalyst平台进行通路及富集分析。构建基于差异代谢物的随机森林预测模型,使用留一法交叉验证对预测模型进行评价。为进一步验证代谢物在筛查队列中的筛查效果,首先在病例队列中筛选出差异代谢物(P<0.05)。随后将筛查队列人群按照7:3比例分为训练集和验证集,在筛查队列训练集中,选取与差异代谢物质荷比相同的代谢物,最后根据最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator,Lasso)筛选出差异代谢物。将吸烟、饮酒、饮茶情况、水源地、肿瘤家族史等进行单因素logistic分析,筛选出显著变量作为生活方式危险因素。构建随机森林预测模型,在筛查队列验证集中进行评价。研究结果:本研究共纳入77例病例组和77例子队列人群进行UPLC-MS非靶向代谢组学检测,RSD结果显示质量控制较好,代谢组学实验重现性好,数据质量可靠。PCA及PLS-DA得分图显示代谢轮廓分离趋势明显。根据VIP>1和FDR<0.05标准筛选出9个差异代谢物,包括辛酸、丙戊酸、壬酸、二乙二醇单丁醚、十一烷酸、二乙茎甲苯酰胺、十二碳酸、戊乙二醇、六乙二醇。代谢通路包括类固醇激素生物合成、组氨酸代谢、初级胆汁酸生物合成、脂肪酸生物合成、谷胱甘肽代谢。在基于9个差异代谢物构建的预测模型中,病例组与子队列构建的预测模型ROC曲线下面积AUC值为0.90(95%CI=0.85~0.95)。进一步在筛查队列中靶向验证代谢物的筛查效果,筛选出8个差异代谢物,包括壬酸、单乙基甘氨酸二甲苯胺、顺式-9-十六碳烯酸、皮质醇、LPC(O-16:0)、LPC(17:0/0:0)、LPC(18:3)和PC(18:0)。在筛查队列训练集中,构建生活方式危险因素的单因素logistic回归模型,发现水源地、吸烟、饮酒具有统计学差异,基于代谢物和生活方式危险因素构建随机森林模型。结果显示,只有生活方式危险因素时,AUC值为0.82(95%CI=0.74~0.89),生活方式和代谢物结合构建的预测模型AUC值为0.93(95%CI=0.88~0.97),相比于只有生活方式的情况下,在增加代谢物后,模型的预测效果进一步提升。研究结论:①本研究共发现9个疾病进展差异代谢标志物(辛酸、丙戊酸、壬酸、二乙二醇单丁醚、十一烷酸、二乙茎甲苯酰胺、十二碳酸、戊乙二醇、六乙二醇);②ESCC的胆汁酸生物合成、类固醇生成、脂肪酸生物合成、超长链脂肪酸β氧化代谢通路存在差异;③基于9个疾病进展差异代谢标志物构建的预测模型对癌前病变进展到癌症的患者具有良好的预测效果;④在病例队列与筛查队列中共发现25个差异代谢物,进一步通过Lasso筛选出的8个差异代谢物所构建的预测模型,表明在筛查队列中显示具有较好的筛查ESCC阳性患者性能;⑤研究结果对于利用癌变过程中代谢物的变化来前瞻性预测癌变的临床实践,提供了较好的方向和基础实验依据。