下呼吸道感染所造成的死亡病例是所有感染性疾病中数目最多的,然而由于微生物检测技术的限制及患者临床特征的不典型,如何鉴定下呼吸道感染一直是临床难题。新一代宏基因组学技术可以较好的突破传统微生物检测技术的局限,但如何区分定植菌和病原菌限制了该技术的临床可行性。2018 年《美国科学院院刊》(PNAS)一项研究创新性的整合了呼吸道样本二代测序后的宿主转录组和微生物组结果用来构建判定模型,可以极好的判定下呼吸道感染病例。
研究方法
本研究一共入组了 92 名急性下呼吸道患者,所有患者均在入院 72 小时内进入 ICU 并进行机械通气。根据病原学和临床特征分为四类:LRTI+c+m: 具有明确病原学检测结果而且临床特征符合感染;no-LRTI: 无明确实验室病原学结果,无感染性疾病临床特征;LRTI+c:无微生物病原检测证据但具有感染性疾病临床特征;unk- LRTI,不明原因的重症呼吸衰绝。
所有患者呼吸道抽提物分别提取 DNA 和 RNA 进行二代测序和微生物组分析及转录组分析。使用基于规则模型,罗辑回归,弹性网线性回归,规则排除模型进行模型构建。使用 LRTI+c+m 和 no-LRTI 组患者作为模型训练集和验证集。
图 1 患者分组,模型构建和验证使用效果示意图
研究结果
1. 对 RNA 和 DNA 测序的数据进行微生物组分析,对于 RNA-seq 中检测到的细菌,真菌和 DNA 病毒,必须同时在 DNA-seq 中出现才可以定义为成功鉴定。在具有明确病原学特征的 LRTI+c+m 组中,病原的丰度明显高于其他菌群,因此,本研究对每名患者均取相对丰度排名前 15 的微生物进行研究,在 LRTI+c+m 组中,除了已经检测出的病原,其他微生物均划归为「定植菌」。构建基于规则模型,当设置阈值为 0.1 RPM 时,模型的准确率可以达到 98.4%。由于基于规则模型太严格,可能会漏掉潜在的致病微生物,采用逻辑回归模型并对训练集进行留一验证,发现在概率阈值设置为 0.36 时,模型在训练集和测试集上的准确率可以达到 96.4% 和 95.6%,AUC 也增加到了 0.997。在罗辑回归模型中,LRTI+c+m 组中病原的概率值总是高于定植菌,因此,使用微生物的罗辑回归概率值作为标准判定患者是否感染时,AUC 值可达到 0.97。
图 2 患者病原相对丰度及模型区分病原和定植的效果
2. LRTI+c+m 组患者微生物组α 多样性和β 多样性均低于 no- LRTI 组,但用微生物组多样性来判定时,AUC 低于 0.9。因此,微生物组多样性单独作为判定标准时不是一个很好的指标。
图 3 微生物组多样作为判定标准时的表现
3. RNA-seq 分析显示 LRTI+c+m 患者天然免疫,NF-κβ 信号通路,干扰素相关的基因表达上调,而 no-LRTI 患者氧化物反应, MHC II 受体通路上调。基于此构建包含 12 个基因的弹性网回归模型并进行留一交叉验证,结果显示 AUC 可达 0.9。
4. 整合病原判定模型(罗辑回归),微生物组多样性模型,和 RNA-seq 的宿主反应特征,可以最大化对 LRTI 判定的准确率。其对 LRTI 是否为感染的判定敏感性和特异性分别达到 100% 和 87.5%。
结论
该研究整合了 LRTI 呼吸道样本病原,微生物组多样性,和宿主反应的特征用来区分感染性和非感染性的下呼吸道重症肺炎,取到了非常高的准确率和敏感性。该研究提供了一整套病原,微生物组和宿主反应分析和流程,可以为临床判定是否感染提供指导。
本研究是典型小样本+精分析的研究文章,样本量并不大,模型训练集和测试集只有 20 和 18 个患者,但创新性整合病原,微生物组多样性,宿主反应的信息,同时利用了多个机器学习模型来挖掘数据,取得了良好的效果。该研究设计临床入组,实验室微生物检测和二代测序,后续生物信息学分析及下游的数据挖掘和机器学习,涉及临床,科研,数据分析团队的通力合作,值得国内学习和借鉴。
供稿者:邹晓辉 中日医院呼吸与危重症医学科 临床微生物与感染实验室
原文出处:Langelier C, Kalantar K L, Moazed F, et al. Integrating host response and unbiased microbe detection for lower respiratory tract infection diagnosis in critically ill adults[J]. Proceedings of the National Academy of Sciences, 2018, 115(52): E12353-E12362.
本网站内容转载需联系版权方授权