病原宏基因組高通量測序臨床本地化檢測規(guī)范專家共識
中國藥師協(xié)會, 中華醫(yī)學會細菌感染與耐藥防治分會, 國家衛(wèi)生健康委臨床抗微生物藥物敏感性折點研究和標準制定專家委員會.
DOI:10.3760/cma.j.cn112150-20230720-00019
基于 PCR-free 建庫的 mNGS 實驗可在同一個空間內(nèi)設(shè)置試劑準備區(qū)、標本處理區(qū)(配備生物安全柜)和建庫測序區(qū)(PCR-free 建庫、文庫純化、等量混合、上機測序)。PCR-free 文庫濃度可能低于 Qubit 熒光定量儀的檢測限,建議使用熒光定量 PCR(quantitative polymerase chain reaction,qPCR)方法進行文庫濃度測定。雖然基于 PCR-free 建庫的 mNGS 實驗在文庫定量前實驗操作不存在 PCR 擴增建庫所帶來的氣溶膠風險,但仍然需要警惕人員操作等帶來的氣溶膠污染可能性,并在一個相對獨立的空間進行 qPCR 法文庫濃度測定。
(1)濕實驗應(yīng)由具備分子生物學檢驗專業(yè)技能的人員,如分子生物學檢驗專業(yè)檢驗技師操作;
(2)干實驗需要配備生物信息研發(fā)及管理人員,以保證分析流程、持續(xù)更新、性能確認、維護及管理 [12];
(3)結(jié)果審核應(yīng)配備具有臨床感染病學相關(guān)知識的微生物檢驗醫(yī)師。針對疑難報告,建議成立 mNGS 報告解讀團隊,由具備臨床感染病學、臨床微生物檢驗學、臨床分子生物學、生物信息學等相關(guān)專業(yè)知識的人員組成。所有人員均須通過崗位相關(guān)的培訓和考核,并進行定期能力評估方能上崗。
核酸提取和純化若使用手工操作,應(yīng)考慮不同標本類型的差異、不同核酸提取試劑盒的提取效率、純度以及片段大小等因素;若使用自動化核酸提取儀系統(tǒng),需要綜合考慮檢測通量、自動化程度、成本、核酸質(zhì)量等因素。
實驗室應(yīng)確定原始測序數(shù)據(jù)及 FASTQ 文件在服務(wù)器上存儲的位置,并明確具備唯一標識的統(tǒng)一命名,便于數(shù)據(jù)調(diào)用與快速分類查找。文件命名建議包含數(shù)據(jù)檢測/分析日期、檢測實驗室名稱、標本類型、測序批次、唯一的標本編碼等。命名規(guī)則一旦確定不得隨意改動。
實驗室可通過 FASTQC[19] 和 MultiQC[20] 等軟件查看測序數(shù)據(jù)質(zhì)量、總數(shù)據(jù)量、堿基質(zhì)量值(Q20 和 Q30)等,結(jié)合測序芯片泳道上生成的簇密度設(shè)置質(zhì)控點(如簇密度是否偏離有效范圍,堿基識別質(zhì)量值≥Q30 的數(shù)據(jù)比例是否偏低)判斷本批次數(shù)據(jù)能否用于后續(xù)分析。數(shù)據(jù)過濾規(guī)則可根據(jù)實驗室對 mNGS 檢測的敏感性和特異性需求進行調(diào)整,建議設(shè)置 Q30 堿基數(shù)量占比>75%、有效序列長度不小于 50bp、含 N 堿基比例小于 10% 等參數(shù)閾值。
為了提高微生物數(shù)據(jù)的分析時效性,需要去除測序數(shù)據(jù)中的宿主序列,通常方法是把比對到人類基因組的序列進行過濾。真菌和寄生蟲與人類的基因組序列有一定的同源性,在過濾宿主序列的過程中需要評估運行時間、去除效率與非特異性去除(非人源序列而被錯誤過濾)的序列比例。
物種注釋是病原宏基因組檢測最核心的內(nèi)容之一,主要是將通過質(zhì)量控制的非宿主序列與微生物參考數(shù)據(jù)庫比對,或者經(jīng)過從頭組裝成 contigs/scaffolds 后再比對到微生物參考數(shù)據(jù)庫,確定在特定序列相似性閾值(如≥97%)下的物種分類級別。物種注釋的準確性取決于所選注釋工具的敏感性和特異性、算法閾值的合理性、參考數(shù)據(jù)庫的完整性及其納入微生物基因組的準確性 [12]。目前可用的注釋工具分為三類:
(1)DNA-to-DNA 比對工具;
(2)DNA-to-Protein 比對工具;
(3)基于特征標記基因的比對工具。有研究表明,利用相同的模擬數(shù)據(jù)集測試不同的宏基因組學分類工具,發(fā)現(xiàn)不同的分類工具識別的物種數(shù)量可能相差 3 個數(shù)量級以上 [21]。在 mNGS 中,DNA-to-DNA 工具往往比 DNA-to-Protein 工具能夠更好地進行物種分類 [22],但 DNA-to-Protein 工具在識別新發(fā)和高度可變的基因序列時敏感性更高 [23]。而在以注重物種豐度的微生物組學分析中,則推薦使用基于特征標記基因的比對工具 [24]。
總之,實驗室在選擇物種注釋工具時,應(yīng)基于檢測的預(yù)期用途,從運行速度、準確率、精確率、召回率等維度評估性能 [17]。實驗室可使用近緣物種的基因序列對分析軟件的物種注釋功能進行評估,另外在數(shù)據(jù)庫或分析算法有變更時,以及定期對本實驗室的 mNGS 物種/基因注釋功能進行評估。
微生物參考數(shù)據(jù)庫的選擇顯著影響物種注釋分類的結(jié)果 [25,26]。《宏基因組測序病原微生物檢測生物信息學分析規(guī)范化管理專家共識》[17] 中對 mNGS 常用微生物數(shù)據(jù)庫的特征有較為詳細的描述。目前沒有任何一個公共數(shù)據(jù)庫能夠包含所有的潛在人類病原體的基因組信息(假陰性風險),且數(shù)據(jù)庫中不可避免地存在一些注釋錯誤或污染的序列(假陽性風險)[27]。因此在構(gòu)建、使用和管理這類數(shù)據(jù)庫時需要重點關(guān)注以下問題:
(1)充分評估數(shù)據(jù)庫的全面性以及納入物種在分類學上的代表性。同一微生物,往往具有遺傳差異的不同亞型或株,在選擇基因組時,應(yīng)該考慮到微生物的遺傳多樣性,盡可能多地納入不同亞型或株的高質(zhì)量基因組;
(2)無論所選參考基因組的來源如何,實驗室都需要通過重測序或其他技術(shù)手段確認其注釋的準確性,序列的完整性,避免納入錯誤注釋、命名錯誤或代表性不足的微生物序列;
(3)病原體(尤其是 RNA 病毒)在自然狀態(tài)下是不斷發(fā)生變異的,所以需要及時(或定期)對參考數(shù)據(jù)庫中的基因組信息進行更新及驗證 [28,29],更新的頻率取決于實驗室或臨床的需求,以及序列在公共數(shù)據(jù)庫中的上傳或更新時間 [28];發(fā)生可能影響結(jié)果的數(shù)據(jù)庫修改、替換及更新等活動均需要重新進行評估;建議實驗室每年對微生物數(shù)據(jù)庫進行審核,必要時隨時進行更新。但是對于使用本地化服務(wù)器的實驗室,構(gòu)建的數(shù)據(jù)庫大小需要權(quán)衡服務(wù)器的計算能力以及報告的時效性要求。
mNGS 檢測到的微生物常以讀長數(shù)作為結(jié)果,但它受測序量、標本質(zhì)量等因素的影響,并且同張芯片不同文庫分配的下機數(shù)據(jù)量會有波動,所以有必要對讀長進行歸一化處理 [30]。建議將每百萬測序讀長中匹配到某一微生物基因組的特異讀長(reads per million,RPM)作為歸一化指標 [30]。如果希望比較不同微生物在同一文庫中的讀長,則還需考慮微生物基因組大小不同帶來的差異(理論上,在相同條件下,基因組越長,測得的讀長越多),建議通過計算每百萬測序量下每一千個堿基的基因組長度的歸一化讀長來消除這種影響 [28]。需要注意,由于 mNGS 檢測原理不同于 qPCR,RPM 不能作為微生物核酸的定量指標。
由于缺乏標準的 mNGS 生物信息學分析方案,各實驗室自建分析流程內(nèi)部使用的分析軟件與數(shù)據(jù)庫處在不斷更新、確認及完善的動態(tài)過程中。為了保證每批次臨床標本結(jié)果的可溯源性及可重復(fù)性,實驗室需要明確每一次測試所使用的軟件及數(shù)據(jù)庫的版本,建議在報告單中體現(xiàn),至少應(yīng)包括分析日期、軟件名稱和版本號、對每個組成工具及算法的用戶自定義參數(shù)和系統(tǒng)默認值等 [28],可使用版本管理工具如 Conda 完成 [31]。此外,可使用流程管理工具如 Snakemake 和 Nextflow 等對整個工具集進行版本控制。
(1)臨床標本測序數(shù)據(jù)集:注釋充分、特征明確的臨床標本測序數(shù)據(jù)(FASTQ 或其他格式)[32];
(2)計算機模擬測序數(shù)據(jù):利用序列模擬軟件模擬生成測序數(shù)據(jù)集 [16,33],要求既要具有與真實測序數(shù)據(jù)質(zhì)量相同/相似的技術(shù)參數(shù)(文庫片段長度分布、測序模式、測序錯誤類型及頻率、測序質(zhì)量值、測序深度等)[16,34],也要盡可能對臨床標本的背景成分信息如宿主核酸、微生物和試劑背景核酸等進行模擬;
(3)組合數(shù)據(jù)集:利用序列模擬軟件定量模擬一種或多種目標病原體的測序數(shù)據(jù),然后將模擬序列添加到目標病原體陰性標本的真實測序數(shù)據(jù)中,形成接近臨床標本的模擬數(shù)據(jù)集 [16]。
利用上述數(shù)據(jù)開展性能確認,確定干實驗流程的主要性能指標,包括準確率、精確率、召回率和 F1-Score(即精確度和召回率的調(diào)和平均值)等 [28,35]。如果在比對過程中出現(xiàn)寄生蟲的假陽性結(jié)果(寄生蟲為真核生物,與宿主序列相似度較高,且部分寄生蟲基因組數(shù)據(jù)中存在人源序列的污染),需要考慮設(shè)置更高的陽性匯報閾值或者對相應(yīng)寄生蟲的基因組數(shù)據(jù)進行清洗。常見的寄生蟲匯報閾值為與陰性對照相比 RPM 達到 10 倍以上,基因組數(shù)據(jù)清洗常采用把目標寄生蟲基因組單獨與人基因組比對并去除高度同源的序列 [36]。
表 1 模擬參考品示例
注:人源細胞濃度 1×10 5 cells/ml
- 批內(nèi)精密度:將上述參考品在同一時間內(nèi)用相同批次試劑完成 3 個全流程重復(fù),分析批次內(nèi)結(jié)果重復(fù)性。
- 批間精密度:用不同批次的試劑分別將上述參考品在 3 個工作日內(nèi)完成各 3 個全流程重復(fù),分析批次間重復(fù)性。
- 可接受標準:對陽性標本,分析結(jié)果是指通過生信流程得到的檢出病原中包括該參考品中的病原體,則記為正確結(jié)果,否則為錯誤結(jié)果。結(jié)果一致的實驗數(shù)占全部實驗數(shù)比例高于 95%,判斷為可接受。
- 樣本選擇:全流程檢測不少于 20 例標本,包括 6 例陽性參考品(每例模擬混合參考品包含不少于 4 種微生物),14 例臨床標本(不少于 10 例培養(yǎng)陽性)。分析檢測結(jié)果與已知參考品的內(nèi)含微生物以及臨床綜合判斷結(jié)果是否一致,對于結(jié)果不一致的使用 qPCR 或者送至另一穩(wěn)定運行的 mNGS 實驗室進行差異檢驗。
- 可接受標準:20 例標本中物種準確性≥90%,則驗證通過。對于臨床標本,金標準方法和結(jié)合臨床信息綜合判定的病原體在 mNGS 檢測結(jié)果列表之中可判定為符合。
- 濃度選擇:使用陽性參考品梯度稀釋至擬定的檢出限濃度,可重復(fù)測定 5 次或在不同批內(nèi)對該濃度標本進行 20 次重復(fù)測定(如測定 5d,每天測定 4 份標本)??筛鶕?jù)情況選用稀釋液或陰性標本,該稀釋液不得含有被驗證的目標病原體。
- 判斷標準:如果是 5 次重復(fù)檢測,必須全部檢出靶核酸;如果是 20 次檢測,必須檢出至少 19 次(95% 檢出率)靶核酸。
- 實驗過程:將投入 5~10 倍 LoD 病原體的臨床模擬標本,在 4℃、-20℃冰箱分別保存 1、4、7d,在-80℃冰箱分別凍融 1 和 2 次,評估對檢測結(jié)果的影響。
- 可接受標準:所有重復(fù)均檢出目標病原體。
臨床檢測性能評價主要采用觀察性研究。觀察性研究中通過評價 mNGS 檢測結(jié)果與臨床其他參考方法結(jié)果的一致性,確認敏感性和特異性。研究應(yīng)遵循《世界醫(yī)學大會赫爾辛基宣言》的倫理準則和國家涉及人的生物醫(yī)學研究倫理的相關(guān)要求,應(yīng)當經(jīng)倫理委員會審查并同意。標本量與預(yù)期用途、評價指標等多種因素相關(guān)。標本量估算通常是基于統(tǒng)計學要求的最低標本量估計 [41]。值得注意的是,在評價某些罕見的病原體,陽性病例的數(shù)量有限,可以引用文獻報道的臨床敏感性和特異性作為理論支撐 [42]。實驗室可采用 “代表性病原體” 進行臨床診斷性能評價 [43,44,45],比如根據(jù)臨床預(yù)期用途選擇不同類型的常見的病原體 [43],以期為同類病原體提供參考和借鑒。近年來已發(fā)表數(shù)篇基于腦脊液、呼吸道標本、血漿等標本類型的 mNGS 檢測流程和臨床性能確認的研究可供實驗方案參考 [16,25,36,46,47]。
- 盡早使用:危急重癥感染或局部感染不及時處理則后果嚴重,恐危及生命時,應(yīng)在常規(guī)病原檢測基礎(chǔ)上,盡早使用 mNGS 檢測輔助明確病原體 [43,59];特殊病原體感染,存在群體性感染事件風險,應(yīng)在開展常規(guī)快速檢測的同時,盡早使用 mNGS 檢測輔助明確病原體。
- 在治療過程中使用:高度疑似感染性疾病,但傳統(tǒng)微生物檢測反復(fù)陰性且治療效果不佳時,考慮在完善常規(guī)病原學檢測的同時或在其基礎(chǔ)上開展 mNGS 檢測;傳統(tǒng)病原學檢測的結(jié)果不能解釋臨床表現(xiàn)的全貌或/和抗感染治療的反應(yīng),懷疑同時存在其他病原感染時,考慮在進一步完善更多病原學檢測的同時或在其基礎(chǔ)上開展 mNGS 檢測;特殊患者如免疫抑制、器官移植術(shù)后、反復(fù)住院、合并基礎(chǔ)疾病,疑似繼發(fā)感染、新發(fā)感染時,考慮常規(guī)病原學檢測的同時或在其基礎(chǔ)上開展 mNGS 檢測 [60,61]。
- 擇期使用:表現(xiàn)為慢性或局部感染,或慢性疾病不除外感染,在嘗試常規(guī)病原學檢查未能明確致病源或/和規(guī)范性經(jīng)驗抗感染治療無效時,建議在進一步完善常規(guī)病原學檢測的基礎(chǔ)上,與患者充分溝通后擇期使用 mNGS 檢測輔助明確病原體 [51]。
mNGS 檢測技術(shù)幾乎適用于所有類型的臨床標本,標本的選擇須結(jié)合患者情況、流行病學、病原體特性、受累器官及感染部位等狀況綜合考慮。懷疑高致病性、新發(fā)或突發(fā)傳染病原微生物時,標本運送須經(jīng)相關(guān)部門批準,嚴格按照《人間傳染的病原微生物目錄》[63] 的危害程度分類及國際民用航空組織《危險品航空安全運輸技術(shù)細則》[64] 的分類包裝及轉(zhuǎn)運要求運輸標本,如通過其他交通工具運輸也應(yīng)參照以上述標準 [65]。臨床常見標本的選擇見表 2。
表 2 mNGS 檢測的臨床標本類型
從無菌部位采集標本,應(yīng)嚴格執(zhí)行無菌操作,避免污染。從有菌部位采集標本,應(yīng)采取相應(yīng)防污染措施,避免定植或污染菌對結(jié)果的干擾。標本采集后應(yīng)使用無菌、無核酸污染、帶蓋的專用容器,采集后封口膜密封,識別碼標記,及時(建議 2h 內(nèi))送檢。臨床在送檢時盡可能提供詳細的臨床信息(如患者流行病學史、感染癥狀體征、疑似感染灶、疑似病原體、影像學/病理學證據(jù)等)供實驗室人員綜合參考以便于測序數(shù)據(jù)的正確解讀。標本運輸過程中須防污染、防震蕩,使用冷鏈系統(tǒng)轉(zhuǎn)運。
法定傳染病病原體:包括《傳染病防治法》規(guī)定的各類傳染病病原體。病原體種類應(yīng)根據(jù)國家相關(guān)法律法規(guī)的修正進行及時調(diào)整。其他烈性傳染病病原體:建議參考《人間傳染的病原微生物目錄》中對高致病性病原體的相關(guān)定義。
建議根據(jù)國家規(guī)定和驗證需求將標本在有資質(zhì)的實驗室內(nèi)進行分離培養(yǎng)、特異基因片段檢測、特異性抗原抗體檢測等方法復(fù)核。如沒有剩余標本,應(yīng)在做好生物安全防護的情況下進行臨床重新采樣,應(yīng)用傳染病診斷標準中規(guī)定的實驗室診斷技術(shù)進行病原檢測,基于病原檢測結(jié)果,結(jié)合臨床癥狀、流行病學史,依據(jù)現(xiàn)行傳染病診斷標準進行診斷。
如患者被診斷為傳染病的,按照《傳染病防治法》等法律法規(guī)規(guī)定的流程上報疾控部門,并且對患者、標本等進行規(guī)范的處置。應(yīng)按要求將剩余標本或重新采集標本送上級部門進行確認,并上報患者情況,同時做好必要的患者隔離措施和相關(guān)治療工作。
若檢出疑似新發(fā)病原體,應(yīng)立即組織專家開展研判,尤其當疑似新病原體的序列與已知的烈性或者高傳染性病原體序列相似,或者短時間內(nèi)從≥2 例流行病學相關(guān)患者中檢出疑似新病原體時,應(yīng)立即上報有關(guān)部門。
檢出法定傳染病及烈性傳染病病原,尤其是當檢出甲類傳染?。ㄊ笠摺⒒魜y)以及部分傳染性較強、危害較大的乙類傳染?。ㄈ鐐魅拘苑堑湫头窝住⒓顾杌屹|(zhì)炎、人類高致病性禽流感、炭疽等)病原體,應(yīng)立即對下機數(shù)據(jù)的質(zhì)量,特別是比對到烈性傳染病的特異性序列的準確性、讀長數(shù)、基因組覆蓋度等數(shù)據(jù)進行嚴格核實,確認可排除背景核酸污染以及特異性序列比對無誤的前提下,同時啟動標本復(fù)核程序。當從標本中檢出明確可導(dǎo)致感染且能排除污染、定植微生物和背景核酸時,應(yīng)報告高度懷疑該病原菌為引起感染的病原菌?;颊邿o菌部位標本如血液和腦脊液標本中檢出可疑病原菌,在無其他感染病原證據(jù)且能排除污染、定植微生物和背景核酸時,應(yīng)報告為可疑致病微生物。從開放性腔道如呼吸道或可能存在皮膚定植菌污染部位的標本中檢出條件致病微生物時應(yīng)結(jié)合序列數(shù)、文庫濃度、患者臨床病史信息、感染相關(guān)指標,會同多學科專家進行討論明確是否為責任病原體。報告單中應(yīng)至少包含檢出的病原微生物種屬名稱、唯一比對的讀長數(shù)、相對豐度和室內(nèi)質(zhì)控數(shù)據(jù),以及對術(shù)語、技術(shù)參數(shù)和病原微生物的注釋。mNGS 報告中的病原體物種名稱應(yīng)標注標準的中英文名稱,部分可參考的網(wǎng)站包括細菌網(wǎng)站 https://lpsn.dsmz.de/和真菌網(wǎng)站 https://www.mycobank.org 等。
通過耐藥/毒力基因預(yù)測病原菌對抗菌藥物的敏感性以及病原體的致病力,可為臨床的抗感染治療提供參考依據(jù)。但需要注意的是,不是所有的耐藥/毒力基因存在即表達,可能存在基因型和表型不一致的情況;部分導(dǎo)致耐藥/致病的機制尚無法通過檢測基因來明確;目前對于耐藥/毒力基因的物種歸屬分析技術(shù)尚未完善。因此,應(yīng)謹慎開展以耐藥/毒力基因來預(yù)測病原微生物耐藥性和致病力。對于實驗室可開展常規(guī)藥敏試驗檢測病原菌對抗菌藥物敏感性結(jié)果的藥物,不宜以耐藥基因結(jié)果進行預(yù)測,應(yīng)以表型法藥敏試驗結(jié)果為準。
執(zhí)筆人:
楊啟文(中國醫(yī)學科學院北京協(xié)和醫(yī)院檢驗科);馬筱玲(中國科學技術(shù)大學附屬第一醫(yī)院檢驗科);張建中(中國疾病預(yù)防控制中心傳染病預(yù)防控制所);李軼(河南省人民醫(yī)院檢驗科);吳文娟(上海市東方醫(yī)院檢驗科);楊繼勇(解放軍總醫(yī)院檢驗科);韓東升(浙江大學醫(yī)學院附屬第一醫(yī)院檢驗科);李家斌(安徽醫(yī)科大第一附屬醫(yī)院感染科);羅燕萍(解放軍總醫(yī)院檢驗科);周華(浙江大學醫(yī)學院附屬第一醫(yī)院呼吸科);谷麗(首都醫(yī)科大學附屬北京朝陽醫(yī)院感染科);張西京(空軍軍醫(yī)大學西京醫(yī)院重癥醫(yī)學科);李敏(上海交通大學醫(yī)學院附屬仁濟醫(yī)院檢驗科);單斌(昆明醫(yī)科大學附屬第一醫(yī)院檢驗科);胡付品(復(fù)旦大學附屬華山醫(yī)院抗生素研究所);劉正印(中國醫(yī)學科學院北京協(xié)和醫(yī)院感染科);周海?。ㄖ袊膊☆A(yù)防控制中心傳染病預(yù)防控制所)
主要審稿專家(按姓氏首字母順序排列):
陳德昌(上海交通大學醫(yī)學院附屬瑞金醫(yī)院重癥醫(yī)學科);馮四洲(中國醫(yī)學科學院血液病醫(yī)院血液科);顧兵(廣東省人民醫(yī)院檢驗科);胡繼紅(國家衛(wèi)生健康委員會臨床檢驗中心);劉曉琳(國家衛(wèi)生健康委員會合理用藥專家委員會);孫自鏞(華中科技大學附屬同濟醫(yī)院檢驗科);施毅(南京大學醫(yī)學院附屬金陵醫(yī)院呼吸科);王明貴(復(fù)旦大學附屬華山醫(yī)院抗生素研究所);王佳偉(首都醫(yī)科大學附屬北京同仁醫(yī)院神經(jīng)內(nèi)科);徐英春(中國醫(yī)學科學院北京協(xié)和醫(yī)院檢驗科);肖永紅(浙江大學醫(yī)學院附屬第一醫(yī)院感染科);俞云松(浙江省人民醫(yī)院感染科);張耀華(中國藥師協(xié)會);鄭磊(南方醫(yī)科大學南方醫(yī)院檢驗科);鄭波(北京大學第一醫(yī)院感染科);卓超(廣州醫(yī)科大學附屬第一醫(yī)院感染科);周鐵麗(溫州醫(yī)科大學附屬第一醫(yī)院檢驗科)
參考文獻:略