目的 评估混采检测工作效率,确定最适宜采样混合数,为完善混采检测技术规范提供科学依据。
方法 利用二项分布、群检测技术原理和Python语言编程技术,分析在不同人群感染率水平下和采用不同采样混合数时,混采检测的采样和检测工作量及其加权综合工作量变化规律;分析5合1、10合1和20合1混采检测的适用场景及工作效率。
结果 人群感染率越高,最适宜采样混合数越小,加权综合工作量增长率最小值(minimum weighted comprehensive workload growth rate, MWCWGR) 越大(负数的绝对值越小),即工作效率提高越少;采样与检验单位工作量的权重比值(K)越大,最适宜采样混合数越大,MWCWGR越小(负数的绝对值越大),即工作效率提高越多。当人群感染率超过6%,且K值小于1/2时,MWCWGR即为正数,此时混采检测会增加工作量,降低工作效率,不宜采用。当K值依次为1/4、1/3、1/2、1、2、3和4时,5合1、10合1和20合1混采检测分别最适用于感染率在7‰~4%、2‰~9‰和
混合检验的主要目的是提高检测能力和效率,降低检测成本。混合检验的方法主要包括单采混检、混采检测和混采混检三种[1-4]。2020—2022年间,我国新冠肺炎疫情防控大规模人群新冠病毒核酸筛查工作中,采用了5至10份单采标本稀释混样检测,5合1、10合1和20合1等多种混采检验技术[5-8]。有的地区还尝试采用混采混检技术,以进一步提高检验工作效率、降低成本[2]。目前,对于混合检验的效率研究主要集中于单采混检,而对混采检测和混采混检的研究则较少[1-4, 9-14]。不同于单采混检,混采检测涉及二次采样检测问题。研究表明,采用最适宜的样本混合数是实现混合检测工作效率最大化的关键[12-13, 15-16]。Agarwal等[17]认为有必要通过数学模型评估混采检测的适宜采样混合数。因此,本研究采用二项分布和群检验技术原理,探讨了混采检测的工作效率和最适宜采样混合数[18]。
1 资料与方法
1.1 采样混合数、感染率、人口规模及采样与检验单位工作量权重假设
目前,我国发布的多项混采检测技术规范中,提出的采样混合数有 5合1、10合1和20合1。据此,本研究通过预分析,缩小采样混合数至2合1,扩大采样混合数至120合1;假定人群中的感染率为1%~9%、1‰~9‰和1/万~9/万三个等级区间水平;假定采样区域的总人口规模为N,每个人感染的概率均等且在采样检测期间保持不变。
假设采样与检验单位工作量的权重分别为SW和DW,SW ∶ DW=1 ∶ K,K为二者权重比值,则SW=1/(1+K), DW=K/(1+K)。假设K值依次为1/4、1/3、1/2、1、2、3和4。
1.2 混采检测方式
本研究所指的混采检测(n-in-1 test)技术指将采集自n人的n支拭子集合于1个采集管中进行核酸检测的方法,n即为采样混合数。混采检测结果为阳性、灰区或单个靶标阳性,则对该混采管的n个受试者分别重新采集单管拭子进行复核,按照复核单管核酸检测结果报告[7-8]。本研究假定检测的灵敏度和特异度均为100%。
1.3 分析方法
通过两轮采样检测发现全部阳性感染者所需的人均采样次数、人均检测管数及其加权综合工作量等指标的变化规律来评价混采检测的工作效率。
研究主要采用二项分布和群检验技术理论进行分析[13, 18]。二项分布是指在只会产生两种可能结果如“阴性”或“阳性”之一的n次独立重复试验中,当每次试验的“阳性”概率π保持不变时,出现“阳性”次数X=0,1,2,…,n的一种概率分布。其概率可由下面的公式求出(式1)[18]:
且有:,n和π是二项分布的两个参数。
对于抽样调查,若从阳性率为π的总体N中,有放回随机抽取个体数为n的样本,则出现阳性数为X的概率分布即呈二项分布。若是无放回随机抽样,当抽取的个体数n远小于总体数N(如n<N/10)时,也可近似当作二项分布处理。群检验技术是二项分布的主要应用之一,主要用于估计总体感染率,也可用于混合样品分析[18]。
本研究假设大规模人群N中的感染率为π,混合采样采用n人一组(管)。n人中只要有1人阳性,该组(管)检验结果即呈“阳性”,然后该组n人即分别再次进行单独采样检测。根据二项分布原理,n人一组(管)混合采样检测结果呈“阴性”的概率为n人中“阳性”人数X=0的概率,表示为P(0)(式2);n人一组(管)混合采样检测结果呈“阳性”的概率为n人中“阳性”人数X=1,2,…,n的概率合计,表示为P(1≤X≤n)(式3)。
据此,计算混合采样检测结果呈阳性的管数(number of positive tubes, NPT)(式4)、需再次单独采样的人数(number of resamplers, NRS) (式5),以及再次单管检测管数(number of retest, NRT) (式6)。最后计算人均采样次数(number of samples per capita, NSPC)(式7)和人均检测管数(number of tubes per capita, NTPC)(式8)。
如果采用单采单检,人均采样次数和人均检测管数则均为1。因此,本研究采用混采检测的采样工作量增长率(sampling workload growth rate, SWGR)(式9)和检测工作量增长率(detection workload growth rate, DWGR)(式10)反应采样工作效率和检测工作效率变化。同时,计算权重比值为K时的采样与检测加权综合工作量增长率(weighted comprehensive workload growth rate, WCWGR)(式11或式12),反应综合工作效率变化。
可见,如果不考虑单检与混检之间检测灵敏度与特异度的差异,式9和式10两指标均只取决于两个参数π和n的大小,与N无关;式11和式12除与π和n的大小有关,还与权重比值K有关,与N无关。因此,本研究主要分析在较大规模人群中,不同感染率下,采用不同采样混合数n时的采样工作效率和检测工作效率,绘制不同感染率、不同采样混合数情况下的SWGR变化曲线图和DWGR变化曲线图。同时,分别从不同感染率π值、不同权重比值K情况下,筛选出加权综合工作量增长率最小值(minimum weighted comprehensive workload growth rate, MWCWGR)及其采样混合数(m),即为混采检测加权综合工作效率最适宜的采样混合数m值,并制成图表。
绘制SWGR和DWGR曲线时选用2≤n≤50示意;计算最小值和绘制MWCWGR与m曲线时选用2≤n≤120,以展现最佳工作效率和最适宜采样混合数变化规律。
根据本研究结果,对采样混合数为5合1、10合1和20合1的最适宜人群感染率及混采检测效率进行评估。
1.4 分析工具
本研究采用Python语言numpy、pandas、matplotlib.pyplot 和scipy.stats等编程工具包进行数据整理分析和可视化[19-20]。
2 结果
2.1 不同感染率人群中混采检验采样与检验工作量增长率
按照人群感染率π在1%~9%、1‰~9‰和1/万~9/万三个区间取值并进行分析,绘制采样混合数n为2合1至50合1的SWGR和DWGR变化曲线图,分别见图1、图2和图3。结果显示,SWGR随着采样混合数的增加而增加,感染率越高,增加幅度越大,但不超过100%;DWGR随着采样混合数的增加呈现先下降后回升的变化趋势,存在最低值,感染率越高,下降幅度越小,但不超过0%。
2.2 不同感染率人群中混采检验加权综合工作量增长率最小值及其采样混合数
根据感染率π、采样混合数n和权重比K,计算WCWGR,筛选出MWCWGR及其采样混合数(m),结果见表1和图4。结果显示,感染率越高,最适宜采样混合数越小,MWCWGR越大(负数的绝对值越小),即混采检测效率提高越少;K值越大,最适宜采样混合数越大,MWCWGR越小(负数的绝对值越大),即混采检测效率提高越多。然而,当感染率超过6%以上,且K值小于1/2时,MWCWGR 即为正数,表明混采检测反而增加工作量,降低工作效率。此时,就不宜采用该方法。
2.3 采样混合数为 5合1、10合1和20合1混采检测技术应用的最适宜感染率及工作效率评估
表1和图4显示,当K值依次为1/4、1/3、1/2、1、2、3和4时,5合1分别最适用于在感染率为7‰~1%、9‰~1%、1%~2%、2%、3%、3%~4%和4%的人群中进行混采检测,相应的MWCWGR分别为-12.55%~-11.10%、-15.58%~-15.10%、-21.93%~-17.24%、-30.39%、-39.21%、-45.87%~-41.54%和-45.54%;10合1分别最适用于在感染率为2‰、2‰~3‰、3‰~4‰、5‰、7‰、8‰~9‰和8‰~9‰的人群中进行混采检测,相应的MWCWGR分别为-16.02%、-20.55%~-19.55%、-27.05%~-26.09%、-40.11%、-53.22%、-59.78%~-58.86%和-64.28%~-63.36%;20合1分别最适用于在感染率为5/万、6/万~7/万、8/万~9/万、1‰~2‰、1‰~2‰、2‰和2‰的人群中进行混采检测,相应的MWCWGR分别为-18%、-22.56%~-22.36%、-30.08%~-29.88%、-45.55%~-43.72%、-61.53%~-59.43%、-67.33%和-72.08%。可见,随着K值增大,采样混合数5合1、10合1和20合1混采检测技术应用的最适宜感染率分别逐步提高,加权综合工作量减少的幅度分别逐步增大。
3 讨论
本研究主要基于二项分布和群检验技术原理,推导出混采检测的采样工作效率和检测工作效率计算公式,并据此分析了人群感染率在百分率、千分率和万分率三个取值区间场景下,不同采样混合数的采样和检测工作量增长率,得到了其变化趋势图。同时,按照采样与检测单位工作量七级权重比值,分别计算了各个水平感染率情况下的MWCWGR,筛选出其中的最小值及其采样混合数。据此,对5合1、10合1和20合1混采检测的最适宜感染率及工作效率进行了评估。
本研究主要有以下发现:第一,混采检测综合工作效率的决定性因素(参数)是感染率、采样混合数,以及采样与检验的单位工作量权重,而与人口规模没有直接联系。第二,无论感染率高低和采样混合数多少,混采检测均会增加采样工作量人次数,超过单采人次数,且随着采样混合数的增加,采样人次数增加;感染率越高,增加的幅度越大,速度越快。第三,无论感染率高低和采样混合数多少,混采检测均会减少检测工作量,且随着采样混合数的增加,检测工作量呈现先减少后回升的变化趋势,但总不会超过单采单检的检测工作量。因此,存在检验工作量减少幅度最大的最佳采样混合数。感染率越低,检测工作量减少幅度越大,减少的速度越快。第四,加权综合工作量增长率分析显示,在不同感染率的人群中进行混采检测,可以得到相应的混采检测加权工作效率最高的采样混合数。感染率越高,最适宜采样混合数越小,其提高的工作效率值越低;感染率越低,最适宜采样混合数越大,甚至可以达到90合1及以上,其提高的加权工作效率值越高,可以达到75%以上。第五,当人群感染率超过6%,且K值小于1/2时,MWCWGR即为正数,此时混采检测会增加工作量降低工作效率,不宜采用。第六,不同的采样与检验单位工作量权重下,5合1、10合1和20合1混采检测技术分别有各自最适用的人群感染率水平。然而,近两年发布的多个混采检测技术规范,均未指明其适用范围,各地在实际工作中无法科学选择使用[6-8]。对此,很有必要修订完善,确保使用混采检测技术时,能根据人群感染率高低和采样与检验的单位工作量权重,正确选用最适宜采样混合数,以最大限度地提高工作效率。
本研究主要采用的是数理分析方法,其中检测效率部分的研究方法和主要研究结果与Robert D[21]对混合血清检测梅毒抗原的研究,Abdalhamid等[9]和Brynildsrud[16]对SARS-CoV-2/COVID-19混样检测效果研究及陈颖丹等[13]对混合血清检测寄生虫病的效果研究具有一致性,表明该数理分析研究方法用于实践是可行的。然而,上述研究采用实验室检测效率对比分析方法,主要针对的是实验室混样检测工作效率。本研究则是针对混采检测,不仅针对实验室检测工作效率,同时还包括现场采样工作效率。因此,本研究结果有助于制定最佳混采检测策略,提高综合工作效率。
本研究的结果分析及其应用需注意以下几点:首先,从分析原理及计算模型直观看,混采检测的工作效率不受人口规模的影响,但为了满足二项分布的应用条件,需假设人群中个人的感染概率保持均等且恒定,所应用场景的人口规模应足够大。其次,由于传染病具有一定的传染性和聚集性,通常人群中的感染率分布并不均匀,应用时须考虑到这一点,可将人群根据感染率水平细分为亚群进行分析应用。再次,本研究主要以采样和检测工作量(人力成本)变化为指标,评估混采检测的工作效率,并未考虑经济成本和流行病学调查等其他成本权重。采样工作与检测工作的单位工作量成本与单位经济成本存在一定差异,单位检测经济成本权重高于单位采样经济成本权重;如果采样混合数过大,对混采检测阳性管全体人员进行再次单独采样和流行病学调查时,会增加人力成本[22]。因此,对全要素成本—效益综合评估有待进一步研究。最后,本研究假设混采检测与单采单检的检测方法的灵敏度与特异度保持一致,实际上二者可能存在差异,样本混合数过多会增加假阴性的风险,对检测效果会产生一定影响[3, 23]。
综上,混采检测能提高采样检测综合工作效率,针对不同感染率的人群,存在提升加权综合工作效率最大化的最适宜采样混合数。本研究为分析评估混采检测工作效率提供了技术方案,为疾病筛查检测工作中针对不同的感染率水平确定能最大化提升综合采样检测工作效率的适宜采样混合数提供了参考。同时,也为开展混采检测综合成本—效益分析提供了研究方法基础。通过研究混采检测综合工作效率最大化和成本投入最小化,可以实现最优的综合成本—效益,从而为进一步优化完善疾病筛查混采检测技术规范提供科学依据。
1.王国强, 邓硕, 汪嘉懿, 等. 样本混合检测在COVID-19诊断中的应用研究[J]. 中华实验和临床病毒学杂志, 2020, 34(5): 459-461. [Wang GQ, Deng S, Wang JY, et al. Research on mixed sample detection in the diagnosis of COVID-19[J]. Chinese Journal of Experimental and Clinical Virology, 2020, 34(5): 459-461.] DOI: 10.3760/cma.j.cn112866-20200716-00207.
2.罗颖, 陈晓辉, 李维, 等. 用于新冠肺炎大规模筛查和监测的混合样本采集策略[J].中国国境卫生检疫杂志, 2022, 45(1): 34-36. [Luo Y, Chen XH, Li W, et al. Hybrid sample pooling strategy for large-scale COVID-19 screening and surveillance[J]. Chinese Journal of Frontier Health and Quarantine, 2022, 45(1): 34-36.] DOI: 10.16408/j.1004-9770.2022.01.010.
3.Lohse S, Pfuhl T, Berkó-Göttel B, et al. Pooling of samples for testing for SARS-CoV-2 in asymptomatic people[J]. Lancet Infect Dis, 2020, 20(11): 1231-1232. DOI: 10.1016/S1473-3099(20)30362-5.
4.de Salazar A, Aguilera A, Trastoy R, et al. Sample pooling for SARS-CoV-2 RT-PCR screening[J]. Clin Microbiol Infect, 2020, 26(12): 1687.e1-1687.e5. DOI: 10.1016/j.cmi.2020.09.008.
5.国务院应对新型冠状病毒肺炎疫情联防联控机制医疗救治组. 新冠病毒核酸筛查稀释混样检测技术指引[J]. 中国病毒病杂志, 2020, 10(5): 329, 332. [Medical Treatment Group of the Joint Prevention and Control Mechanism of the State Council in Response to the Novel Coronavirus Pneumonia. Technical guidelines for 2019-nCOV nucleic acid screening with diluted mixed samples[J]. Chinese Journal of Viral Diseases, 2020, 10(5): 329, 332.] DOI: 10.16505/j.2095-0136.2020.0061.
6.国务院应对新型冠状病毒肺炎疫情联防联控机制医疗救治组. 医疗机构新型冠状病毒核酸检测工作手册(试行第二版)[J]. 中国病毒病杂志, 2021, 11(3): 163-167. [Medical Treatment Group of the Joint Prevention and Control Mechanism of the State Council in Response to the Novel Coronavirus Pneumonia. Working manual of novel coronavirus nucleic acid detection for medical institutions (second trial edition)[J]. Chinese Journal of Viral Diseases, 2021, 11(3): 163-167.] DOI: 10.16505/j.2095-0136.2021.0019.
7.国务院应对新型冠状病毒肺炎疫情联防联控机制医疗救治组. 新冠病毒核酸10合1混采检测技术规范[J]. 中国病毒病杂志, 2020, 10(5): 330-332. [Medical Treatment Group of the Joint Prevention and Control Mechanism of the State Council in Response to the Novel Coronavirus Pneumonia. COVID-19 nucleic acid 10 in 1 mixed production test specification[J]. Chinese Journal of Viral Diseases, 2020, 10(5): 330-332.] DOI: 10.16505/j.2095-0136.2020.0070.
8.国务院应对新型冠状病毒肺炎疫情联防联控机制医疗救治组. 新冠病毒核酸20合1混采检测技术规范[J]. 中国病毒病杂志, 2022, 12(2): 106-107. [Medical Treatment Group of the Joint Prevention and Control Mechanism of the State Council in Response to the Novel Coronavirus Pneumonia. COVID-19 nucleic acid 20 in 1 mixed production test specification[J]. Chinese Journal of Viral Diseases, 2022, 12(2): 106-107.] DOI: 10.16505/j.2095-0136.2022.0025.
9.Abdalhamid B, Bilder CR, McCutchen EL, et al. Assessment of specimen pooling to conserve SARS CoV-2 testing resources[J]. Am J Clin Pathol, 2020, 153(6): 715-718. DOI: 10.1093/ajcp/aqaa064.
10.Alcoba-Florez J, Gil-Campesino H, García-Martínez de Artola D, et al. Increasing SARS-CoV-2 RT-qPCR testing capacity by sample pooling[J]. Int J Infect Dis, 2021, 103: 19-22. DOI: 10.1016/j.ijid.2020.11.155.
11.宋美兰, 任芙蓉, 龚晓燕, 等. 单检及16份混样检测模式对献血者核酸检测效果的比较研究[J]. 中华检验医学杂志, 2012, 35(1): 53-58. [Song ML, Ren FR, Gong XY, et al. Comparison the effect of individual donation NAT and minipool of 16 donations NAT[J]. Chinese Journal of Laboratory Medicine, 2012, 35(1): 53-58.] DOI: 10.3760/cma.j.issn.1009-9158.2012.01.013.
12.Rai B, Shukla A, Choudhary G, et al. Pool testing for COVID-19: suitable splitting procedure and pool size for India[J]. Disaster Med Public Health Prep, 2022, 16(3): 913-919. DOI: 10.1017/dmp.2020.335.
13.陈颖丹, 王聚君, 周长海, 等. 混合血清检测在寄生虫病血清流行病学调查中的应用[J].中华流行病学杂志, 2006, 27(11): 947-949. [Chen YD, Wang JJ, Zhou CH, et al. Study on the mixed testing of serum samples in seroepidemiological survey of parasitic diseases[J]. Chinese Journal of Epidemiology, 2006, 27(11): 947-949.] DOI: 10.3760/j.issn:0254-6450.2006.11.007.
14.Chen F, Geng Z, Wang J, et al. Comparing two sample pooling strategies for SARS-CoV-2 RNA detection for efficient screening of COVID-19[J]. J Med Virol, 2021, 93(5): 2805 -2809. DOI: 10.1002/jmv.26632.
15.Grobe N, Cherif A, Wang X, et al. Sample pooling: burden or solution?[J]. Clin Microbiol Infect, 2021, 27(9): 1212-1220. DOI: 10.1016/j.cmi.2021.04.007.
16.Brynildsrud O. COVID-19 prevalence estimation by random sampling in population–optimal sample pooling under varying assumptions about true prevalence[J]. BMC Med Res Methodol, 2020, 20(1): 196. DOI: 10.1186/s12874-020-01081-0.
17.Agarwal R, Gupta E, Dubey S, et al. Pooled nasopharyngeal swab collection in a single vial for the diagnosis of SARS CoV-2 infection: an effective cost saving method[J]. Indian J Med Microbiol, 2021, 39(2): 231-234. DOI: 10.1016/j.ijmmb.2020.11.002.
18.孙振球. 医学统计学(第3版)[M]. 北京: 人民卫生出版社, 2012. [Sun ZQ. Medical Statistics (3rd edition)[M]. Beijing: People's Health Publishing House, 2012.]
19.The SciPy community, 2008-2022. Statistical functions (scipy.stats)[EB/OL]. [2023-6-8]. Error! Hyperlink reference not valid.
20.The Matplotlib development team, 2012-2022. Matplotlib: Visualization with Python[EB/OL]. [2023-6-15]. https://matplotlib.org/.
21.Robert D. The detection of defective members of large populations[EB/OL]. [2023-8-8]. https://projecteuclid.org/euclid.aoms/1177731363.
22.何栩如, 孙喜琢, 宫芳芳, 等. 大规模人群新冠病毒核酸筛查成本效益分析[J]. 现代医院, 2021, 21(9): 1403-1406. [He XR, Sun XZ, Gong FF, et al. A cost-benefit analysis of the large-scale screening program for coronavirus disease-2019 (COVID-19) by nucleic acid test[J]. Modern Hospitals, 2021, 21(9): 1403-1406.] DOI: 10.3969/j.issn.1671-332X.2021.09.027.
23.Mishra B, Behera B, Mohanty M, et al. Challenges and issues of SARS-CoV-2 pool testing[J]. Lancet Infect Dis, 2020, 20(11): 1233. DOI: 10.1016/S1473-3099(20)30463-1.