低剂量CT筛查肺癌的应用进展AME肺癌
2021-11-8 来源:不详 浏览次数:次Authors:HenryM.Marshall1,RayleenV.Bowman1,IanA.Yang1,KwunM.Fong2,ChristineD.Berg31DepartmentofThoracicMedicine,ThePrinceCharlesHospital,Brisbane,Australia;UniversityofQueenslandThoracicResearchCentre,SchoolofMedicine,TheUniversityofQueensland,Brisbane,Australia2DepartmentofThoracicMedicine,ThePrinceCharlesHospital,Brisbane,Australia;2UniversityofQueenslandThoracicResearchCentre,SchoolofMedicine,TheUniversityofQueensland,Brisbane,Australia3UniversityofQueenslandThoracicResearchCentre,SchoolofMedicine,TheUniversityofQueensland,Brisbane,Australia;Formerly,DivisionofCancerPrevention,NationalCancerInstitute,Bethesda,Maryland,USA
前言
年大约万人死于肺癌(1),肺癌是全世界癌症患者的主要死因。肺癌发病率及病死率的升高紧随吸烟流行趋势,并具有20年的时间延后,这可以解释诸如美国等国家肺癌的病死率下降或处于稳定水平,而中国肺癌病死率在上升的现象(2,3)。肺癌预后较差,欧美报道的5年生存率为8%~16%,中国报道的5年生存率为6-32%(4-6)。
当前25-30%的患者表现为局限性、潜在可治愈的疾病,这些IA期的非小细胞肺癌(NSCLS)患者的5年生存率为73%,相反那些远处转移的患者预后很差(5年生存率13%)(7,8)。
鉴于肺癌有可检测的临床前阶段、有效的治疗(特别是手术)、潜在有效适用的具有成本效益的筛查方法,看起来符合Wilson和Jungner所描述的可进行筛查实验的标准(9)(框1)。尽管应用胸部平片(CXR)进行筛查有很多方法学上的缺点(11),而且通过PLCO癌症筛查试验结果来看CXR也并没有带来生存获益(12),但这种方法依然是被普遍接受的。相比之下,CT是一种更加敏感的显像模式,过去25年CT一直被研究用于肺癌的筛查。最近国家肺癌筛检试验(NLST)(13)研究结果显示与CXR相比,低剂量CT(LDCT)筛查降低了20%的肺癌病死率。这项研究首次通过随机对照试验证实,通过筛查可降低病死率。几个专家团体基于这些新的发现在美国发布了筛查肺癌高危人群的指南,美国预防服务工作组把其判定为B级推荐方案(14-17)。
框1早期疾病检测原理(改编自威尔逊和杨格纳)。
LDCT筛查—实际问题和技术因素
实施LDCT筛查高危人群时,面对的最重要的问题是:较高频率的阳性检测结果,主要是肺结节。
结节检测
肺结节可以较好或者较差地定义为圆形或不规则的不透明体,测量直径达3厘米(18)。但识别结节具有内在的主观性,在不同的阅片者之间或者同一个阅片者多次阅片时,存在变异性,即使是在具有丰富经验的放射学家之间,也存在这种变异性(19,20)。
相当大比例的结节初次阅片时可能被忽略,需要在接下来的回顾性阅片时才能被确定(21)。结节检出率可能因“第二个阅片者”的参与而增加(22),比如图像格式化、最大强度投影(MIPs)(23-25)或计算机辅助诊断(CAD)系统软件均可作为“第二阅片者”(26-28)。
结节评估
以下四个重要方面可对结节进行很好的分类:尺寸、衰减、是否存在钙化、当可获得连续随访的图像时可计算时间间隔增长率。
尺寸
结节尺寸是非常重要的恶性肿瘤预测因子(图1)(29-31)。通过对基线NLST试验结果分析发现:恶性肿瘤结节直径为7-10毫米时阳性预测值(PPV)为1.7%,当结节直径增大为:11-20、21-30、30mm时,阳性预测值分别增加为11.9%、29.7%和41.3%(32)。然而即使是非常小的结节(微结节),也有一些恶性肿瘤的风险,比如个5毫米直径结节中有3个结节(1.3%)在基线扫描随访1年后确诊为恶性(33)。
图1结节大小与恶性肿瘤的风险相关。
衰减
某些结节中的钙化模式和内部结节性脂肪,可确切地提示其为良性(34),然而许多结节太小而不能分辨其内部特性,这一类结节被简单地归类为“非钙化的结节”(NCNs)。NCNs很常见,见于25-50%的LDCT扫描中。
大多数的NCNs是“实性的”(软组织)放射衰减。其余分为非实性结节(NSNs),并进一步细分为纯毛玻璃结节(pGGO)或混合(部分固体)衰减结节(实性的和毛玻璃混合;psGGO)。同一性质结节在不同研究间具有差异(图2)。GGOs的意义将在下面进行讨论。
图2通过LDCT筛查进行结节分类检测。
毛玻璃结节
ELCAP研究报道基线扫描结节的阳性率为/1,。19%的病变为pGGO或psGGO(患病率4.4%;层厚10毫米),共检测到27例癌症患者。在对尺寸这个因素进行校正之后发现,psGGO恶性率为63%,实性结节的恶性率为32%,pGGOs的恶性率为13%(35)。其他的研究特别强调新发的或逐渐增多的实性NSNs的重要性,如果发现此类NSNs则高度怀疑肺癌(36-38)。最近的研究表明许多NSNs会自发地分解。Felix(39)报告了37/例患者,其中有75个GGOs(患病率13%;层厚0.75毫米)。筛查研究的人口是非典型的,因为超过一半的人有肺癌或头部癌症病史。大约一半的GGOs在基线筛查时被检测到,但在平均29个月随访之后消失。没有形态学特征可明确鉴别分解或者未分解的GGOs。Kwon(40)报告了通过筛选例患者,检测到69个pGGO和个psGGO(总筛查数没有报告,层厚5毫米)。3个月后45%的患者结节退化或消失,恶性和良性病灶大小相似(平均15-16毫米),只有27%(33/)是恶性的,但这也许只反映了短随访的结果(平均随访时间8.6个月,文章发表前64个病变仍在积极随访)。第二项由韩国人进行的研究显示(41),在93/16,(0.5%)非典型筛查结果中确认了个直径5毫米的NSNs,其中的44个患者从未吸烟,70%的NSNs是短暂出现的,年纪较轻、在随访扫描中发现、血嗜酸性粒细胞、多个病灶、较大的固体成分、模糊的边界是判断NSNs是否短暂出现的独立预测因子。马里奥从一个高危筛查队列中,回顾性报道了(42)在56/1,个基线筛查扫描中发现了76个NSNs(患病率3%;层厚0.75毫米),平均随访50±7.3个月,只有13个结节是前瞻性确定的,40/48(83%)pGGOs分解、尺寸上减小或保持稳定,16/28(57%)psGGOs分解或保持稳定。总体而言,74%NSNs分解、减少或保持稳定,26%出现进展,其中有一个psGGO(2%)被证实为肺腺癌。
总之,50-70%通过现代薄层CT扫描发现的的NSNs是短暂存在的,但目前仍不能预测哪些NSN持续存在。研究数据显示:西方与亚洲人群在NSN发病率上有实质性差异。鉴于非实性肿瘤增长缓慢(37,43),对于未分解的NSNs积极监测2年可能是审慎的(44)。
增长率
一旦得到连续随访扫描结果即可以评估结节的增长情况。一般来说,如果一个实性结节超过2年时间没有增长,那么这个结节是恶性的可能性极小(45),尽管同时代的文献回顾发现的基础数据(基于从年代开始CXR研究)不那么引人注目(46)。
CT可很好地评估结节的增长情况。假设在指数增长情况下,一个5毫米直径的结节在天体积倍增时间(VDT)下,一年以后直径会增加到6毫米,2年后会增加到7.2毫米,经过两年的变化,CXR不能够衡量的结节可被CT检测到。然而,可重复的测量是困难的,在这项研究中(47)阅片者测量的结节平均值的95%置信区间(CIs)为8.5±1.73毫米。使用计算机软件半自动容积测量可能具有良好的重复性和精确度(48,49),这也是NELSON试验(47-50)的测量基础。然而即便这样还是存在误差,例如对小结节、存在运动加工品(51)、结节附着其它结构和NSNs(52)的测量。
对于亚厘米的NCNs,有限的长期随访数据支持,适用于2年稳定期指南。在一项爱尔兰的研究(53)中83例10毫米NCNs稳定两年以上,并在随访七年后再次行影像检查,几乎所有结节依然维持不变,然而一个3毫米GGO在四年之内增加到15毫米,随后被诊断为支气管肺泡细胞癌(以前的称谓)。因此在理想的情况下,基于CXR研究确定的两年稳定准则,应该被较大的、当代的CT数据集所验证。
NELSON筛查试验显示出基线尺寸及增长间隔的重要性(54)。个5-10毫米直径的实性结节被随访一年时间,所有边界光滑和/或附属于裂隙带、胸膜或者血管(接触长度≧结节直径的50%)的个结节是良性的,并从多因素分析中剔除这些良性结节。对针状的、不规则的或多小分叶的结节进行进一步的分析。10/69个(14.5%)针状的或者边缘不规则的结节与6/(3.6%)个多小分叶的结节被判定为恶性。在基线情况下,恶性肿瘤的唯一预测因子是结节的体积≧mm3(OR6.3;95%可信区间:1.7-23.0)。随访3个月时基线体积、VDT天是重要的预测因子(OR4.9,95%可信区间:1.2-20.1;OR15.6,95%置信区间:4.5-53.5);随访一年时,只有VDT是预测因子(OR.3,95%可信区间:18.7-)。很少有结节边缘或者形状的变化持续12个月,所以这些特点都无法从良性结节中区分恶性肿瘤结节(55)。
其他的形态学特征
Diederich(56)在一项个连续性分解的肺结节的研究中发现,分解与非分解的肺结节在人口学与形态学特征上有很大程度的交叠,以致于人口学及形态学的这些特点很难应用于预测2年以上的随访结果。
Takashima经过对一组患者两年随访后指出:良性结节的特点(72结节直径≦10毫米,共25例癌症患者)为多边形、位于胸膜下、固体衰减和延伸(更高的长轴与短轴直径比)(57)。对98/连续筛查对象中检测发现的个类似结节长期随访,结果分析显示(间隙周围并具有以下任何一个特点:多边形形状,长轴与短轴直径比1.78,外围位置,血管附着)一半的研究对象是多发的,直径范围从1-13毫米,大多是三角形或椭圆形(86%),隆突以下(84%)和有一个隔连接(73%)(58)。个筛查对象在随访7.5年之后,没有间隙周围结节发展成癌症。这些类型的结节最可能代表肺内淋巴结,然而这些研究都没有被病理证实。
由于筛查试验研究的低阳性预测值,很难预测哪个结节可能是恶性的;在这两项研究中,对于患病率1-2%人群的肺结节,如果放射科医生指定为“可疑”或大尺寸或VDT天,恶性结节的阳性预测值只有35%左右(50,59)。
结节处置方案
LDCT结节管理方案反映了恶性肿瘤的大小和增长率之间的联系。这个方案来源于三个大型研究,表1概括了NLST、NELSON、I-ELCAP三个研究(52,60,61)。这些方案已分别应用于26,、7,和31,个筛查对象,虽然I-ELCAP没有对照组。尺寸范围的定义略有不同,但一般来说“微结节”(通常小于4-5毫米直径)随访12个月,大结节(10-15毫米直径)即刻进行进一步检查,中等大小结节病人随访直至确定其增长。多数的研究采用线性方法测量结节的大小,但NELSON研究采用容积测量方法(50)。回顾性分析I-ELCAP研究数据表明:定义一个阳性的基线扫描阈值可能太宽泛;把阈值增加到7-8mm(最大测量直径与宽度的均值)可能减小假阳性的概率,随之可筛查出50-68%的阳性病例,但是有5-6%真阳性病例的诊断被延迟。迄今为止,只有NLST方案被证明能降低肺癌死亡率。
非结节(偶然)发现(IFs)
IFs如冠状动脉钙化(CAC)、肺气肿、甲状腺结节很常见,但检出率取决于研究的定义和记录的方案。一个NELSON子研究(n=1,)发现如果IF率为81%,6%的参与者接受后续随访,只有1%有临床意义的发现,这引发了激烈的争论,反对系统寻找IFs(63)。加拿大的一项研究(n=4,)发现IFs发现率大约为19%,大约对一半进行了随访,0.8%需要即刻采取措施(64)。
LDCT筛查可能是一个发现其他疾病的机会,如胸部CT发现CAC、慢性阻塞性肺疾病(COPD)和骨质疏松症(65,66)。这可能会增加成本效益并提供更好的全球性结果,但目前尚未经研究证实。放射科医生通过CT扫描发现肺气肿似乎是一个独立增加的肺癌风险(OR2.1)(67),可能对确定基线扫描以后筛查频率有潜在的帮助(68)(即对有可视化监测到的肺气肿进行更频繁的筛查),但是这个假说还有待验证。
CAC作为心脏事件的一个危险标记(69),可能是最重要的IFs。世界范围内,每年估计80万人因为吸烟死于急性心脏病发作(70)。ELCAP的调查人员在例筛查中发现了64%不同程度的CAC(71)。他们开发了一个简单的可视化的评分系统,并在第二个例筛查队列中对心血管死亡风险进行分层,该队列中位随访时间为六年(72)。NELSON研究中的个研究对象在随访21个月后,显示出逐渐增多的CAC,并在全因死亡率方面显示出更高的风险比(73)。但是这些发现似乎没有在NLST数据里有所反映,约75%死亡人数来自于非肺癌原因(13)。死亡人数中LDCT组心血管疾病占/1,(26.1%),CXR组占/1,(23.6%)。当将肺癌死亡从比较中移除,LDCT组死亡率降低6.7%,失去了统计学意义(3.2%,P=0.28),这表明降低全因死亡率的核心是降低肺癌死亡率(13)。临床上重要的IFs在7.5%的扫描中被确定,尽管CAC患病率的细节和随访情况尚未报道,似乎不太可能通过LDCT筛选来确定CAC对心血管病死率的显著影响。
因而IFs虽然常见但是很少有临床意义。过度的调查IFs将增加下游调查与随访筛查成本,故应该进行成本分析。在筛查试验研究中进一步分析CAC和其它情况是必要的。
LDCT-效果筛选
观察性研究
最早的LDCT筛选的研究来自美国和日本的观察性队列研究(表2)。ELCAP研究表明CT的敏感性似乎是CXR的3-4倍,大多数肿瘤处于Ⅰ期。入选标准多变。这些研究招募年轻的参与者(50岁)和不吸烟者,具有较低的患病率和/或发病率。例如,在日本的研究(75年)中,大多数的筛查者从未吸烟,癌症发病率仅为0.4%,而ECLAP研究为2.7%(31)。这些结果凸显了招募高风险人群的重要性。随后大多数研究遵循ELCAP策略招募老年吸烟者。危险分层是目前的研究热点并将在稍后继续讨论。
虽然这些研究很有前途,但这些研究缺乏对照组,因而无法估计病死率获益。生存率可作为有效性的替代指标,易受到一些偏倚的影响,故不能被用来证明筛查有效性(框2),各研究的死亡率的显著差异引发了激烈的争论(78-80)。
框2筛查试验的生存偏倚。
随机对照试验
表3总结了LDCT筛查的随机对照试验。两个试验:NLST(美国)和NELSON(荷兰/比利时)有足够的统计效能检测肺癌死亡率。一些研究者正在计划对较小的欧洲研究进行荟萃分析(93)。所有的欧洲研究(除了Depiscan和DANTE研究)随机分为LDCT筛查及未进行筛查组,后者是目前的标准医疗模式。
到目前为止,最重要的RCT结果来自于NLST研究(13)。这个具有里程碑意义的研究将53,名高危志愿者随机分到CXR或LDCT组并进行三轮筛查(基线、1年和2年),中位随访时间为6.5年。这些志愿者的入选标准包括:目前或者既往吸烟>30包/年(戒烟不超过15年),过去5年中没有肺部或其他癌症病史,目前没有症状表明肺癌;过去18个月没有进行胸部CT检查。这项研究显示,在LDCT组肺特异的死亡率相对减少20.0%(95%置信区间CI:6.8-26.7;P=0.)。
尽管这是一个阳性的结果,仍然存在一些特别普遍和值得探讨的问题。NLST的作者宣称他们的数据单独并且不充分,难以做出肺癌筛查的推荐(13),来自于国际研究协会肺癌(IASLC)工作组关于肺癌CT筛查的状况声明,提醒我们对筛选获益、成本和潜在危害必须结合“文化环境”来确定,即如果阳性结果出现在美国的研究中,可能并不能直接转换到其他国家或医疗保健系统(94)。此外,必须要考虑下面所讨论的筛选的负面影响和知识空白。
筛查依从性
好的依从性对大规模筛查试验是否获得成功很关键。在随访的第二年,NLST研究中95%的对象完成了三轮筛查,NELSON有97%的对象完成了三轮筛查。长期观察研究报告5年随访率为80%,7年随访率为86%(76,95)。如何把这些结果应用于现实还不得而知。
下游医疗措施的应用
阳性的扫描和偶然发现需要临床和影像学随访。初次筛查后随访时,前6个月中医疗措施的使用可能上升,但筛查后6-12个月回到基线水平,并可能出现独立的结果(即阴性的、不确定的或可疑的结果)(96)。虽然这个研究发现使就医患者增加了50%,但是按绝对值计算,这只意味着每个参与者增加了一个额外的就医(96)。
成本效益
成本效益是筛查试验进行的一个基本要求。它取决于一个复杂的混合因素,不同的项目和国家间差异很大(表4)。预算相差很大取决于潜在的假设和使用的模型,这使得结论很难描绘(97)。使用NLST数据,Goulart估计如果75%的符合条件的美国人接受筛查,避免一个肺癌患者死亡的成本将是,美元(98)。McMahon的分析特别注意结合筛查和戒烟预算模型的应用(99)。在一个年龄为50岁左右同时戒烟率较背景戒烟率翻倍的队列中,预算的成本每质量调整生命年(QALY)可能会低于75,美元。从医疗保险视角预算成本是令人满意的();筛查50-64岁高危人群,每个投保者每月仅花费1美元,每生命年成本将低于19,美元。
到目前为止,多样化建模方法和基本假设导致了成本效益估算的很大差异。NLST最后分析结果尚未被报道,仍然在同行评审的过程中,但结果被大家所期待。采用增量成本效果比(ICER)模型估算初步的数据()表明这将是符合成本效益的,大约72,美元/QALY。
筛查的负面效应
任何疾病筛查都具有风险和益处。风险和利益的平衡有助于确定筛检的总体有效性和可接受性。主要的负面影响将在下面讨论。
辐射
=电离辐射可引起癌症并且没有较低的“剂量”门槛,这是公认的,虽然绝对风险水平仍在讨论中(,)。根据ALARA原则,应尽量减少辐射剂量(“尽可能低至合理”)(),尤其当筛选无症状健康者时更为重要。CT辐射剂量取决于许多因素,包括管电流、管电压,使用过滤器和扫描长度(z轴)。在筛查研究中最常见的方式是:根据患者体重通过调整管电流(毫安级,mA)()来限制剂量。这可能会降低图像质量,因为图像噪声(颗粒状的斑点)与辐射剂量的平方根成反比。幸运的是,充满气体的肺实质与肺软组织之间固有的高对比,意味着肺结节可以被很好地观察。筛查CT平均有效剂量可从8毫西弗(标准胸部CT)减少到约为1.5毫西弗,而没有显著降低图像的质量和分辨率(13,,)。尽管可导致更多的噪声,但低辐射剂量已被证明能够提供足够的诊断图像,因而也是当前筛选的标准(-)。总辐射剂量可以将随访CT范围限定在结节周围感兴趣区域,而不是覆盖整个胸部,即所谓的“有限”LDCT()。
吸烟与电离辐射表现出协同交互作用。按绝对值计算因LDCT罹患癌症的风险很小,也许只增加0.85%风险(95%CI:0.28-2.2%),相比之下,最糟糕的情况是:一个50多岁的女性烟民连续接受25年LDCT扫描,这种情况有17%的风险发展为肺癌()。贝灵顿·德·冈萨雷斯估计50岁的烟民死于因LDCT筛查的肺癌风险是2/10,(男性)、5/10,(女性)。另外估计每筛查10名妇女,可能筛查出3例乳腺癌()。NLST估计:减少1例因肺癌死亡的患者需要筛查(NNS)人,相当于减少30例死亡/10,筛查(13)。辐射伤害要好过癌症诱导发生之后,因被延误诊断而要在短期内进行挽救生命的治疗。ITALUNG研究得出了类似的结论,每筛查10,人估计1.1超额死亡,与此对应,每筛查10人大约挽救了15-人的生命(男性和女性分别估算),假设筛查降低了20%的死亡率()。因此LDCT的辐射风险-效益比率对老年吸烟者显得相当有利。
副反应
LDCT调查结果可能导致许多不良事件。25-50%的筛查可能检测到一个或多个结节,存在一大群处于风险中的潜在的患者。在NLST累积的阳性筛查率是39.1%,尽管指医院之间(),肺结节活检率(14.7-36.2每,名成年人)和并发症发生率(年)有巨大差异。出血、需要间断导管引流(ICC)的气胸的风险分别为1.0%和6.6%。并发症发生与住院时间增加和呼吸衰竭有关。风险最高的是烟民、年龄在60岁到69岁、患有慢性阻塞性肺病患者,即筛查试验的目标人群。LDCT筛查研究副反应发生率可能略高于上述研究,但这恰恰反映了更严格的、前瞻性的报告。似乎没有标准的方式定义或报告不良事件数据,这使得一些研究难以进行直接比较。“事件的数量/10,筛查”可能是一个有用的便于交叉研究比较的度量标准。
一项有4,人参与的使用I-ELCAP方案的筛查研究(),公布的活检率为2.6%(n=),包括例CT引导下经皮细针穿刺活检(CT-FNA)。13%的CT-FNAs并发中等到大量气胸,并需要ICC或住院治疗。16%的活检标本最后确定为良性疾病()。NELSON报道,使用一个基于体积测量的研究方案,需手术诊断的比例,第一轮随访为1.2%、第二轮为0.8%,每一轮分别有32/92(35%)和13/61(21%)证明是良性疾病。很少进行CT-FNAs:第一轮5/13CT-FNAs,第二轮3/3FNA证明是良性疾病。两轮支气管镜检查诊断的癌症/(45%)低于预期,可能反映了周围型肿瘤的发生情况。并发症发生率没有报道(50)。
PLuSS的研究()使用一个内部方案筛查名参与者。82(2.3%)接受手术(胸廓切开术或大桶),28人(34%)有良性疾病。对于不确定的肺结节,研究人员援引了“一个明显倾向于激进的干预措施的社区偏倚”。
在基线水平,NLST研究中LDCT组有27.3%的阳性扫描结果(13)。/7,参与者接受了经皮诊断(例CT-FNA),例(4.1%的阳性扫描)接受诊断性手术(开胸手术、胸腔镜、纵隔镜检查或纵隔切开术),包括例开胸手术。在所有三轮筛查中(75,个筛查),LDCT组/(24%)为肺癌诊断。/(29%)的参与者侵入式诊断后至少经历了一次手术并发症;80(12%)例归类为严重并发症。99例中只有14个(14%)参与者接受了针吸活检,他们的侵入性诊断过程经历了一个或多个并发症但没有严重并发症。16个参与者(10例为肺癌)在侵入性诊断后60天内死亡,但不能确定死亡是否直接与侵入性诊断相关。换句话说每10,筛查者中,有33例在诊断性评估过程中遭受了严重的并发症,但任何支气管镜检查或穿刺活检诊断后并发症发生率较低,分别为1.5例和0.7例每10,个筛查;发生在诊断评价2个月内的死亡率为8/10,(16)。I-ELCAP没有报告其诊断后的并发症发生率。
CT-FNA的并发症发生率为13-14%,是相对安全的,其活检结果与切除病理标本组织学检查保持良好的一致性()。另一方面支气管镜检查虽然也相对安全,但其对外围的癌症筛查检测可能仅有小的获益,尽管新技术,比如支气管内超声和电磁导航也许能够提高收益(,)。手术过程中重大并发症的发生率为12%,但约20-35%的病例最终诊断为良性疾病。这将影响成本效益。
虽然最终决定切除不确定的结节是一种临床决策,鉴于筛查试验报告的高比例的良性疾病率,手术切除之前获得一个阳性的组织诊断是可取的。NELSON研究表明由良性疾病引起的超过三个月时间确切增长的比例多达三分之一。到目前为止,在大多数高级专家中心进行的研究中,CT-FNA作为小的周围型病变的初始诊断程序。通过严格的管理和质量保证,降低不必要的活检和切除是可能的。
保留肺叶手术
如Blasburg等人综述的那样,随着技术手段的进步,对体积较小肿瘤的认知和它们良好的预后,尤其是主要含有GGO成分的小肿瘤,和正处在风险之中的逐渐发展的亚肿瘤,逐渐倾向于行保留肺叶的手术(解剖肺段切除术或肺楔形切除术)替代肺叶切除术()。两个正在招募患者的随机对照试验很有希望能够回答这个重要的问题[CALGB503和JCOG/WJOG7L()]。
生存质量
三项研究报道了来自于大约2,筛查患者的一般健康相关的生存质量(HRQoL)、焦虑和肺癌特定抑郁的研究数据(-)。所有的发现均来自于获得一个不确定的或可疑的筛查结果时产生的瞬变消极的心理作用。这些效应消退较快,因而HRQoL在基线水平与12-24个月随访之间没有显著差异。NELSON研究发现一半参与者感觉等待他们的基线CT扫描结果是“令人不安的”,但这一个不确定的结果在第二轮筛查时对HRQoL没有影响。这表明减少测试结果的等待时间是有益的,参与者很快接受一个不确定的扫描结果,并不一定保证会有高焦虑(,)。
戒烟
戒烟是非常重要的,不仅降低没有癌症的参与者的风险,也可能改善早期确诊为肺癌的患者的预后()。肺癌筛查可能成为一个“宣教契机”,增加了烟民戒烟的动力,特别是当参与者收到异常CT扫描报告时(-)。成功的戒烟计划也可能使筛查更划算(99),戒烟在几个方面辅助“增加筛查试验的价值”,它应该是任何肺癌筛查试验的一个核心组分。
知识缺口
尽管NLST研究获得了阳性结果,研究试验外的筛查,应该在仔细的风险评估之前,并在受控环境中进行,推荐筛查之前仔细分析所有结果以确保质量。两个国际的研究小组已经考虑到当前证据的状态和未来发展方向。那些需要解决的重点包括:(Ⅰ)如何优化识别高危个体;(II)筛查方案(比如筛查间隔时间、筛查几轮);(III)阳性结果的定义;(Ⅳ)不确定结节的处理;(V)对可疑结节的诊断和治疗;(VI)综合的戒烟项目;(VII)早期检测生物标记物在个人肺癌风险评估中的角色;(VIII)过度诊断发生率。重要的步骤将是设备和图像质量标准化,结节分析和解释,参与者随访和结果报告(93,)。这些领域将在下面讨论。
过度诊断
过度诊断很难确定(见框2定义)。据NLST研究,通过对LDCT组与对照组的相对差异估计,过度诊断率在13%之间,LDCT组检测到1,例癌症,对照组中检测到例癌症(13)。然而这个数字已经被指责为过于低估(),指责的基础为,适当的分母应为对照组在筛查期间实际检测到的肺癌的数量(n=),而不是对照组最后随访到的肺癌数量(n=),如果这样计算,过度诊断率接近25%,医院基于体积倍增时间的LDCT研究报道的过度诊断率类似(37)。但是即使是这个数字,也可能低估了过度诊断率,因为CXR筛查组本身也可能受到过度诊断()。针对这个问题,符合NLST研究入组标准的PLCO队列研究的亚组分析(n=30,)发现,在CXR组和非筛查组中,具有类似的肺癌病例的数量(和,分别在6年随访期内)(12)。似乎只有欧洲筛查试验与常规治疗比较(即没有筛查),或许能够给一个真正的过度诊断率的估计值(90)。因此这个问题目前仍未得到回答。
筛查间隔与随访期限
适当的筛查间隔时间应在疾病控制与筛查成本间获得一个有利的比率()。最近发表的MILD研究结果来自于一个纳入了4,例参与者的三臂的随机对照试验:观察VS每年筛查VS二年筛查一次(89)。两个LDCT组的临床分期和切除率相似。每年筛查一次的LDCT组累计5年肺癌发病率高于每两年筛查一次的LDCT组和对照组(/,vs.和,P=0.)。每个LDCT筛查方案的依从率95%,但平均随访时间只有4.4年。招募的病例显著少于计划的10,例参与者,意味着该研究没有足够的检验效力检测死亡率的差异。同时筛查与非筛查组特征的差异(如吸烟状态、吸烟强度和肺功能)引起人们对随机化的充分程度的质疑()。这个研究的长期随访结果可能包含更多有用的信息。NELSON研究中,在第1年(基线)、第2年和第4年分别筛查研究对象,即第二次和第三次扫描有为期两年的差距,当4年随访结果公布后可以确定一个最佳筛查间隔。正如前面提到的,基线扫描时的数据收集(比如有无放射肺气肿)可能在确定风险、最佳筛查间隔是很有用的(68)。关于筛查的持续时间,NLST研究中在阳性筛查试验后,LDCT组共检测到例癌症患者(在基线时,和例分别在第1年和第2年),有例参与者在筛查或诊断完成后才被诊断(平均随访6.5年)。这表明癌症检测率(即癌症风险)随着时间的持续下降不明显,因此持续的筛查是必要的。因此当前的指南建议每年筛查,直到74岁(14,16)或79岁(15)。
招募
各研究间招募患者的策略有差异,最常见的是直接邮寄和/或媒体发布,但一些使用全科医师转诊(84,88)。与不吸烟者相比,吸烟者明显地具有更少的反对风险,至少在他们的健康方面。决定进入一个筛查试验是一种复杂因素的平衡,包括可接受的筛查方法、风险感知、利他主义、利己主义()。不可避免的是,志愿者在任何试验都是自我选择的,并存在有利“健康志愿者”效应。这可能会导致过度乐观的结果(如更好的筛查并发症,较高的戒烟率)或过度的悲观的结果(如较低的有效性,因为低风险的个人筛查利益)。
NLST和NELSON研究发现,他们的研究人群与一般符合入组条件的人群存在一些差异:参与者更年轻,而且较小的可能是吸烟者,并且有较高的教育水平(代表社会经济地位)。这些差异被认为是次要的,这意味着一个重要的健康志愿者效应是不可能的(81,)。
风险分级
一个基本的风险分级方法已经应用于大多数研究,即采用ELCAP研究筛查老年吸烟者所采取的策略。尽管年龄和吸烟占据了绝大多数的肺癌风险,其他风险因素,如家族病史、社会经济地位、职业暴露和COPD也是公认的危险因素()。进一步使用其他现成的信息进行风险分层,从而排除低风险者,可以提高筛查效率()。不同的模型已经被提出,最大的模型来自PLCO试验数据,最近已经进行了更新(,)。对该模型的PLCO数据集,回顾性分析发现,这是更有效的方式,相比于以标准的年龄和吸烟建立的NLST入组标准,灵敏度从71%提高到83%(P0.),阳性预测值从3.4%提高到4.0%(P=0.01),并保持了特异性(各占63%)。使用风险模型来选择筛查,至少会错过少于41.3%的肺癌()。英国另一个前瞻性评估风险模型的肺癌筛查试验正在开展()。危险分层通过增加筛选人群肺癌患病率和发病率并减少假阳性检查结果,可提高筛选效率和成本效益。尽管风险分层直观上可以理解,但它还没有被实验证明,因此筛查指南建议推荐有分歧。
筛查实施
从严格控制的研究中获得的普遍化的结果来看,为了能够准确地跟踪和评估随着时间推移结节的变化,大规模筛查需要统一标准的和高水平的质量控制()。肺癌筛查不仅仅是简单地提供一个CT服务,而是需要一个长期广泛的基础设施保证,包括:有条件招募、质量改进、筛查的劳动力/设施、诊断和治疗、卫生职业培训、参与者信息和支持。为确保满足高医疗标准及提供一个一致并可接受的方法,持续的评估和监测项目是至关重要的(,)。
未来的研究
微创、廉价的检测方式辨认,最有可能从筛查中获益的是那些处于最高肺癌风险的个体,从恶性肿瘤中区分良性结节的筛查检测,将代表肺癌结节筛查的主要进展。在这方面有前途的新技术包括:分析血液循环微小RNA和呼出气体的挥发性有机化合物检测(-)。最近的筛查研究方案中已经包括了生物标志物收集,所以我们可以期待在不久的将来将会出现令人耳目一新的发现。
结论
具有里程碑意义的NLST的研究结果证实了一个长期存在的公认的信念:肺癌筛查可以挽救更多的生命。可以理解的是,LDCT作为一种新的干预手段,推广到美国以外的情况仍然存在许多问题。在未来的几年里,进一步分析NLST数据和其他研究的成熟结果,能够填补这些知识空白,并且将使肺癌社区逐渐形成,并逐渐完善我们的筛查方式。
致谢
我们感谢研究的志愿者、医院的工作人员和昆士兰肺癌筛查研究研究团队参与我们的研究项目。
基金:这项工作得到了国家卫生和医学研究委员会(NHMRC)项目资助,NHMRC从业者奖学金(KF),NHMRC职业发展奖(IY),昆士兰癌症委员会项目拨款,昆士兰智能状态项目拨款,卫生和医学研究办公室(OHMR)项目资助,医院的基金会,NHMRC研究生医学奖学金(HM),昆士兰大学的博士奖学金(HM)。
公开:作者声明没有利益冲突。
译者周支瑞校对者
顾兵往期精彩连载
胸腔镜袖式切除术——更好的方法?
肺癌外科治疗现状及展望
是否所有肺部毛玻璃样病变都应该手术切除?
电视辅助胸腔镜肺叶切除术——从试验性治疗演变成治疗标准
VATS肺叶切除术的技巧
电视辅助胸腔镜肺叶切除术的禁忌症以及中转开胸的决定因素
肺癌分子生物学
病理在肺癌治疗中的关键角色
对于可切除非小细胞肺癌最佳的病理分期
肺癌转移到中枢神经系统的分子机制
肺癌及其相关副发病变的遗传易感性
气道中非神经元胆碱能系统与肺癌易感性的关系
诊断支气管镜——当前观点与未来展望
肺癌中应用的现代诊断和治疗介入放射学
点击“阅读原文”,即可进入微店购买《肺癌》中英文版。
预览时标签不可点收录于话题#个上一篇下一篇