韦格杨
新闻资讯
探讨本领域不良事件研究方法--中国整形美容协会

发布日期:2022年12月08日发布者: 韦格杨

医疗安全不良事件是指在临床诊疗活动中以及医院运行过程中,任何可能影响患者的诊疗结果、增加其痛苦和负担并可能引发医疗纠纷或医疗事故,以及影响医疗工作正常运行和医务人员人身安全的因素和事件[1]。医疗美容在践行“回归医疗本质”的过程中,不良事件是不可回避的问题。根据不良事件的发生时间、好发因素等制定防治临床路径,是保证患者安全的有效办法。医疗美容不良事件的研究,是医疗美容产品和技术推广的基础。笔者根据近十年医疗美容研究热点,分样本量、研究设计、案例分析、时间因素及讨论四个方面探讨本领域不良事件研究方法,全文如下。

1 样本量

1.1 错误一,有研究共纳入100例患者,共进行240次填充注射。其中发生不良事件5例。不良事件的概率是5%。

       药物不良反应以案例数为总样本量是比较合理的。假定一个人各生理指标稳定,在首次与再次使用某药物的反应是比较稳定的。但是在填充注射这种操作性治疗中,药物临床报告显然不太恰当。

       比较能让学者接受的是,以次数作为总样本量。填充注射治疗应当认为每次治疗都是独立的,故而发生不良事件应该是5次,而不是5例,不良事件的概率应当是1/48。

让我们在深入思考一下,分析到这里,就结束了吗?显然数据仍有被挖掘的空间。

       在透明质酸的填充中,当发生不良反应时即终止治疗,就诊者不再会接受下一次治疗,类似生存结局研究[2]。假定完成1次注射100例中发生2例不良事件,参与第二次注射80例,不良事件2例,第三次注射60例,不良事件1例。从直观数据中,我们得到的应当是首次注射不良事件率2/100,二次注射不良事件率2/80,三次注射不良事件率1/60。当然,上文中提到,基于“每次治疗是独立的”的不良事件率1/48,仍然具有重要的临床意义。

1.2 错误二,某“白皮书”“行业报告”“产品介绍”中写道,产品共卖出60万支,其中不良事件共报告300例,不良事件的概率是300/60万。”

       作者“心思巧妙地”借鉴了生态学研究。如当地食盐销售量与食管癌发病率的关系、烟草出售量与肺癌发病率的关系。可惜生态学研究的目的是“析因”,不适用于当前情况。

       只要是临床医生,就不太可能用“60万支”作为分母,产品数量是不可能代表治疗次数,更不可能代替治疗的人数。填充类产品常反复注射,且每次不可能恰好是“1支”。

不少临床医生根据自己的经验,判定每次治疗平均5支,治疗次数则为12万次,不良事件的概率为300/12万,四千分之一。拿出自己的临床数据比比,指数级别的差距,可见“不良事件数/售卖量”得出的不良事件率不足取信。

       而在临床上,你收集近3个月以上自己的案例(保证规范操作、随访超过90%),无论不良事件是1%,还是10%,都是最真实可靠的。

1.3 错误三,研究纳入了100例患者,随访了50例,其中不良事件5例,不良事件概率是5%。

       众所周知,临床研究质量管理中要求,随访率不少于70%。在本例中随访只有50%,不能得出5%这个值。这项研究显然是失败了。

       用心钻研统计学者,通过摸索规律,重新设定纳入排除标准,降低总样本量、保留随访数量,从而满足70%随访率的要求,这种“丢车保帅”的方式,或有可能完成论文的发表。

       比如,调整案例纳入临床特征、缩短案例纳入时间、改变案例的年龄区间。将失败的研究转化为统计学方法问题,条件重置目标为实现随访/总样本量不低于70%,总样本量、随访数及不良事件数都会变化,加入条件重置后最终总样本量为60,随访数为45,不良事件为3,随访率超过了70%,不良事件概率就是3/60,即5%,这个错误,转身就正确了。

       必须承认的是,这个数据只能解释特定条件的案例,研究依然具有真实性。

       我常常思考,假如任何条件都不能实现数据上的达标。随访50例与非随访的50例基本数据存在高度相似性,理论上真实概率不低于5%(5/100),不高于10%(5/50)?不良事件在医疗机构的检出率很高,所以真实数据接近5%,而远10%。这两个概率的可信度又应该怎么区分才好呢?

       当然,在医疗美容领域,基本可以完成100%的随访,随访率低的情况较少。基于这个认知,假如某个医疗项目的随访不达标(复诊率低),是否应该分析一下影响随访的因素[3]呢?

2 研究设计

2.1 发生率

       不良事件的发生率是基本的数据描述。回顾性分析是研究设计的预判。当不良事件的发生率在1%以下时,则提示不良事件原因具有特殊性,建议采用案例分析甚至个案分析进行处理。当不良事件发生率在10%以上时,则可进行因素分析或干预措施效果评价。不良事件 发生率1%~10%时,则先进行案例临床证据收集,后视情况建立因素分析或干预措施模型。

       需要注意的是,研究者往往忽略回顾性研究的质量,即一些无法排除的干扰因素。部分回顾性研究可以通过设置权重或剔除标准提高研究的可靠性,但规范性操作、护理、随访等因素的差异是统计学无法消除的,故而回顾性研究获得的不良事件发生率是一个模糊的结果。对于回顾性研究中获得的不良事件发生率产生高度质疑时,应以前瞻性研究进行观察,统一纳入排除标准、统一规范操作、规范随访等,从而得出可信度更高的数据[4]。

       在两种产品或方法的比较中,我们偶尔能看到一些荒唐的例子观察组术后感染1例(1%),对照组术后感染10例(10%),观察组并发症显著少于对照组,差异有统计学意义。术后感染为严重的医疗质量问题,怀疑术中无菌操作不规范、护理质量不到位等。读者会认为,对照组接受了不公平的、违背医学伦理的治疗体验,研究有严重的偏倚。如果只是捏造数据,拒稿就算结束了。如果研究是真实的,则研究者恐怕要接受调查,甚至追究责任。

2.2 案例分析

       透明质酸填充注射导致的眼动脉栓塞,适合案例报道[5]。从诊治到随访,案例临床资料越丰富,对临床的指导意义越大。发生时间、可能原因、临床表现、进展情况、治疗方案等,应尽量详细。专家讨论会要有详细笔录,如有可能邀请知名专家视频会议进行讨论。会议资料就是直接的讨论内容了。

2.3 因素分析

       肋软骨隆鼻术术后5年变形率的因素分析。Logistics回归分析是最为常用的统计学方法[6]。以往认为多因素分析模型中的观察指标与样本量的比例为1:20,如样本量为200时,观察指标最多可纳入10个。但随着统计学上的完善,多因素分析模型中观察指标与不良事件比例为1:10,假定样本量为200时,不良事件的发生率为10%,多因素分析模型中只能有两个观察指标,此时就需要考虑更换其他统计学方法了。

       统计学只是工具,我们常常需要脱离一些框架,甚至完全弃用。选择什么样的因素纳入观察指标,哪个因素纳入统计模型,都要依从专业基础认知。当某一个指标在单因素分析中没有意义,但有足够理论支持,也是可以纳入多因素分析模型中的。比如,隆鼻术二次手术的因素分析应当用归类法简单描述,每个结果-因素环节进行直接的手术操作、解剖学支持,比所谓的统计学模型,更接近真实。

2.4 干预措施

       透明质酸注射中的回抽操作,就是典型的干预措施。首先,回抽操作来自于个人经验分享,可能有时回抽,有时不回抽。我们可以在回顾性研究的多因素分析模型中,纳入“回抽”“不回抽”进行统计学论证。但在临床实践中,没有文案辅助我们记录回抽了还是没有。模型虽好,不切实际。假定“不回抽”可能会带来损害风险,开展“回抽”“不回抽”的前瞻性研究,可能损害“不回抽”组的生命健康,是违背医学伦理学原则的。故而这种高质量的研究办法显然也是行不通的。

       进行非同时空对照,是一个切实可行的办法,比如2020年全年回抽注射者100例纳入回抽组,再从2016-2019年300例非回抽注射者中抽取100例纳入非回抽组,非回抽组的纳入可使用“倾向性评分匹配法”[7]以保证两组研究对象均衡。非时空对照的时间跨度不能过大,以避免因医疗质量的提升或降低而影响结果。

3 时间因素

3.1统计值为HR的COX回归模型[8]

       鼻整形术后鼻部变形往往发生在术后3-5年。采用单一的3年变形率或5年变形率是扁平化数据的表现。鼻整形术后鼻部变形者的临床资料往往是这样的“案例1 随访5年,未见变形”“案例2 随访6个月,未见变形”“案例3 随访9个月,变形”“案例4 随访4年,变形”......

时间—结局,用Logistics回归就错了。最恰当的应该是Cox回归模型。

3.2 不良反应持续时间[9]

       以程度来定义短暂性的不良事件发生率并进行两组比较时,其结果往往是没有差异的。而在此基础上进一步设计或有可能产生差异。这个最好的度量衡就是时间,最简单有效的统计方法就是t检验。比如疼痛VAS≥5分,定义为疼痛,再比较两组的疼痛时间。在外科领域,微创术式组的患者恢复期更短。同理,假定某个填充注射产品引发的炎症反应更低,就有理由相信该组患者不良事件存在时间更短。肿胀、神经感觉异常等也是如此。

4 讨论

4.1 并发症的讨论是数据解读与专业解释的结合

       案例报道类文章重在临床管理体系的建立,包括并发症的预判、临床表现,治疗方案的制定及治疗效果的反馈。干预性研究,如回抽、不回抽,是否添加利多卡因等,一般指向一个因素,需要有扎实的专业分析。如回抽的学说假设,已有的基础研究、临床研究证据支持等等。必要时还要分析填充部位的解剖学特征、血管走形等。在添加利多卡因的透明质酸填充剂的临床评价论文的讨论中,利多卡因的生物化学特性以及对局部注射部位的影响应详细说明,以体现科学的理论基础。以结果数据为导向的文章,首先要解读数据,包括差异性、差异性。讨论的重点是差异性,最容易被忽略的是可靠性。

4.2  差异性的比较以及归因

       比如本研究并发症5%,同类研究并发症为2%~8%,基本相符。

       本研究结果显示并发症10%,高于同类报道的2%。分析原因为......

       有文献报道透明质酸填充并发症发生率为2%,本研究结果显示,透明质酸在泪沟畸形填充中并发症为10%,则提示泪沟畸形的填充高于一般的透明质酸面部填充效果。

       数据解读离不来归因。归因可以是统计学上分析,也可以说直接的专业分析。

       对于有Logistics回归分析的研究来说,统计学上有差异的因素,要进行专业的理论论证,如填充剂量大的患者容易发生并发症,分析如下......

       不需要数据上的差异性或相关性分析的论文也比比皆是。比如鼻部术后再次修复的原因分析、重睑术后并发症分析等,可直接从手术操作中寻找答案。只做归类数据统计,不做差异分析。这种饱含作者经验的论文,完全不需要统计学方法的加持。

5   专业上归因的甄别

5.1  术中操作不当

       术中操作不当是手术项目并发症的常见原因,但不适合解释操作性不强。某项填充注射类产品面部填充前瞻性研究中说“不良事件过多是术中操作不当引起的”,潜台词为“不是产品的问题,是医生的问题”。

       前瞻性研究旨在客观评价,临床操作、数据整理、科研管理等均应有相应专业人员通过培训并考核合格后上岗。“研究者操作不当”,则提示“研究者不具备基本资格”或“产品本身操作有难度”,最终结论就是,这是一项仓促的、低级的、毫无质量管理的研究,结果不可信。 读者对研究的评价尚且如此,对产品的评价又会好到哪里去呢?

5.2 术后护理不佳

       因一般性的医疗美容项目并不需要住院观察,即便前瞻性研究,也无法完全避免术后自我护理不到位。激光术后的护理不佳,特别是防晒不到位,往往会将病例剔除研究。非前瞻性的研究,则更注重实践,文内是可以吸纳部分特殊案例的。

       值得注意的是,术后护理不佳,只可以解释部分、少发并发症,如术后感染、色素沉着等。如果文内报道,护理不佳导致重睑术后患者眼睑闭合不全1%(1/100),这是典型的错误之一,因为眼睑闭合不全与术中切除皮肤过多有关,与护理关系不大。再如,术后护理不佳,导致术后感染10%(10/100);超过5%即认定非偶发事件,为严重的医疗质量问题,怀疑术中无菌操作不规范、护理质量不到位等。

6  小结

       当前,医疗美容不良事件的研究越来越多。笔者文中列举是比较常见的类型,难以面面俱到。建议开展相关研究者

第一,以临床问题为导向,从临床问题的解答思路上,设计临床研究方案。

第二,广泛吸收各个渠道的文献资料,包括但不限于书籍、期刊、会议、专家意见、科室意见、其他学科的成果等。

第三,保证数据的真实性、可靠性,再此基础上强化科研质量管理,保证研究质量。

第四,加强统计学基础知识的学习,避免错误数据的使用,进而用科学的统计学方法(如权重),控制混杂因素,进一步提高数据的可信度。

参考文献:略

张少伟,张云川

《中国医疗美容》杂志社


快速咨询窗口
马上咨询
您还可以选择发邮件
msn7788@163.com
韦格杨为客户提供专业的医疗机构办证、医疗专业人才输送、手术室设计出图、编制装修清单等一站式综合服务
我们会尽快联系你,请稍等!