Summary

경쟁 위험 모델의 R 기반 조경 유효성 검사An R-based landscape validation of a competing risk model

Published: September 16, 2022
doi:

Summary

본 프로토콜은 경쟁 위험 모델의 식별 및 보정 능력을 평가하기 위한 R의 코드와 내부 및 외부 검증을 위한 코드를 설명합니다.

Abstract

Cox 비례 위험 모델은 임상 환경에서 생존 분석에 널리 적용되지만 여러 생존 결과에 대처할 수는 없습니다. 기존의 Cox 비례 위험 모델과 달리 경쟁 위험 모델은 경쟁 이벤트의 존재와 임상의가 정확한 예후 예측을 수행하는 데 유용한 도구인 그래픽 계산 장치인 노모그램과의 조합을 고려합니다. 이 연구에서 우리는 경쟁 위험 노모그램을 설정하는 방법, 즉 차별(즉, 일치 지수 및 곡선 아래 면적) 및 교정(즉, 교정 곡선) 능력의 평가와 순 이익(즉, 결정 곡선 분석). 또한, 기존 데이터셋의 부트스트랩 리샘플링을 이용한 내부검증과 기존 경쟁위험노모그램의 외부 데이터셋을 이용한 외부 검증도 수행하여 외삽 능력을 입증하였다. 경쟁 위험 노모그램은 임상의가 경쟁 위험을 고려하여 예후를 예측하는 데 유용한 도구 역할을 해야 합니다.

Introduction

최근 몇 년 동안 정밀 의학의 발달로 새로운 예후 요인이 확인되었으며 분자 및 임상 병리학 적 요인을 결합한 예후 모델이 임상 환경에서 점점 더 주목을 받고 있습니다. 그러나, 계수 값의 결과가 있는 Cox 비례 위험 모델과 같은 비그래픽 모델은 임상의가 이해하기 어렵다1. 이에 비해 노모그램은 회귀 모델(Cox 회귀 모델, 경쟁 위험 모델 등 포함)의 시각화 도구로, 수학 함수 2의 대략적인 그래픽 계산을 위해 설계된2차원 다이어그램이다. 이를 통해 임상 모델에서 다양한 수준의 변수를 평가하고 위험 점수(RS)를 계산하여 예후를 예측할 수 있습니다.

모델 평가는 모델 구축에 필수적이며 일반적으로 식별과 보정이라는 두 가지 특성이 평가에 허용됩니다. 임상 모델에서 차별은 사망한 환자와 생존한 환자와 같이 사건이 발생하는 개인과 그렇지 않은 개인을 구분하는 모델의 능력을 말하며, 일치 지수(C-index) 또는 수신기 작동 특성 곡선 아래 면적(AUC)은 일반적으로 이를 특성화하는 데 사용됩니다 3,4. 캘리브레이션은 모델의 예측 확률과 실제 확률을 비교하는 프로세스이며, 이를 표현하기 위해 캘리브레이션 곡선이 널리 사용되었습니다. 또한, 모델 검증(내부 및 외부 검증)은 모델 구축에서 중요한 단계이며, 검증된 모델만 추가로 외삽할 수 있다5.

Cox 비례 위험 모델은 예후 인자와 생존 상태 간의 연관성을 조사하기 위해 의학 연구에서 사용되는 회귀 모델입니다. 그러나 Cox 비례 위험 모델은 두 가지 결과 상태 [Y (0, 1)]만을 고려하는 반면, 연구 대상자는 종종 두 가지 이상의 상태에 직면하고 경쟁 위험이 발생합니다 [Y (0, 1, 2)]1. 기원일(예: 치료)부터 모든 원인으로 인한 사망일까지의 시간으로 정의되는 전체 생존(OS)은 생존 분석에서 가장 중요한 종점입니다. 그러나, OS는 암 특이적 사망과 비암 특이적 사망(예: 심혈관 사건 및 기타 관련 없는 원인)을 구별하지 못하여 경쟁 위험을 무시한다6. 이러한 상황에서, 경쟁적 위험(competing risk)은 경쟁적 위험(competing)을 고려한 생존 상태 예측을 위해 선호된다7. Cox 비례 위험 모델을 구성하고 검증하는 방법론은 잘 정립되어 있지만 경쟁 위험 모델의 검증에 관한 보고서는 거의 없습니다.

이전 연구에서는 특정 경쟁 위험 노모그램, 노모그램과 경쟁 위험 모델의 조합, 경쟁 위험 모델을 기반으로 한 위험 점수 추정을 설정했습니다8. 이 연구는 확립된 경쟁 위험 노모그램의 다양한 평가 및 검증 방법을 제시하는 것을 목표로 하며, 이는 임상의가 경쟁 위험을 고려하여 예후를 예측하는 데 유용한 도구 역할을 해야 합니다.

Protocol

SEER(Surveillance, Epidemiology, and End Results) 데이터베이스는 비식별화된 환자 데이터(SEER ID: 12296-Nov2018)만 포함하는 오픈 액세스 암 데이터베이스입니다. 따라서 본 연구는 저장대학교 의과대학 부속 진화병원 심사위원회의 승인을 면제받았다. 1. 데이터 준비 및 R 패키지 준비 데이터를 준비하고 가져옵니다.> 데이터 세트<- read.csv("…/Breast cancer Data.xlsx") #Im…

Representative Results

이 연구에서는 SEER 데이터베이스에서 유방암 환자의 데이터를 검색하여 예제 데이터로 사용했습니다. SEER 데이터베이스는 미국 인구의 약 34.6%를 차지하는 암에 대한 데이터를 제공하며 데이터베이스 액세스 권한을 얻었습니다(참조 번호 12296-2018년 11월). 조직학적 유형, 분화 등급, T 단계 및 N 단계를 포함하는 두 개의 노모그램(그림 1)은 각각 직접 방법…

Discussion

이 연구는 두 가지 별개의 방법으로 확립된 경쟁 위험 노모그램을 비교하고 확립된 노모그램에 대한 평가 및 검증을 수행했습니다. 구체적으로, 본 연구에서는 직접적인 방법을 기반으로 노모그램을 설정하고 C-index를 계산하고 검량선을 플로팅하기 위한 단계별 튜토리얼을 제공했습니다.

R 소프트웨어의 rms 패키지는 Cox 비례 위험 모델의 구성 및 평가에 널리 사용되지…

Disclosures

The authors have nothing to disclose.

Acknowledgements

이 연구는 절강성 의료과학기술계획사업(보조금 번호 2013KYA212), 저장성 자연과학재단 일반 프로그램(보조금 번호 Y19H160126), 진화시 과학기술국의 핵심 프로그램(보조금 번호 2016-3-005, 2018-3-001d, 2019-3-013)의 보조금으로 지원되었다.

Materials

R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

References

  1. Andersen, P. K., Gill, R. D. Cox’s regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -. T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers’ D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).

Play Video

Cite This Article
Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

View Video