[AACR 2023] 네덜란드 연구팀, 딥러닝 모델 HECTOR 발표…종양 슬라이드·병기만 입력하면 결과 도출
[메디게이트뉴스 박도영 기자] 조직병리학적 슬라이드 한 장으로 자궁내막암 환자의 원격 재발 위험을 정확하게 예측할 수 있는 연구용 딥러닝 모델이 개발됐다.
네덜란드 라이덴대학교 메디컬센터(Leiden University Medical Center) 병리학과 박사 과정의 사라 프리먼드(Sarah Fremond) 연구팀이 14~19일(현지시간) 미국 플로리다주 올랜도에서 열린 미국암연구학회 연례학술대회(AACR 2023)에서 딥러닝 모델 헥터(HECTOR)에 대한 연구결과를 발표했다(Abstract 5695).
연구팀은 "초기 자궁암 환자의 5년 생존율은 약 95%에 달하지만 원격 재발 환자의 생존율은 매우 낮다. 환자 대부분 예후가 좋고 보조 치료가 필요하지 않지만, 원격 전이 위험이 높은 환자에서는 전신 보조요법으로 원격 재발 위험을 줄일 수 있다"면서 "원격 재발 위험이 높은 환자와 낮은 환자를 정확하게 식별하는 것은 개인 맞춤 보조 치료를 권장하고 독성 치료로 인한 불필요한 이환율을 줄이는데 매우 중요하다"고 설명했다.
이어 "병리학자가 조직 병리학적 이미지를 평가하는 현재의 위험도 계층화 방법은 병리학자마다 상당한 편차가 있어 한계가 있다. 종양 조직에 대한 분자 검사는 추가적인 가치가 있지만, 비용이 많이 들고 복잡한 인프라가 필요하다"면서 "예후 변수의 수가 증가함에 따라 관련 요인을 단일 위험 점수로 결합하는 것이 어려워졌다"고 덧붙였다.
이러한 문제를 극복하기 위해 연구팀은 디지털화된 조직병리 슬라이드를 사용해 환자의 원격 재발 위험을 예측하는 딥러닝을 개발하고 그 성능을 조사했다. 이 연구는 라이덴대학 메디컬센터 병리학과와 TransPORTEC 컨소시엄, 스위스 취리히대학교(University of Zurich) 병리학과 및 분자병리학과가 참여한 AIRMEC 컨소시엄의 공동 연구로 이뤄졌다.
연구팀은 HECTOR라 명명된 이 모델을 개발하기 위해 PORTEC-1/-2/-3 무작위 임상시험에 등록된 환자와 개별 임상 코호트의 장기 추적 데이터를 활용했다. 대상자는 이전에 보조화학요법을 받은 적이 없는 자궁내막암 환자 1761명이었다. 데이터 세트의 추적 관찰 기간 중앙값은 8.45년이었고, 4기 환자와 이전에 화학요법을 받은 적이 있는 환자는 제외시켰다.
먼저 환자 1408명 각각의 대표적인 조직병리학적 슬라이드 이미지 한 장을 사용해 모델을 훈련하고 최적화시켰다. 이는 모델이 원격 재발을 예측하는 시각적 특징을 인식하기 시작할 때까지 각 환자의 조직병리학적 이미지와 원격 재발까지의 시간에 관한 정보에 여러 번 노출됐음을 의미한다. 그 다음 일반화 가능성을 평가하기 위해 모델 학습에 데이터를 사용하지 않은 환자 353명의 데이터 세트에 대해 결과 모델을 테스트했다.
분석 결과 HECTOR는 이들 중 89명을 원격 재발 위험이 낮은 환자, 175명을 중간위험 환자, 89명을 고위험 환자로 식별했다. 이러한 예측은 실제 환자 결과와도 일치했다. 저위험군으로 분류된 환자의 3.37%가 원격 재발을 경험한 반면, 중간위험군과 고위험군으로 분류된 환자에서는 그 비율이 각각 15.43%와 36%에 달했다.
추가 연구 결과에 따르면 10년 원거리 무재발 생존율은 HECTOR에 의해 원격 재발 위험이 낮다고 판정된 환자에서 0.98로 가장 높았다. 중간위험군과 고위험군의 10년 무재발 생존 확률은 각각 0.88, 0.58이었다.
연구팀은 "추가적인 외부 검증이 필요하지만 이 모델의 성능은 딥러닝 모델이 자궁내막암 환자의 임상 치료를 최적화할 수 있는 잠재력을 가지고 있음을 보여주는 중요한 개념 증명 역할을 한다"고 말했다.
HECTOR는 조직병리 종양 슬라이드와 병기, 두 가지 유형의 입력 데이터만 사용한다. 이전에 발표된 모델의 조직병리 기반 분자 등급을 사용하기 때문에 분자 검사 없이도 자궁내막암의 분자 등급 정보를 통합한다. 결국 HECTOR는 조직병리 기반 분자 등급 정보와 종양 슬라이드의 형태학적 정보, 병기 범주를 결합해 무재발 생존율을 예측한다.
연구팀은 현재 조직병리 슬라이드에서 판독할 수 없는 임상 변수를 통합해 성능을 개선하기 위해 노력하고 있다.
댓글보기(0)