완전 승인 결정 앞두고 자문위 '적절하게 잘 통제되지 않았다' 의견…FDA 브리핑 문서 세부 내용은
[메디게이트뉴스 박도영 기자] 미국 식품의약국(FDA) 자문위원회가 암젠(Amgen)의 폐암 치료제 루마크라스(Lumakras, 성분명 소토라십)의 주요 연구 결과가 신뢰할 수 없다고 판단하며 완전 승인(full approval)에 제동을 걸었다.
루마크라스는 처음으로 허가 받은 KRAS G12C 변이 비소세포폐암 치료제로, 2021년 5월 미국에서 CodeBreaK 100 2상 임상시험을 바탕으로 신속 승인을 받았다. 이어 3상 임상시험인 CodeBreak 200 데이터를 제출, 현재 완전 승인을 위해 검토 중이다. 국내에서는 지난해 2월 CodeBreaK 100 데이터를 바탕으로 식품의약품안전처 승인 받았다.
회의를 앞두고 공개된 FDA 브리핑 문서에서는 구조적 편향(systemic bias) 가능성을 제기, '적절하고 잘 통제된 시험과 일치하지 않는 것으로 보인다'며 CodeBreaK 200의 결과를 신뢰성 있게 해석할 수 있는지 여부와 CodeBreaK 200이 적절하고 잘 통제된 임상시험으로 간주될 수 있는지에 대한 논의를 요청했다.
보고서는 "CodeBreaK 200은 위험비(HR) 0.66으로 통계적으로 유의한 무진행 생존기간(PFS) 개선을 입증해 1차 평가변수를 충족했다. 관찰된 치료 효과는 표준 영상 촬영 기간 6주보다 짧은 약 5주 간의 PFS 중앙값 개선으로 미미한 수준이었다. 전체 생존기간(OS)은 1차 분석 당시 HR이 1.01로 차이가 없었다. OS 혜택이 없는 상황에서 5주 간격의 PFS 중앙값 차이의 임상적 의미는 불확실하다"면서 "또한 임상시험 결과는 여러가지 구조적 편향의 원인으로 혼선을 빚고 있어 CodeBreaK 200이 적절하고 잘 통제된 임상시험을 간주될 수 있는지에 대한 우려가 제기되고 있다"고 지적했다.
이어 열린 FDA 항암제자문위원회(ODAC)에서 외부전문가 패널들은 10명이 '반대', 2명이 '찬성' 표를 던졌다. 자문위 의견에 구속성은 없으나 대체로 FDA는 자문위의 의견에 따르는 편이다.
FDA는 12월 24일 또는 그 전에 루마크라스의 완전 승인 여부에 대한 최종 결정을 내릴 것으로 예상된다. 관련 업계에서는 루마크라스가 신속 승인을 유지하며, 당장 퇴출되지는 않을 것이라 보고 있다. 다만 브리핑 문서에서 제기된 구조적 편향 문제가 미칠 영향에 관심이 쏠린다. 메디게이트뉴스는 브리핑 문서를 통해 FDA가 분석한 구조적 편향의 원인은 무엇인지 상세하게 알아봤다.
무진행 생존 혜택 미미하고 전체 생존에는 차이 거의 없다는 점에 주목
암젠은 임상적 혜택을 검증하기 위한 시판후요건(PMR)의 일환으로, 루마크라스와 도세탁셀을 비교한 오픈라벨 임상시험인 CodeBreaK 200을 수행했다. 1차 평가변수는 PFS(독립적중앙검토위원회(BICR) 기준), 전체 생존기간(OS)는 2차 평가변수였다. 임상 개시 당시에는 크로스오버가 허용되지 않았으나 나중에 임상시험 프로토콜 개정 3으로 허용됐다.
임상 결과 루마크라스의 PFS 중앙값은 5.6개월, 도세탁셀 4.5개월이었고(HR=0.66), OS 중앙값은 각각 10.6개월 11.3개월(HR=1.01)로 나타났다.
브리핑 문서에서는 "이 탑라인 데이터를 처음 받았을 때 FDA는 PFS 혜택 중앙값 약 5주가 표준 영상 촬영 간격인 6주보다 적다는 점에 주목했다. 이로 인해 구간중도절단(interval censoring)을 고려했을 때 PFS 중앙값의 변동성에 대한 우려가 제기됐다"면서 "FDA와 신청자 모두 CodeBreaK 200의 PFS 혜택 중앙값이 5일에 불과할 수 있다고 보고했다. 이는 모호한 OS 결과와 함께 CodeBreaK 200의 임상적 유의성에 대한 의문을 제기했다"고 설명했다.
이어 "환자 성향 측면에서 볼 때, 도세탁셀군 가운데 23명은 무작위 배정 후 치료를 받지 않은 반면, 소토라십군에서는 2명이 무작위 배정 후 치료를 받은 적이 없는 것으로 관찰됐다"면서 "도세탁셀군의 이러한 비대칭적인 조기 중단은 CodeBreaK 200의 구조적 편향 가능성을 보여주는 첫 번째 징후 중 하나였다"고 덧붙였다.
FDA 검토팀은 추가 검토를 통해 잠재적인 구조적 편향의 여러 원인을 조사했고, ▲도세탁셀군에서 더 많은 중도 탈락이 발생한 비대칭적 조기 중도 탈락과 함께 ▲소토라십군에 유리한 진행성 질환에 대한 연구자 평가 ▲BICR로 질병 진행을 평가하기 전 도세탁셀에서 소토라십으로 환자를 전환하는 크로스오버 등을 확인했다.
연구 수행과 관련된 추가 문제로 영상 차터(charter)를 준수하지 않은 것이 포함됐다. 연구자 평가와 BICR 평가 간의 불일치를 해결하기 위해 BICR에서 여러 차례 영상 평가를 실시했고, 이는 임상시험계획서 위반으로 간주돼 데이터 품질·무결성에 대한 추가 우려를 불러일으켰다.
보고서는 "CodeBreaK 200이 적절하고 잘 통제된 임상시험으로 간주될 수 있을지 우려가 있다. 또한 영상 촬영 간격과 비교하면 BICR에 의한 1차 평가변수인 PFS는 그 규모를 고려했을 때 신뢰할 수 없을 수 있다"면서 "신청인은 0.60~0.72 범위의 위험비(HR)가 여러 민감도 분석으로 견고하게 유지되고 있다고 주장하지만, FDA는 치료 효과를 측정하는데 있어 PFS 사건 발생률, 중앙값 PFS 차이, 카플란-마이어 곡선 모양 등 다른 치료 효과 측정치가 중요하다고 주장한다. 또한 치료 효과는 OS와 같은 추가 평가변수 결과를 통해 강화돼야 한다"고 밝혔다.
보고서는 "CodeBreaK 100과 200의 객관적 반응률(ORR)은 비교적 일관되게 나타나고 있으며, 이는 ORR 측면에서 일관된 항종양 효과가 있음을 시사한다"면서 "그러나 CodeBreaK 200의 맥락에서 테스트 중인 주요 가설은 소토라십이 도세탁셀에 비해 PFS 이점을 입증하는지 여부였다"고 지적했다.
소토라십에 대한 환자·연구자 선호도, 초기 BICR 과정에 대한 간섭 징후 있다 판단
FDA는 적절하고 잘 통제된 임상시험으로 간주되기 위해서는 ⓐ목적 및 분석 방법에 대한 명확한 설명 ⓑ대조군과의 유효한 비교를 허용하는 연구 설계 ⓒ피험자를 치료군에 배정할 때 편견을 최소화하고 그룹의 비교 가능성을 보장하기 위한 적절한 조치 ⓓ피험자, 관찰자, 데이터 분석가의 편견을 최소화하기 위한 적절한 조치 ⓔ반응을 평가하기 위한 잘 정의되고 신뢰할 수 있는 방법 ⓕ약물의 표과를 평가하기 위한 연구 결과의 적절한 분석이 필요하다고 꼽았다.
이러한 맥락에서 FDA는 도세탁셀군의 높은 중도 탈락율과 무작위 배정 손실 가능성을 고려했을 때 치료군에 환자를 배정할 때 편향을 최소화하고 두 군의 비교 가능성을 보장하기 위한 적절한 조치가 마련되지 않았다(ⓒ, ⓓ)고 판단했다.
또한 연구자와 BICR의 질병 진행 콜 불일치 비율을 고려할 때 연구자의 편향을 최소화하기 위한 적절한 조치가 마련되지 않았거나 적절하게 준수되지 않았다고 봤다. 연구자들과 환자들은 소토라십의 초기 성공과 다양한 투여 경로 및 독성 프로파일을 고려해 소토라십에 접근하기 희망했다는 것이다(ⓓ).
영상 차터 위반, COP가 특정 BICR 평가를 감사하는데 간접적으로 사용돼 여러 세트의 BICR 판독을 초래한 것은 반응을 평가하는데 잘 정의되고 신뢰할 수 있는 방법이 없었음을 시사한다(ⓔ)는 점도 지적했다.
궁극적으로 연구 수행상의 문제, 높은 검열률, 동의를 철회한 환자의 추적 관찰 손실, 무작위 배정 손실 가능성으로 인해 CodeBreaK 200결과를 적절하게 분석해 소토라십과 도세탁셀의 효과, 특히 효과의 크기를 평가하지 못할 수 있다(ⓕ)고 분석했다.
보고서는 "CodeBreaK 200의 교차시험은 임상시험계획서 수정안 3에 따라 시행됐지만, 거의 모든 환자(99%)가 각 시험기관에 등록한 후에야 시행됐다. 이 시기까지 임상시험 치료를 시작하지 않고 임상시험을 철회한 환자도 다수 있었다. 더불어 질병 진행에 대한 연구자와 BICR의 평가가 일치하지 않는 것과 관련된 검열을 최소화하기 위해 진행 확인(COP) 절차가 도입됐지만, 여전히 연구자와 BICR의 평가 사이에 불일치가 존재했다. 영상 차터 및 프로토콜을 위반해 COP 평가가 BICR 평가를 감사하는 데 간접적으로 사용됐다. 위에서 설명한 다른 잠재적 전략은 적절하지 않았거나 편견을 완화하기 위해 마련됐다"고 정리했다.
보고서는 "CodeBreaK 200은 오픈 라벨 임상시험이므로, 특히 도세탁셀이 비소세포폐암 2차 치료제로 반응률이 낮은 것으로 알려져 있기 때문에 치료법 할당에 대한 지식으로 인한 구조적 편향이 발생할 수 있다"면서 "이 임상시험에서는 임상시험용 치료에 대한 환자 선호도, 소토라십에 대한 연구자 선호도, 초기 BICR 과정에 대한 어느 정도의 간섭에 대한 징후가 있다"고 설명했다.
이어 "이러한 편향은 모든 임상시험에서 우려할 수 있는 문제지만 CodeBreaK 200에서는 한계 유효성 결과로 인해 이러한 우려가 더욱 커졌다. PFS 혜택이 미미하고 OS에 차이가 없다는 점을 고려할 때, CodeBreaK 200의 잠재적 구조 편향은 도세탁셀 대비 소토라십의 우월성을 신뢰성 있게 판단하는데 극복하기 어려울 수 있다"고 밝혔다.
댓글보기(0)