기사입력시간 25.03.10 19:41최종 업데이트 25.03.10 19:41

제보

중요성 커지는 AI 기반 의료데이터 산업…GPU·연합학습·법제 정비 필요

10일 '바이오헬스 디지털혁신포럼 창립총회 및 세미나' 개최…법·기술·인프라 뒷받침 없으면 AI 의료 혁신 어렵다


[메디게이트뉴스 이지원 기자] AI 의료 혁신이 가속화되는 가운데, 의료데이터의 표준화와 보안 강화, 인프라 확충이 필수적인 과제로 떠오르고 있다. 이에 데이터의 상호운용성을 높이고, 개인정보 보호를 강화하며, GPU 인프라를 확대하는 것이 시급하다는 제언이 나왔다.

을지대학교 스마트의료정보학부 강민수 교수와 아주대학교 의료정보연구센터 박래웅 센터장은 10일 국회 제1소회의실에서 개최된 '바이오헬스 디지털혁신포럼 창립총회 및 세미나'에서 발제를 통해 의료데이터의 중요성을 설명하고, 생태계 구축에 대해 제언했다.
 
(왼쪽부터) 을지대학교 스마트의료정보학부 강민수 교수와 아주대학교 의료정보연구센터 박래웅 센터장

AI 기반 의료데이터 중요성 커지지만 '병원 간 데이터 표준화, 개인정보 보호 강화, 기술·인력 확보'는 과제

이날 강 교수는 '의료데이터 산업 조성 방안'을 발제하며, AI 기반 의료 데이터 산업의 중요성을 강조하며 의료데이터 산업 조성의 주요 과제를 소개했다.

강 교수는 AI 기반 의료 데이터가 의료 서비스 개선, 경제적 파급 효과 등 의료 혁신을 가져올 것이라고 전망했다. 구체적으로 신약개발과 임상연구의 혁신을 야기하고, 의료 비용 절감 등 경제적 가치 창출에 도움을 줄 것이라고 언급했다. 또한 질병 예방, 공공 보건·질병 관리 체계를 개선하고, 혁신 기술 도입을 통한 경쟁력 확보가 용이해질 것이라고 부연했다.

이처럼 AI 기반 의료 데이터의 중요성이 커지는 만큼 데이터 표준화와 상호운용성 확보가 필수적이라고 강조했다.

그는 "AI의 정확도를 높이기 위해서는 대량의 고품질 의료 데이터가 필요하다. 특히 다양한 인구 집단과 질환 데이터를 포함하는 균형 잡힌 데이터셋이 중요하다"며 "병원 간 데이터 형식과 용어의 차이를 해소하고 국제 표준(HL7, FHIR 등)을 적용해 데이터의 상호운용성을 보장해야 한다"고 밝혔다.

이어 법적·윤리적 문제를 해결하고, 데이터 보안·개인정보 보호를 강화해야 한다고 설명했다.

그는 데이터 소유권과 활용 범위 등에 대한 명확한 규정 부족을 지적하며, 데이터 암호화·익명화 기술을 적용해 데이터 보안을 강화할 것을 제안했다.

강 교수는 "AI를 활용한 의료 진단 시 책임소재, 편향성 등 윤리적 문제가 발생할 수 있다"며 "의료데이터는 환자의 민감한 정보를 포함해 유출 시 심각한 피해를 초래할 수 있다. 이에 법적 규제를 준수하면서도 데이터 활용을 장려할 수 있는 AI 활용 윤리 가이드라인을 마련해야 한다"고 말했다.

아울러 그는 기술 인프라 구축과 전문 인력 양성이 필요하다고 부연했다.

강 교수는 "대량의 의료데이터를 저장하고 분석할 수 있는 인프라가 부족하다"며 "병원과 연구소가 활용할 수 있는 고성능 컴퓨팅 인프라를 마련해 클라우드 기반의 의료 데이터 저장소와 분석 시스템을 구축해야 한다"고 설명했다.

이어 "의료진과 데이터 과학자 간 협업이 원활하지 않아 의료 데이터 관리와 AI 분석이 능숙한 전문 인력이 부족하다"며 "전문가 간 협력을 강화할 수 있는 협력 모델을 개발하고, 의료 데이터 분석과 AI 기술 활용에 대한 전문 교육 프로그램을 운영해야 한다"고 덧붙였다.

AI 의료 혁신 위해서는 환경구축도 필수적

박 센터장은 '미래의료 혁신을 위한 범국가적 멀티모달 파운데이션 모델 개발'을 발제하며, 분산형 바이오헬스 빅데이터 플랫폼 확장과 GPU 확보 필요성을 강조했다.

그는 "국내 의료 기관과 관련 기업이 100급 GPU를 보유한 수량은 수십대에 불과하다. 의료 데이터 접근이 원천적으로 차단돼 있어 AI 연구 개발의 기반이 매우 취약한 상황"이라며 "AI 의료 혁신의 글로벌 경쟁에서 도태되지 않으려면 멀티모달 의료 AI를 위한 국가적 대응 전략을 마련할 결정적 시점이다. 의료 데이터 보호와 활용의 균형을 맞추고, 의료 AI 혁신을 선도할 수 있는 실질적인 대안을 추진해야 한다"고 강조했다.

이에 박 센터장은 의료 데이터 센터 구축이 필요하다고 제언했다. 이와 함께 분산형 AI 학습을 제안했다.

박 센터장은 "이상적인 방법은 대규모 GPU를 보유한 의료용 데이터 센터를 구축하고, 대형 병원의 의료 데이터를 한 곳에 집적해 활용하는 것"이라며 "하지만 의료 데이터는 민감한 개인정보를 포함해 환자의 동의를 받거나 익명·가명화 도치를 거쳐야 한다. 이를 준수하더라도 각 병원은 의료 데이터를 외부 반출하는 데 동의하길 꺼린다"고 설명했다.

이어 "의료 데이터를 외부로 반출하지 않고 AI를 개발할 방법이 있다"며 "정부는 2018~2022년 산업통상자원부와 보건복지부 주도로 '분산형 바이오헬스 빅데이터 사업'을 추진했다. 62개 대학병원의 의료 데이터를 공통데이터(CDM)로 표준화하고, 데이터는 병원 내부에 보관한 채 분석 프로그램을 기관 내부에서 실행하는 방법이다"라고 말했다.

그는 "분석 결괏값만 외부로 반출해 통합하는 시스템을 구축해 데이터 반출 없이도 여러 의료기관의 데이터를 분석할 수 있는 환경을 조성했다. 72개 병원이 이를 활용하고 있고, 약 5만건 이상의 분석이 이뤄졌다. 현재 CDM은 구조화된 데이터에 한정돼 있어, 자유 서술식 의무기록, 의료 영상 등 비정형 데이터를 포함하지 못한다"며 "의료 AI도 정형 데이터뿐 아니라 문서·영상 등 비정형 데이터까지 포함해야 한다"고 주장했다.

마지막으로 박 센터장은 각 병원에 GPU 인프라를 분산배치하고, 병원 내 의료 데이터를 활용해 AI를 학습하는 '연합학습' 기법 도입을 제안했다. 그는 병원 데이터는 외부로 반출되지 않고, AI 학습은 가능해 의료 AI 개발 속도를 높이고, 나아가 국민 의료 서비스 질 향상과 국가 의료비 절감에 큰 역할을 할 것이라고 전망했다.

"데이터 표준화 용어 정리에서 그치지 않는다…상호운용성 보장 범위 확대 추진"

토론 패널로 참가한 보건복지부 보건의료데이터진흥과 백영하 과장은 의료 데이터의 활용을 확대·강화하기 위한 정부 사업 등을 소개했다.

그는 "지난해 국가 통합 바이오 빅데이터 사업을 시작했다"며 "2032년까지 100만명의 인체자원(검체) 확보를 목표로 한다. 1단계에서는 5년간 77만명의 유전체와 임상 데이터를 모으는 작업을 협업사업으로 진행하고 있다. 또 데이터 활용을 위해 보건의료 빅데이터 플랫폼과 의료데이터 중심병원 사업을 추진하고 있다"고 밝혔다.

백 과장은 "데이터 중심 병원은 6년차에 접어들었다. 그동안에는 데이터를 쌓고 정제하는 등 제공할 수 있는 거버넌스를 구축했다면 앞으로는 현장에서 활용할 수 있도록 할 계획"이라고 설명했다.

이어 "데이터 표준화의 중요성이 높아지고 있다. 기존에 보건의료 데이터 용어에 대한 고시가 있었지만, 33만 개 용어에 대한 나열일 뿐 현장에서 적용하기 어렵다는 지적이 있었다"며 "2년 정부터 현장에서 필요한 핵심 교류 데이터를 기반으로 국제 표준을 준용하는 등 핵심 데이터 용어와 전송 규격을 정하는 고시를 만들고 있다. 중요한 건 확산이다. 표준이 확산하기 위해서는 의료 현장의 도움이 필요하다"고 부연했다.

아울러 "응급실이나 중환자실 등 필수 의료 분야에서 필요한 인공지능을 개발하기 위한 사업을 진행하고 있다. 또 인재 양성도 중요한 만큼 의료 인공지능 특화 융합 인재 양성 사업을 시작하고 있다"며 "현장 수요에 맞춰 진행하고 확대하기 위해서는 법과 예산이 따라줘야 한다"며 국회의 많은 관심과 지원을 부탁했다.

이지원 기자 (jwlee@medigatenews.com)
댓글보기(0)

전체 뉴스 순위

칼럼/MG툰

English News

전체보기

유튜브

전체보기

사람들

이 게시글의 관련 기사