기사입력시간 23.08.04 05:46최종 업데이트 23.08.04 05:46

제보

자연언어부터 이미지, 영상까지 방대한 의료데이터 삼킨 AI, 임상현장에 어떻게 쓰일까?

카이스트 AI 대학원 최윤재 교수, 설명 가능한 예측·멀티모달·질의응답 AI 소개

사진=게티이미지뱅크

[메디게이트뉴스 조운 기자] 헬스케어 AI가 거대한 보건의료데이터를 집어삼키면서 그 활용 가능성이 무궁무진하게 확대되고 있다. 실험실 안에서 논의되던 아이디어들이 기업들에 의해 사업화 단계에 들어서는 등 조만간 임상현장에도 적용될 수 있을 것이란 기대도 커지고 있다.

카이스트(KAIST) AI 대학원 최윤재(PhD) 교수는 최근 이화여자대학교 생명의료법연구소 '디지털 헬스아카데미'에서 '헬스케어 인공지능-설명 가능한 예측, 멀티모달 학습, 질의응답 시스템'을 주제로 강의했다.

방대한 보건의료 데이터 학습하는 AI…전문가 없이도 '설명 가능한 예측' 가능

먼저 최 교수는 병원을 찾은 환자들에 대한 방대한 데이터를 기반으로 향후 발생할 질병, 환자에게 발생할 이벤트 등을 예측하는 '설명 가능한 예측'에 대해 소개했다.

그는 "헬스케어 AI는 병원에 쌓인 밀도 있는 병원 데이터베이스를 어떻게 활용해 예측할 것인가가 핵심이다. 워낙 병원에 쌓인 데이터가 많아서 과거에는 모든 정보를 컴퓨터에 넣는 것은 불가능했다"며 "심혈관 전문가가 엔지니어에게 심부전을 예측하기 위해 필요한 지표가 무엇인지 힌트를 줘야 했다. 부정맥은 몇 번 있었는지, 호흡 곤란이 몇 번 있었는지, 처방 받은 약은 무엇인지 등의 주요 팩터가 환자를 대표하는 벡터가 된다"고 말했다.

최 교수는 "이러한 벡터를 분류 알고리즘에 넣으면 예측이 되는 것이다. 아주 많은 데이터를 모두 컴퓨터에 넣을 수 없었기 때문에 과거에는 의사의 지식에 의존했다면, 딥러닝 시대에는 달라진다"고 밝혔다.

그는 "이제는 모든 보건의료 관련 데이터를 컴퓨터에 넣을 수 있게 됐다. 딥러닝 시대에는 질병, 약, 처치, 코드, 행위 등 모든 것이 벡터가 될 수 있고, 이 벡터값이 알아서 사람이 이해할 수 없는 실수값으로 전환돼 AI가 학습하게 된다"며 "의사의 지식에 의존했던 시대에서 모든 정보를 벡터로 변환해 스스로 비슷한 질병끼리 뭉쳐 예쁜 그림이 나오게 된다"고 말했다.

그는 "과거에는 대량의 보건의료 데이터 중 심혈관 전문의가 10~20년 축적해온 지식으로 정보를 뽑아 데이터를 만들었는데, 이제는 있는 정보를 모두 모델에 넣으면 알아서 기계가 중요한 정보를 빼서 예측을 할 수 있다는 게 이미 여러 사례에서 증명됐다"며 "자연어 처리의 경우에도 데이터를 무한정 넣으면 성능이 올라간다는 게 챗GPT를 통해 이미 검증된 만큼 의료데이터도 무한한 데이터가 있으면 한 명도 의료 지식이 없어도 모델이 알아서 해줄 것이라는 것을 유추할 수 있다"고 말했다.
 
카이스트(KAIST) AI 대학원 최윤재(PhD) 교수.

멀티모달 AI…의료 이미지 및 영상 정보만으로 텍스트 언어화 가능

뒤를 이어 최 교수는 기존에 텍스트나 자연어를 이해하는 데 초점을 맞췄던 AI가 시각, 청각을 비롯한 여러 인터페이스를 통해 정보를 받아들이는 '멀티모달(Muti Modality)'의 보건의료 적용에 대해 소개했다.

그는 "실험실에서 보건의료 AI 연구를 위해 병원 데이터를 받을 때 대부분 EMR에 들어가는 질병 코드를 받았다. 그런데 병원에는 텍스트 데이터만 있는 것이 아니다. 영상과 신호 등 다양한 멀티모달 데이터들이 있고, 그런 것이 있어야 환자 상태를 정확히 파악할 수 있다"며 "AI도 코드뿐 아니라 다양한 멀티모달 데이터를 다 활용해야 의사와 거의 비슷한 레벨에서 판단을 할 수 있다. 따라서 과학자로서 병원에 있는 모든 데이터를 컴퓨터에 때려 넣는 것이 원대한 꿈이다"라고 밝혔다.

이에 최 교수는 먼저 이미지형 텍스트만 넣었을 때 AI 모델이 학습할 수 있는지부터 시작했다. 엑스레이의 픽셀 값과 텍스트 언어를 동시에 이해하는 모델이 있다면 더 나은 진단을 할 수 있을 것이라고 생각한 것이다.

그 결과 AI는 의학적 지식이 없음에도 멀티모달 데이터를 통해 정보를 습득할 수 있음이 드러났다. AI는 흉부 엑스레이 등 이미지만으로 진단 리포트를 쓰고, 퇴원 보고서를 쓸 수 있었다.

최 씨는 "이미지로 리포트를 쓰는 아이디어는 대형 IT 기업들이 뛰어들어 준비하고 있다. 수익사업이 될 거라고 판단한 것 같다. 현재 카카오는 700만장의 이미지 모아서 병원에서 사용할 수 있는 서비스를 제공하려 준비하고 있고, 마이크로소프트도 대규모 데이터를 이용한 서비스를 개발하고 있는 것으로 알려져 있다"고 전했다.

AI 질의응답 시스템 가능하지만…답할 수 없는 질문에도 답하려는 AI, "신뢰도 낮아"

최근 챗봇 AI에 대한 관심이 높아지고 있다. 최 교수 역시 의사들이 주고 받는 자연어를 분석해 AI가 의료진의 전문적 질문에 응답할 수 있는 AI스피커를 구상했다.

그는 "병원에선 말로 주고받는 데이터가 많은데 이걸 하면 생산성이 올라가지 않을까 생각했다. AI스피커를 놓고 원무과, 총무과, 보험심사과, 간호사, 의사가 질문을 하면 AI가 그에 대한 답을 주는 것이다"라고 설명했다.

이에 최 교수는 오픈소스 데이터셋을 이용해 질의응답이 가능한 AI를 구상했다. 문제는 임상현장에서 의료진이 궁금해 하는 질문에 AI가 적합한 답을 내놓을 수 있을까였다.

이에 건양대병원과 협업을 통해 AI에 묻고 싶은 질문을 받아 실험한 결과 해당 AI가 적절한 대답을 할 수 있는 것으로 나타났다. 이에 최 교수는 해당 데이터베이스를 AI학회에 발표해 등록했다.

하지만 최 교수는 "문제는 일부러 답할 수 없는 질문을 했을 때, 답하지 않아야 하는데 AI가 답을 모르는데도 그럴싸하게 짜깁기를 통해 대답하려 한다는 것이다. AI에게 100개의 대답할 수 없는 질문을 줬는데 14개는 끝까지 답하려고 한다. 챗 GPT도 아는 것과 모르는 것을 구분하지 못한다는 한계가 있다"며 "상용화하려면 이런 비율이 0.01%는 돼야 하는 만큼 아직 임상 현장에 사용하기에는 신뢰도가 낮다"고 전했다.

조운 기자 (wjo@medigatenews.com)
댓글보기(0)

전체 뉴스 순위

칼럼/MG툰

English News

전체보기

유튜브

전체보기

사람들

이 게시글의 관련 기사