[메디게이트뉴스 이지원 기자] 바이오 연구에서 데이터 공유의 중요성이 대두됐다. 연구 데이터 공유는 연구 효율성을 높일 뿐 아니라 새로운 연구결과를 생산하는 등 과학 발전에 도움이 된다는 것이 학계 의견이다.
카이스트 이도헌 교수는 14일 2024 바이오 미래포럼에서 '디지털 가상인체기반 바이오 연구혁신과 연구데이터 공유생태계'를 발제하며 이같이 밝혔다.
이날 이 교수는 "AI와의 협력 연구가 시작됐다"며 AI의 데이터 학습과 연구 데이터의 공유 필요성을 강조했다. 기존에는 한정된 데이터 공유로 연구 효율성을 극대화하는 데 어려움이 있었다. 하지만 다양한 데이터를 공유하면 바이오 연구의 발전을 도모할 수 있다는 설명이다.
이 교수에 따르면 데이터 공유는 ▲데이터 가치 재창출을 통한 새로운 연구결과 생산 ▲연구결과의 재현과 검증을 통한 연구성과 유용성 증대 ▲불필요한 반복 실험 제거를 통한 연구 생산성 향상 ▲휴먼-AI 협력 연구를 위한 데이터 확보를 가능하게 한다.
이 교수는 "AI 학습의 경우 폭넓은 데이터가 필요한 만큼 포지티브(positive) 데이터뿐 아니라 네거티브(negative) 데이터의 확보도 중요하다"고 언급했다.
이 교수는 "AI가 포지티브 데이터만 보고 학습하기는 어렵다. 네거티브 데이터 중에서도 품질 좋은 데이터가 많다. 이런 데이터가 있을 때 AI의 변별 학습 성능을 극대화할 수 있다"고 말했다.
이어 이 교수는 "현재는 자발적으로 데이터를 공유하기 어렵다. 하지만 실제로는 장점이 많다. 연구 데이터를 공유하면 연구 결과의 인용과 활용을 증대시킨다. 연구 성과는 저하되지 않는다"고 부연했다.
이날 이 교수는 연구 데이터 공유를 활용한 컴퓨터 가상인체인 '코다'(CODA) 시스템도 소개했다. 코다는 연구자가 생성한 다양한 데이터를 종합해 가상으로 질병을 연구할 수 있도록 돕는 시스템으로 공개 데이터베이스, 국제 저널 논문 정보, 자체 수집 데이터를 기반으로 만들어진 '홀바디'(whole body) 빅데이터를 활용한다.
이를 통해 복합 약물의 효능을 예측하고 연구 성과를 한층 더 고도화할 수 있다.
이 교수는 자발적으로 바이오 연구 데이터를 공유할 수 있는 생태계를 만들기 위해서는 ▲경협(coopetition) 문화 확대 ▲데이터 공유 과학자에 대한 동기부여 ▲데이터 공유를 위한 인력양성 및 커뮤니티 구축 등이 필요하다고 제언했다.
이 교수는 "협력(cooperation)과 경쟁(competition)을 할 수 있는 하이브리드 문화가 중요하다"며 "과학자에게 필요한 최고의 동기는 성과를 냈다는 걸 커뮤니티가 인정해 주는 것이다. 연구자가 만든 데이터가 많은 이에게 쓰였고, 가치가 있었다는 사실을 명시적으로 평가하고 인정해 줄 수 있는 체계가 필요하다"고 말했다.
이어 그는 국가적 차원의 데이터 공유 네트워크 구축 필요성을 언급하며 "데이터 큐레이터가 원시 데이터를 가공해 가치 있는 데이터로 발전했을 때 해당 데이터 역시 하나의 저작물로 인정해야 한다"고 전했다.
마지막으로 이 교수는 "지난해 9월 연구데이터법이 입법 예고됐다. 결국 공동연구에서 산출되는 데이터는 어떤 형태로든 공유해야 한다는 법적인 틀이 견고하게 갖춰지고 있다"며 "새로 만들어지는 틀 안에서 연구자의 문화 역시 변화해야 한다"고 밝혔다.
댓글보기(0)