고려대학교 산학협력단, 의료·법률 전문 서적 말뭉치 사업 선정
‘2022년 인공지능 학습용 데이터 구축사업’ 선정
고려대학교 산학협력단(고려대 산단)이 최근 ‘과학기술정보통신부’가 주관하고 ‘한국지능정보사회진흥원’이 추진하는 ‘2022년 인공지능 학습용 데이터 구축사업’에 선정됐다고 14일 밝혔다. 이번 구축사업에서 고려대 산단은 ‘의료, 법률 전문 서적 말뭉치 데이터 구축’분야를 맡아, 전문 지식이 필요한 의료 및 법률 분야의 말뭉치를 체계적으로 분류하여 고부가가치 말뭉치 데이터를 구축하게 됐다. 고려대 산단은 군자출판사, 박영사, 범문에듀케이션, 법문사 등 의료 및 법률 분야 전문 출판업체 4개와 데이터 품질 관리 업체인 나라지식정보, 학습모델 개발 및 평가를 수행할 한양대학교 산학협력단 등 6개 기관과 컨소시엄을 구성했다. 사업은 올해 12월까지 7개월간 수행하며 사업비는 정부출연금 20억 원, 민간부담금 2억4250만 원으로 총 22억4250만 원이다. 고려대 산단은 의료와 법률 전문 도서 각 200종을 선정해 1억 어절 이상의 정제된 말뭉치를 구축하는 것을 목표로 한다. 이를 위해 최신