1000만 이상 경북 옛한글 자료 식별 AI학습 빅데이터 구축
- 김상철 도 문화관광체육국장 "미래 4차 산업 선도·일자리창출 위한 한글산업 육성 힘 쏟을 것"
[안동=일요신문] 경북도 '옛한글 문자인식(OCR) 데이터셋 구축사업'이 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 추진하는 2021 인공지능 학습용 데이터 구축 지원사업 신규 대상사업으로 선정됐다.
도는 이번 선정으로 국비 19억원을 확보했다.
도에 따르면 인공지능 개발에 핵심인 인공지능 학습용 데이터를 구축·개방해 국가·사회 전반의 지능화 서비스를 확산 촉진하고, 일자리를 창출하는 혁신 사업이다.
이번 국비 확보는 지난 3월 12일부터 4월 16일 공고 기간 중 한국지능정보사회진흥원(NIA)에 접수된 84개 분야 사업을 대상으로 사업계획서, 프레젠테이션 발표, 질의응답 등 평가 과정을 거쳐 이달 24일 최종 확정 됐다.
선정된 '옛한글 문자인식(OCR) 데이터셋 구축사업'은 올해 연말까지 총 21억원(국비 19, 도비 2)을 투입하게 된다.
경북 도내 1000만 이상 옛한글 자료를 학습시켜 획, 크기, 형태가 모두 다른 옛한글을 식별해낼 수 있는 AI(인공지능)학습용 데이터를 구축하는 사업인 것.
이로써 경북의 새로운 문화콘텐츠 산업을 선도하고 청년 일자리를 창출하게 된다.
이 사업은 도와 안동대를 거점으로 포스텍, 한국국학진흥원, ㈜인플랫 5개 기관이 컨소시엄을 구성해, 옛한글 문자인식(OCR) 데이터셋을 구축하게 된다.
도는 사업진행 전반을 관리하고, 안동대는 총괄 품질관리 및 검수, 다양한 옛 한글 이미지를 분석한다. 포스텍은 원천데이터 의미태깅 도구 개발과 딥러닝 기반 기술 개발을 담당하고, 국학진흥원의 경우 옛한글 자료 수집과 제공을, ㈜인플랫은 옛한글 이미지와 텍스트 구축과 원시 데이터 정제도구를 개발하게 된다.
한편 도는 '옛한글 문자인식(OCR) 데이터셋 구축사업'으로 계속해서 발굴되고 있는 전국 최대 한글 고서적 자료를 체계적으로 재정리 하는 계기를 마련했다. 한글 문화가치 연구와 활용 서비스를 전국으로 빠르게 확산시키는 구심적 역할도 할 수 있게 됐다.
김상철 도 문화관광체육국장은 "이번에 선정된 한글AI 사업은 올해 4월6일 한글 문화·콘텐츠 산업 육성 전문가 토론회에서 제시된 디지털 뉴딜사업을 구체화한 하나의 사례"이라며, "앞으로도 지속적으로 미래 4차 산업 선도와 일자리창출을 위한 한글산업 육성에 힘을 쏟겠다"고 밝혔다.
최창현 대구/경북 기자 ilyo07@ilyo.co.kr
-
홍준표 "용병 하나 선택 잘못 했을 뿐…기죽지 말자"
온라인 기사 ( 2024.12.08 22:53 )
-
포항서, '제2회 대구경북공항 국제물류포럼' 열려
온라인 기사 ( 2024.12.08 10:33 )
-
[인터뷰] 박창범 전 우슈협회장 "이기흥 회장이 당선되면 종신제 간다"
온라인 기사 ( 2024.12.09 10:12 )