‘데이터셋’은 학습 데이터가 기술품질을 좌우하는 지능정보시대에 그 중요성이 점차 커지고 있으며 미국과 일본 등 선진국은 이미 사이버보안연구에 활용됐던 악성코드, 해킹·이상 행위 정보, 공격트래픽 등의 데이터셋을 연구기관, 학교, 기업, 비영리기관과 공유하고 있다.
KISA는 올해 우선 KISA・세인트시큐리티와 고려대학교의 사이버보안 R&D 연구에 활용했던 PC악성코드 분석결과, 자바 스크립트 등 스크립트 난독화 도구, 모바일 정상․악성앱, 자동차 해킹 데이터 등을 공유하기로 했다. 아울러 정보보호 전문 연구소 및 기업, 학교 등의 협조를 얻어 공유 데이터 목록을 확대한다는 계획이다.
또한 KISA는 R&D 데이터셋 이용을 활성화하기 위해 데이터셋을 활용한 악성코드 선제대응 및 탐지, 모바일 악성앱 탐지, 차량 이상징후 탐지 등 정보보호 기술을 개발해 경연하는 ‘정보보호 R&D 데이터 챌린지’도 오는 12월 8일 KISA 판교 정보보호클러스터에서 정보보호학회와 공동 개최할 예정이다.
공유된 데이터셋을 활용하고자 하는 국내 기업 또는 연구자는 정보보호산업진흥포털 내 ‘R&D데이터셋’ 페이지에서 데이터 목록, 활용사례, 샘플데이터 정보를 확인한 후 필요 데이터를 신청할 수 있다.
KISA 신대규 정보보호산업본부장은 “정보보호 R&D 데이터셋 공유를 통해 R&D연구에 필요한 데이터 확보 시간을 단축할 수 있을 것”이라며 “국내 기업의 다양한 우수 정보보호 기술 연구 개발을 지원하기 위해 사이버보안 연구 분야 데이터셋 공유를 확대하겠다”고 말했다.
ilyo11@ilyo.co.kr