2024.05.07 (화)

  • 흐림속초10.8℃
  • 비12.7℃
  • 흐림철원12.2℃
  • 흐림동두천12.3℃
  • 흐림파주12.1℃
  • 흐림대관령8.1℃
  • 흐림춘천12.7℃
  • 비백령도10.2℃
  • 비북강릉11.3℃
  • 흐림강릉12.0℃
  • 흐림동해12.4℃
  • 비서울12.9℃
  • 비인천12.3℃
  • 흐림원주13.6℃
  • 안개울릉도13.1℃
  • 비수원12.2℃
  • 흐림영월12.6℃
  • 흐림충주12.6℃
  • 흐림서산12.6℃
  • 흐림울진13.5℃
  • 비청주13.5℃
  • 비대전12.5℃
  • 흐림추풍령11.8℃
  • 비안동13.3℃
  • 흐림상주13.1℃
  • 흐림포항16.2℃
  • 흐림군산13.5℃
  • 흐림대구15.0℃
  • 비전주13.0℃
  • 흐림울산15.6℃
  • 흐림창원15.6℃
  • 박무광주14.3℃
  • 박무부산15.5℃
  • 구름많음통영15.5℃
  • 박무목포15.0℃
  • 박무여수15.0℃
  • 박무흑산도15.1℃
  • 구름조금완도14.6℃
  • 흐림고창14.2℃
  • 흐림순천12.3℃
  • 비홍성(예)13.1℃
  • 흐림12.4℃
  • 박무제주15.6℃
  • 맑음고산14.7℃
  • 맑음성산12.9℃
  • 박무서귀포14.6℃
  • 구름많음진주14.8℃
  • 흐림강화12.1℃
  • 흐림양평13.0℃
  • 흐림이천13.1℃
  • 흐림인제11.5℃
  • 흐림홍천12.5℃
  • 흐림태백10.5℃
  • 흐림정선군11.6℃
  • 흐림제천11.9℃
  • 흐림보은12.3℃
  • 흐림천안13.3℃
  • 흐림보령12.8℃
  • 흐림부여13.1℃
  • 흐림금산12.3℃
  • 흐림12.8℃
  • 흐림부안13.6℃
  • 흐림임실11.7℃
  • 흐림정읍13.6℃
  • 흐림남원12.7℃
  • 흐림장수11.3℃
  • 흐림고창군13.6℃
  • 흐림영광군14.8℃
  • 흐림김해시15.9℃
  • 흐림순창군12.6℃
  • 흐림북창원16.2℃
  • 흐림양산시16.4℃
  • 구름많음보성군14.5℃
  • 구름많음강진군15.2℃
  • 구름많음장흥14.2℃
  • 맑음해남14.9℃
  • 맑음고흥14.6℃
  • 흐림의령군15.3℃
  • 흐림함양군13.4℃
  • 흐림광양시14.0℃
  • 구름조금진도군14.8℃
  • 흐림봉화13.0℃
  • 흐림영주12.9℃
  • 흐림문경12.2℃
  • 흐림청송군12.1℃
  • 흐림영덕14.8℃
  • 흐림의성13.6℃
  • 흐림구미14.3℃
  • 흐림영천13.9℃
  • 흐림경주시15.3℃
  • 흐림거창12.3℃
  • 흐림합천14.8℃
  • 흐림밀양15.3℃
  • 흐림산청13.1℃
  • 구름많음거제15.4℃
  • 흐림남해15.3℃
  • 구름많음16.5℃
기상청 제공
과기정통부, 초거대AI 데이터 인프라 확충
  • 해당된 기사를 공유합니다

과기정통부, 초거대AI 데이터 인프라 확충

2023년도 AI 학습용 데이터 구축 사업 2,805억 원 투입, 150종 구축 공모

제목을-입력해주세요_-001 (6).jpg

 

과학기술정보통신부(이하 과기정통부)가 4월 14일부터 5월 19일까지 ‘AI 학습용데이터 구축사업(이하 구축사업)’ 참여사업자를 모집한다.


의료진단, 자율주행, 챗봇, 음성 인식 등 다양한 인공지능 모델 또는 서비스는 데이터 학습을 통해서 구현된다. 대량의 학습데이터는 인공지능의 성능향상과 직결되는 핵심요소이나, 데이터 수집‧가공에는 상당한 시간과 비용이 필요하다. 


국내 중견‧중소기업, 스타트업, 대학 등은 AI 개발‧도입을 가로막는 주요 저해요인으로 학습용데이터 부족 문제를 지속적으로 제기하고 있는 실정이다.


이에 과기정통부는 2017년부터 언어, 이미지, 영상, 음성, 센서 등 다양한 유형의 인공지능 학습데이터를 구축하여 누구나 손쉽게 활용할 수 있도록 지원하고 있다. 현재 AI 허브(aihub.or.kr)를 통해 한국어, 헬스케어, 교통 등 6대 분야 381종의 데이터를 제공 중이며, 이달 말부터는 지난해 구축한 310종을 품질검증을 거쳐 순차적으로 추가 개방할 예정이다.


 금년도 구축사업에는 총 2,805억 원의 예산을 투입하여 150종의 신규 데이터를 구축한다. 우선 지난해 수요조사를 통해 접수된 약 1천 4백 건의 후보데이터를 토대로 기획된 130종의 데이터는 지정과제 형태로 추진한다. 지정과제는 ‘22년 1월 수립 ’AI 학습용 데이터 구축·활용 고도화 방안‘에 따라 선정된 14대 분야 118종의 데이터와 2022년도 과제 12종으로 구성된다. 나머지 20종은 자유과제로 지역특화, 자유주제 등 일반영역과 초거대AI 영역으로 나눠 선정할 예정이다.


특히 금년에는 챗GPT와 같은 초거대AI에 기반한 대화형 모델 지원을 위한 데이터 구축도 추진한다. 기존의 지도학습용 데이터(라벨링데이터) 물량은 일부 축소하고, 한국어 21종 등을 포함한 총 34종의 데이터를 ‘초거대AI 지원 데이터’로 구분하여 자기지도학습에 필요한 비라벨링 데이터 구축을 확대한다. 


또한 이미지 데이터 48종은 생성형AI 등의 학습에도 활용할 수 있도록 이미지를 묘사‧설명하는 캡션 정보를 추가로 포함한다. ‘24년도부터는 사업개편을 통해 초거대AI 데이터 구축을 별도 트랙으로 신설하여 본격 지원할 예정이다.


아울러 그간 적용해 온 수행기관의 인건비 편성요건을 폐지하고 자동라벨링, 합성데이터 등 신기술 도입 적용을 확대한다. 문화관광, 스포츠, 법률 등 산업특화 분야에서의 인공지능 도입을 유도하기 위하여 관련 데이터 구축 비중을 ’2022년도 19%→‘2023년도 25%로 높인다. 또한 국회·소방 등 공공분야에서 보유한 데이터의 민간이용 확산을 지원하기 위한 공공분야 학습데이터 구축(5종)도 구축도 강화한다.

 

이번 공모 사업은 AI 학습데이터를 활용하는 전문기업과 데이터 수집‧보유‧가공 등의 구축 역량을 갖춘 2개 이상의 기업‧기관 등이 컨소시엄을 구성하여 참여할 수 있다. 총 114개의 신규 주관기관을 선정할 예정이며, 선정 기관에는 데이터 종당 구축비용으로 1년간 13.5억원~17억원이 지원된다. 사업 공모와 관련된 상세한 안내는 AI허브, 과학기술정보통신부와 한국지능정보사회진흥원의 누리집을 통해 확인할 수 있다.


박윤규 과기부 제2차관은 “방대한 양의 데이터를 배워 사람처럼 추론하는 초거대 AI 등 새로운 AI 기술이 등장하면서 양질의 대규모 데이터 확보는 어느 때보다 중요해지고 있다. 혁신적인 아이디어를 가진 많은 기업들이 인공지능 도입‧개발에 보다 적극적으로 도전할 수 있도록 고품질의 데이터 인프라를 조성함으로써, 우리 국민들이 생활 속 구석구석에서 더욱 다양한 인공지능 혜택을 누릴 수 있는 기반을 다져 나가겠다”고 말했다.

관련기사