2024.05.12 (일)

  • 맑음속초22.1℃
  • 황사19.2℃
  • 맑음철원18.6℃
  • 맑음동두천19.4℃
  • 맑음파주19.5℃
  • 구름조금대관령16.3℃
  • 구름조금춘천20.1℃
  • 맑음백령도15.3℃
  • 황사북강릉21.5℃
  • 구름조금강릉24.0℃
  • 구름많음동해22.2℃
  • 황사서울18.9℃
  • 황사인천17.1℃
  • 구름조금원주19.5℃
  • 구름많음울릉도18.7℃
  • 구름조금수원18.7℃
  • 구름많음영월19.6℃
  • 구름많음충주19.5℃
  • 구름조금서산19.4℃
  • 구름많음울진16.9℃
  • 황사청주20.7℃
  • 황사대전21.3℃
  • 구름많음추풍령19.6℃
  • 황사안동20.7℃
  • 구름많음상주21.7℃
  • 구름많음포항22.0℃
  • 구름많음군산18.2℃
  • 황사대구21.4℃
  • 황사전주21.2℃
  • 구름많음울산21.1℃
  • 구름많음창원21.0℃
  • 황사광주22.3℃
  • 흐림부산19.6℃
  • 흐림통영16.8℃
  • 황사목포18.8℃
  • 구름많음여수21.4℃
  • 황사흑산도17.6℃
  • 흐림완도20.9℃
  • 구름많음고창19.8℃
  • 흐림순천19.7℃
  • 구름조금홍성(예)19.9℃
  • 구름많음19.7℃
  • 황사제주19.2℃
  • 흐림고산16.5℃
  • 흐림성산17.6℃
  • 흐림서귀포18.8℃
  • 구름많음진주22.3℃
  • 맑음강화19.0℃
  • 구름많음양평19.6℃
  • 구름많음이천20.5℃
  • 구름조금인제19.0℃
  • 구름많음홍천19.2℃
  • 구름조금태백19.7℃
  • 구름많음정선군21.3℃
  • 구름조금제천20.3℃
  • 구름많음보은20.3℃
  • 구름조금천안20.2℃
  • 구름조금보령18.8℃
  • 구름많음부여21.2℃
  • 구름많음금산20.4℃
  • 구름많음20.3℃
  • 구름많음부안17.9℃
  • 구름많음임실20.4℃
  • 구름많음정읍21.0℃
  • 구름많음남원21.5℃
  • 구름많음장수18.7℃
  • 구름많음고창군21.1℃
  • 구름많음영광군19.3℃
  • 흐림김해시20.4℃
  • 구름많음순창군21.1℃
  • 구름많음북창원21.1℃
  • 흐림양산시22.3℃
  • 흐림보성군21.5℃
  • 흐림강진군21.2℃
  • 흐림장흥21.4℃
  • 흐림해남21.0℃
  • 흐림고흥21.1℃
  • 구름많음의령군23.0℃
  • 구름많음함양군22.8℃
  • 흐림광양시22.1℃
  • 구름많음진도군19.7℃
  • 구름조금봉화20.1℃
  • 구름조금영주20.4℃
  • 구름많음문경21.7℃
  • 구름많음청송군21.1℃
  • 구름많음영덕21.5℃
  • 구름조금의성22.5℃
  • 구름조금구미22.7℃
  • 흐림영천21.4℃
  • 구름많음경주시21.6℃
  • 구름많음거창21.6℃
  • 구름많음합천20.8℃
  • 구름많음밀양21.8℃
  • 구름많음산청22.0℃
  • 흐림거제17.8℃
  • 흐림남해21.4℃
  • 흐림21.9℃
기상청 제공
"우리말 가장 잘하는 초대형 AI"...네이버 하이퍼클로바 공개
  • 해당된 기사를 공유합니다

"우리말 가장 잘하는 초대형 AI"...네이버 하이퍼클로바 공개

뉴스 50년치 한국어 데이터 학습…번역·대화·요약 등 가능

AKR20210525087151017_04_i.jpg

 

[CIOCISO매거진=홍상수 기자] 네이버가 한국어에 특화한 국내 최초의 초대규모 AI '하이퍼클로바'를 25일 선보였다.


네이버 정석근 클로바 CIC 대표는 이날 '네이버 AI 나우' 콘퍼런스에서 "문서 요약·번역·대화뿐 아니라 상식 퀴즈에 제대로 답하거나 말 만해도 코드를 만들어주는 등 기존에 상상하지 못했던 일을 쉽게 해결할 수 있다"며 "이전에 상상만 했던, 상상도 못 했던 일이 가능해지는 새로운 AI 시대가 열리는 것"이라고 말했다.


네이버가 최근 반년 동안 개발한 하이퍼클로바는 AI 모델의 크기를 나타내는 매개 변수(파라미터)가 2천40억 개로, 일론 머스크의 '오픈AI'가 만든 GPT-3의 1천750억 개를 능가한다.


정 대표는 "'빅 AI'에서 파라미터 개수는 반도체의 집적도와 같다"며 "파라미터 수가 증가함에 따라 AI가 풀 수 있는 새로운 문제의 해결 가능성이 높아진다"고 말했다.


하이퍼클로바는 외산 AI 모델과 달리 한국어를 집중적으로 배운 것이 특징이다.


네이버는 하이퍼클로바에 한국어를 학습시키고자 이전 언어 모델보다 3천 배 많은 뉴스 50년 치, 블로그 9년 치에 달하는 데이터를 입력했다. 한국어 데이터 세트 용량은 1.96테라바이트(TB)로, GPT-3의 한국어 데이터보다 6천500배 많은 양이다.


데이터 처리를 위해 지난해 10월 국내 기업 최초로 도입한 700페타플롭 성능의 슈퍼컴퓨터를 활용했다.


이에 딱딱하고 기계적인 기존 AI와 달리 문장을 완벽하게 구성하지 않아도 맥락을 이해하고, 상대방의 만족감을 알아차리며 호응까지 하는 등 자연스러운 대화가 가능하다고 네이버 측은 전했다.


성낙호 책임리더는 "하이퍼클로바는 우리말을 가장 잘 이해하고 구사할 수 있는 최초의 초대형 한국어 AI"라고 소개했다.


하이퍼클로바를 활용한 AI 언어 처리 기술은 이미 서비스에 적용되고 있다.


이달 6일 선보인 사용자가 검색어를 잘못 입력해도 올바른 단어로 전환해 검색해주거나 적절한 검색어를 추천해주는 기능이 바로 도입 사례다.


네이버는 앞으로 한국어 외 다른 언어를 지원하고 영상이나 이미지 등도 이해하는 '멀티모달 AI'로 하이퍼클로바를 계속 발전시켜나갈 계획이다.


또 전문가가 아니어도 손쉽게 AI 서비스를 만들 수 있도록 할 방침이다.


가령, 상품 판매에 도움이 되는 적절한 마케팅 문구를 AI가 자동으로 작성해주거나 공부해야 할 내용을 AI가 빠르게 요약하고 모르는 내용을 질문했을 때 자연스럽게 답변해주는 기능 등을 구상하고 있다.


작년 한 해 동안 글로벌 AI 학회에서 국내 기업 중 가장 많은 43개의 정규 논문을 발표했다.


정 대표는 "한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해서는 이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다"며 "새 AI 시대가 불러올 기술의 가능성을 믿고 이를 위해 최선을 다하고 있다"고 말했다.