2024.05.17 (금)

  • 맑음속초24.4℃
  • 맑음22.8℃
  • 맑음철원21.1℃
  • 맑음동두천20.8℃
  • 맑음파주19.7℃
  • 구름많음대관령17.0℃
  • 맑음춘천22.7℃
  • 맑음백령도14.7℃
  • 구름많음북강릉23.7℃
  • 구름조금강릉24.6℃
  • 구름많음동해23.5℃
  • 맑음서울22.3℃
  • 맑음인천18.5℃
  • 구름조금원주22.6℃
  • 맑음울릉도17.6℃
  • 맑음수원20.5℃
  • 구름많음영월21.4℃
  • 구름조금충주21.2℃
  • 구름조금서산18.9℃
  • 맑음울진23.6℃
  • 구름조금청주23.7℃
  • 맑음대전22.8℃
  • 맑음추풍령20.9℃
  • 맑음안동22.9℃
  • 맑음상주23.5℃
  • 맑음포항25.6℃
  • 맑음군산20.9℃
  • 맑음대구24.1℃
  • 맑음전주23.2℃
  • 맑음울산21.7℃
  • 맑음창원19.2℃
  • 맑음광주21.1℃
  • 구름조금부산19.1℃
  • 맑음통영18.9℃
  • 구름조금목포19.0℃
  • 구름조금여수19.0℃
  • 구름조금흑산도15.8℃
  • 구름조금완도20.1℃
  • 맑음고창
  • 맑음순천19.2℃
  • 구름조금홍성(예)20.1℃
  • 구름조금21.6℃
  • 구름조금제주20.5℃
  • 구름조금고산18.5℃
  • 구름조금성산19.8℃
  • 구름조금서귀포20.2℃
  • 맑음진주20.6℃
  • 맑음강화17.3℃
  • 맑음양평22.7℃
  • 구름조금이천21.9℃
  • 맑음인제21.7℃
  • 맑음홍천21.9℃
  • 구름많음태백18.5℃
  • 구름많음정선군21.2℃
  • 구름많음제천20.2℃
  • 맑음보은21.6℃
  • 구름조금천안22.0℃
  • 맑음보령17.8℃
  • 맑음부여20.8℃
  • 맑음금산21.9℃
  • 구름조금21.1℃
  • 맑음부안21.7℃
  • 맑음임실20.8℃
  • 맑음정읍22.6℃
  • 맑음남원22.8℃
  • 맑음장수19.4℃
  • 맑음고창군21.1℃
  • 구름조금영광군20.0℃
  • 구름조금김해시19.9℃
  • 맑음순창군21.9℃
  • 맑음북창원20.0℃
  • 맑음양산시21.1℃
  • 맑음보성군19.9℃
  • 맑음강진군20.0℃
  • 구름조금장흥20.6℃
  • 구름조금해남19.7℃
  • 구름조금고흥19.5℃
  • 맑음의령군22.3℃
  • 맑음함양군23.3℃
  • 구름조금광양시20.5℃
  • 구름조금진도군18.3℃
  • 구름조금봉화17.5℃
  • 구름조금영주20.0℃
  • 맑음문경19.6℃
  • 맑음청송군20.6℃
  • 맑음영덕21.4℃
  • 맑음의성21.3℃
  • 맑음구미22.4℃
  • 맑음영천22.9℃
  • 맑음경주시23.2℃
  • 맑음거창19.5℃
  • 맑음합천22.3℃
  • 맑음밀양21.6℃
  • 맑음산청21.4℃
  • 맑음거제18.5℃
  • 맑음남해18.9℃
  • 구름조금20.4℃
기상청 제공
플리토-트위그팜, AI 번역기 품질 평가 데이터 구축
  • 해당된 기사를 공유합니다

플리토-트위그팜, AI 번역기 품질 평가 데이터 구축

제목을-입력해주세요_-001 (8).jpg

 

인공지능(AI) 언어 데이터 전문기업 플리토가 자연어처리 전문기업 트위그팜과 함께 인공지능 번역기 품질 평가를 위한 데이터를 공동 구축한다.


트위그팜이 주관사로 플리토를 비롯해 시스트란, 글나무, 에퀴코리아, 푸르모디티 등 총 5개 참여사로 구성된 컨소시엄이 한국지능정보사회진흥원(NIA)의 ‘다국어 번역 품질 평가 데이터’ 사업 협약을 체결했다. 


플리토 참여 컨소시엄은 올 연말까지 ▲언어별 저작권 이슈 없는 신규 문서 확보 언어별 번역 말뭉치 데이터 및 번역 품질 평가 데이터 구축 데이터 및 구축 공정 품질관리 및 데이터 품질 검증 수행을 통한 고품질 데이터셋 구축 등을 수행할 계획이다.


글로벌 빅테크들의 생성형 AI 서비스 출시와 국내외 대기업들의 초거대 AI 투자가 본격화되는 가운데, 인공지능의 성능과 직결되는 고품질 데이터 구축과 기존 데이터의 품질 평가 시스템의 중요성이 대두되고 있다. 특히 언어권별 학습 데이터 수의 큰 격차를 극복하기 위해 기계번역(MT) 성능의 고도화는 필수인데, 지금까지는 ‘블루 스코어(BLEU Score)’와 같이 사람의 번역과 기계번역 결과 간 ‘단어 유사도’ 측정에 한정된 평가 기준으로 한계가 있었다.


이러한 한계를 극복하고 고품질의 대규모 병렬 말뭉치(코퍼스) 데이터를 구축하고자 트위그팜은 통합 크라우드소스 플랫폼을 운영하는 플리토와 손잡았다. 전 세계 약 1300만 유저의 플랫폼을 통해 양질의 최신 언어 데이터 확보가 가능하고, 특히 저작권 문제없는 적법성이 확보된 데이터 구축이 가능하다는 점에서 최적의 파트너라는 것이 트위그팜측 설명이다. 


자체 AI 엔진과 플랫폼 번역가, 검증된 링귀스트팀을 모두 운영하면서, ‘국립국어원 한국어-외국어 병렬 말뭉치 구축 사업’을 3년 연속 수주한 플리토의 데이터 사업 경쟁력을 바탕으로 이번 사업의 성공적 완수를 위해 긴밀하게 협업하겠다는 입장이다.


이번 컨소시엄을 주관하는 트위그팜의 백선호 대표는 “지금까지 정부 주도의 대규모 말뭉치 데이터 구축이 지속되고 있었지만 정작 데이터의 품질을 평가하는 기술에는 다소 한계가 있었다”며 “초고품질 다국어 데이터 구축 및 품질 평가를 통해 초거대 AI 환경 조성에 기여하겠다”고 포부를 밝혔다.


참여사 플리토의 이정수 대표는 “이번 수행 과제에 자사의 글로벌 통합 플랫폼을 활용할 수 있게 돼 기쁘다. 플리토가 저작권 이슈 없는 고품질 다국어 데이터 구축에 차별적 경쟁력을 보유하고 있는 만큼, 사업의 성공적 완수를 위해 최선을 다하겠다”고 말했다.