2024.04.28 (일)

  • 맑음속초16.4℃
  • 맑음11.3℃
  • 맑음철원11.3℃
  • 맑음동두천12.3℃
  • 맑음파주9.6℃
  • 맑음대관령8.5℃
  • 구름조금춘천11.3℃
  • 구름많음백령도9.6℃
  • 맑음북강릉19.2℃
  • 맑음강릉20.7℃
  • 맑음동해17.6℃
  • 맑음서울14.3℃
  • 맑음인천12.5℃
  • 맑음원주14.5℃
  • 맑음울릉도18.5℃
  • 맑음수원9.8℃
  • 맑음영월11.7℃
  • 맑음충주11.7℃
  • 맑음서산8.7℃
  • 맑음울진14.8℃
  • 맑음청주14.7℃
  • 맑음대전12.4℃
  • 맑음추풍령11.1℃
  • 맑음안동12.5℃
  • 맑음상주14.5℃
  • 맑음포항17.6℃
  • 맑음군산10.8℃
  • 맑음대구15.7℃
  • 맑음전주13.7℃
  • 맑음울산13.3℃
  • 맑음창원14.3℃
  • 맑음광주15.6℃
  • 맑음부산15.4℃
  • 맑음통영14.0℃
  • 맑음목포13.0℃
  • 맑음여수16.5℃
  • 구름조금흑산도13.0℃
  • 맑음완도13.5℃
  • 맑음고창9.5℃
  • 맑음순천10.7℃
  • 맑음홍성(예)9.0℃
  • 맑음9.2℃
  • 구름조금제주15.7℃
  • 구름많음고산16.2℃
  • 구름조금성산12.5℃
  • 구름많음서귀포16.7℃
  • 맑음진주12.3℃
  • 맑음강화9.3℃
  • 맑음양평12.8℃
  • 맑음이천12.1℃
  • 맑음인제10.2℃
  • 구름조금홍천11.6℃
  • 맑음태백9.7℃
  • 맑음정선군9.8℃
  • 맑음제천10.2℃
  • 맑음보은9.7℃
  • 맑음천안8.9℃
  • 맑음보령10.7℃
  • 맑음부여9.7℃
  • 맑음금산9.7℃
  • 맑음11.3℃
  • 구름조금부안11.1℃
  • 맑음임실10.1℃
  • 맑음정읍10.5℃
  • 맑음남원12.6℃
  • 맑음장수9.5℃
  • 맑음고창군10.5℃
  • 맑음영광군9.6℃
  • 맑음김해시15.2℃
  • 맑음순창군11.6℃
  • 맑음북창원16.3℃
  • 맑음양산시13.6℃
  • 맑음보성군13.0℃
  • 맑음강진군11.6℃
  • 맑음장흥10.8℃
  • 맑음해남9.7℃
  • 맑음고흥12.2℃
  • 맑음의령군13.4℃
  • 맑음함양군11.3℃
  • 맑음광양시15.9℃
  • 구름조금진도군9.3℃
  • 맑음봉화10.0℃
  • 맑음영주11.4℃
  • 맑음문경12.8℃
  • 맑음청송군9.9℃
  • 맑음영덕14.5℃
  • 맑음의성9.9℃
  • 맑음구미13.7℃
  • 맑음영천11.8℃
  • 맑음경주시12.2℃
  • 맑음거창11.3℃
  • 맑음합천14.1℃
  • 맑음밀양13.7℃
  • 맑음산청13.3℃
  • 맑음거제13.4℃
  • 맑음남해14.6℃
  • 맑음12.8℃
기상청 제공
알리바바 클라우드, 70억 개 파라미터 갖춘 LLM 오픈소스로 공개
  • 해당된 기사를 공유합니다

NEWS

알리바바 클라우드, 70억 개 파라미터 갖춘 LLM 오픈소스로 공개

오픈소스 커뮤니티에 대한 기여 강화


[이미지] 알리바바 클라우드 로고.jpg


알리바바 클라우드가 오늘 70억 개의 파라미터를 갖춘 대규모 언어 모델(LLM) ‘Qwen-7B’와 ‘Qwen-7B-Chat’을 오픈소스로 공개했다. 


이번 LLM은 인공지능(AI) 모델 커뮤니티 ‘모델스코프(ModelScope)’와 협력 AI 플랫폼 ‘허깅페이스(HuggingFace)’를 통해 첫선을 보였다.


지난 4월 초, 알리바바 클라우드는 70억 개 이상의 파라미터를 포함한 다양한 모델 사이즈를 제공하며 중국어와 영어 모두 인간이 생산하는 것에 준하는 높은 수준의 콘텐츠를 생성할 수 있는 독자적인 첨단 LLM ‘통이치엔원(Tongyi Qianwen)’을 공개한 바 있다. 이번에 공개된 오픈소스는 사전 학습된 70억 개의 파라미터 모델인 ‘Qwen-7B’와 회화적으로 세밀하게 조정된 버전인 ‘Qwen-7B-Chat’을 포함하고 있다.


AI 기술의 민주화를 위한 노력의 일환으로, 알리바바 클라우드는 전 세계 학계와 연구기관, 영리단체들이 모델의 코드와 가중치, 문서에 무료로 접근할 수 있도록 개방할 예정이다. 월간 활성 이용자(MAU) 수가 1억 명 이하인 기업들은 이 모델을 상업적 용도로 무상 사용할 수 있으며, 1억 명 이상의 사용자를 보유한 프로그램들의 경우 알리바바 클라우드에 라이선스를 요청할 수 있다.


징런 저우(Jingren Zhou) 알리바바 클라우드 인텔리전스 최고기술책임자(CTO)는 “알리바바 클라우드는 독자적인 LLM을 오픈소스로 공개하여, 포용적 기술을 촉진하고 보다 많은 개발자와 중소기업들이 생성형 AI의 이점을 누릴 수 있도록 지원하고자 한다. 오픈소스 이니셔티브에 대한 확고하고 장기적인 지지자로서, 알리바바 클라우드는 이처럼 개방적인 접근 방식을 통해 집단지성이 발휘되어 오픈소스 커뮤니티의 활성화에 기여할 수 있기를 희망한다"고 말했다. 


Qwen-7B는 2조 개 이상의 토큰에 대해 사전 학습되었으며, 이는 중국어, 영어, 기타 다국어 자료, 코드, 수학 등 일반 및 전문 분야를 포괄한다. 또한 8K에 달하는 컨텍스트 길이를 갖추고 있다. 또한 Qwen-7B-챗 모델은 학습 과정에서 인간의 지시사항에 맞추어 조정되었다. Qwen-7B와 Qwen-7B-챗 모델은 클라우드와 온프레미스 인프라 모두에서 배포될 수 있으며, 이를 통해 사용자들은 모델을 세밀하게 조정할 수 있고 효과적·경제적으로 자체적인 고품질 생성형 모델을 구축할 수 있다.


사전 학습된 Qwen-7B 모델은 MMLU(Massive Multi-task Language Understanding, 대규모 다중작업 언어 이해) 벤치마크에서 56.7점의 괄목할 만한 성과를 거두며 유사하거나 일부 더 큰 규모의 여타 주요 사전학습 오픈소스 모델들의 성능을 능가하였다. 이 벤치마크는 초등 수학, 컴퓨터 과학, 법률 등을 포함한 57가지의 다양한 과업을 수행하는 텍스트 모델의 다중 작업 정확도를 평가한다. 


또한, Qwen-7B는 기초 모델을 위한 종합적인 중국어 평가 테스트인 C-이벌(C-Eval)에서 동등한 파라미터를 가진 모델 중 가장 높은 점수를 기록하기도 했다. 이 모델은 인문학, 사회과학, STEM(과학, 기술, 공학, 수학), 기타 분야를 포함한 총 52개 주제를 다루고 있으며, Qwen-7B는 GSM8K와 휴먼이벌(HumanEval)과 같은 수학 및 코드 생성의 벤치마크에서도 우수한 성능을 보여주었다.


알리바바 클라우드는 지난 7월 개발자와 중소기업의 창의적 이미지 표현을 지원하는 AI 이미지 생성기 '통이 완샹(Tongyi Wanxiang)'을 공개했다. 또한 모델스코프의 다양한 AI 모델을 활용해 언어, 시각, 음성 영역에서 복잡하고 전문화된 AI 작업을 수행하는 데 활용할 수 있는 다용도 프레임워크 ‘모델스코프GPT(ModelScopeGPT)’를 선뵈기도 했다. 알리바바 클라우드가 지난해 출시한 모델스코프는 20개의 선도적 AI 연구기관들이 제공한 1,000개 이상의 AI 모델을 보유한 오픈소스 AI 모델 커뮤니티다. 


Qwen-7B와 Qwen-7B-챗에 대한 보다 구체적인 정보는 모델스코프, 허깅페이스, 깃허브(GitHub) 공식 홈페이지에서 확인할 수 있다.

관련기사