업스테이지, '솔라 오픈' 공개 - aurora I 디자인 블로그
공유
업스테이지, '솔라 오픈' 공개 - aurora I 디자인 블로그
복사
업스테이지, '솔라 오픈' 공개

업스테이지, '솔라 오픈' 공개

업스테이지, '솔라 오픈' 공개

2026. 1. 6.

2026. 1. 6.

2026. 1. 6.

AI 요약

업스테이지가 1020억 매개변수 '솔라 오픈 100B'를 오픈소스로 공개하며, 한국어 110%·영어 103% 수준으로 딥시크 R1을 능가하는 벤치마크 성능 입증했습니다. MoE 아키텍처로 연산 효율 극대화, 20조 토큰 데이터셋 활용해 AskUp·AI 워크스페이스 등 서비스에 적용하며 기업·연구자 활용 확대합니다. 데이터셋 일부 AI 허브 개방으로 한국어 오픈 AI 생태계 구축, 허깅페이스 배포해 글로벌 개발자 커스터마이징 지원합니다.

업스테이지가 1020억 매개변수 '솔라 오픈 100B'를 오픈소스로 공개하며, 한국어 110%·영어 103% 수준으로 딥시크 R1을 능가하는 벤치마크 성능 입증했습니다. MoE 아키텍처로 연산 효율 극대화, 20조 토큰 데이터셋 활용해 AskUp·AI 워크스페이스 등 서비스에 적용하며 기업·연구자 활용 확대합니다. 데이터셋 일부 AI 허브 개방으로 한국어 오픈 AI 생태계 구축, 허깅페이스 배포해 글로벌 개발자 커스터마이징 지원합니다.

업스테이지가 자체 개발한 거대언어모델(LLM) ‘솔라 오픈 100B(솔라 오픈)’를 오픈소스로 공개하며, 국가대표 AI 프로젝트의 첫 성과를 내놓았습니다.

솔라 오픈은 1,020억 매개변수 규모의 모델로, 데이터 구축부터 학습까지 전 과정을 독자적으로 진행한 ‘프롬 스크래치(from scratch)’ 방식으로 개발됐으며, 글로벌 오픈소스 플랫폼 허깅페이스에 공개돼 누구나 내려받아 활용할 수 있습니다.

과학기술정보통신부 ‘독자 AI 파운데이션 모델 프로젝트’의 첫 결과물이기도 한 솔라 오픈은, 한국어·영어·일본어 3개 국어를 중심으로 학습해 국내 기업·연구자의 활용도를 높이는 동시에 글로벌 AI 생태계와의 호환성도 고려한 것이 특징입니다.

업스테이지에 따르면 솔라 오픈은 중국 ‘딥시크 R1’ 대비 파라미터 규모는 약 15% 수준이지만, 한국어 110%, 영어 103%, 일본어 106% 수준으로 주요 벤치마크 성능에서 앞서는 결과를 기록했습니다.

또한 수학, 복합 지시 수행, 에이전트 등 고차원적 지식 영역에서도 딥시크 R1이나 오픈AI GPT-OSS-120B-미디움과 대등하거나 일부 영역에서 우위의 성능을 보인 것으로 전해졌습니다.

업스테이지는 약 20조 토큰 규모의 고품질 사전학습 데이터셋을 구축해 한국어 부족 문제를 보완했으며, 금융·법률·의학 등 도메인 특화 데이터와 합성 데이터를 적극 활용해 실사용 환경에 강한 모델을 지향했습니다.

솔라 오픈의 내부 구조는 129개의 전문가 모델을 혼합한 MoE(Mixture-of-Experts) 아키텍처로 설계돼, 실제 추론 시에는 120억 개 수준의 매개변수만 활성화되도록 구성해 효율을 극대화했습니다.

이를 통해 대규모 모델이면서도 연산 비용과 인프라 부담을 크게 줄였고, GPU 최적화로 학습 기간을 약 50% 단축해 120억원 규모 인프라 비용 절감 효과를 냈다는 설명입니다.

모델은 솔라-아파치 라이선스를 적용해 기업 환경에서도 비교적 자유롭게 커스터마이징 및 상용 활용이 가능하도록 했으며, 상세 아키텍처와 실험 결과를 담은 테크 리포트도 함께 배포됐습니다.

업스테이지는 솔라 오픈을 자사 서비스에 우선 적용해 실제 활용 사례를 빠르게 쌓겠다는 계획입니다.

이미 230만 명 이상이 사용하는 AI 기반 질의응답 서비스 ‘AskUp’과 기업용 업무지원 서비스 ‘AI 워크스페이스’에 솔라 오픈을 연동해 요약·문서 이해·코드 보조 등 기능을 고도화하고 있습니다.

또한 ‘업스테이지 콘솔’을 통해 API 형태로 솔라 오픈을 제공해, 국내외 개발자와 기업이 손쉽게 접속·실험·서비스 연동을 할 수 있는 환경을 마련했습니다.

업스테이지는 향후 솔라 오픈 학습에 사용한 데이터셋 일부를 한국지능정보사회진흥원(NIA)의 ‘AI 허브’를 통해 개방해, 국내 AI 연구자와 스타트업이 활용할 수 있는 공공 데이터 자산으로 환원할 계획입니다.

이를 통해 특정 기업만 사용하는 폐쇄 모델이 아니라, 한국어에 강점을 가진 오픈 생태계형 모델로 성장시키겠다는 전략을 내세우고 있습니다.

업스테이지는 솔라 오픈을 “가장 한국적이면서도 글로벌 경쟁력을 갖춘 오픈소스 AI”로 정의하며, 국내외 커뮤니티와 협력해 지속적인 성능 개선과 응용 사례 확장을 이어가겠다고 밝혔습니다.

Solar-Open-100B : Hugging face 바로 가기

새로 올라온 콘텐츠

전체보기