AI 요약
카카오가 자체 개발한 차세대 언어모델 ‘Kanana-2(카나나-2)’를 업데이트하고, 성능과 효율을 끌어올린 모델 4종을 추가로 오픈소스로 공개했습니다.
Kanana-2는 지난해 12월 허깅페이스(Hugging Face)에 처음 공개된 이후 한 달여 만에 구조와 학습 방식을 고도화한 신규 버전으로 재등장했으며, 이번에 공개된 4개 모델은 모두 에이전틱(Agentic) AI 구현에 최적화된 것이 특징입니다.
카카오는 “고효율·저비용이면서도 실질적인 도구 호출 능력을 갖춘 모델들을 누구나 활용할 수 있도록 공개함으로써, 국내외 개발자·연구자들이 보다 쉽게 에이전트형 AI 서비스를 구현하도록 돕겠다”고 밝혔습니다.
이번에 추가 공개된 Kanana-2 라인업은 Base(기본), Instruct(지시 이행), Thinking(추론 특화), Mid-training(연구 최적화) 등 네 가지 모델로 구성됩니다.
Base 모델은 다양한 후속 커스터마이징의 기반이 되는 범용 언어모델이며, Instruct 모델은 사용자의 자연어 지시를 이해하고 안전하게 이행하는 데 초점을 맞춘 버전입니다.
Thinking 모델은 복잡한 문제 해결과 다단계 추론에 최적화돼 있고, Mid-training 모델은 연구·실험용으로 중간 단계 가중치를 공개해 학계·스타트업이 새로운 학습 레시피를 테스트하기 좋도록 설계되었습니다.
Kanana-2의 핵심 기술적 특징은 MoE(Mixture-of-Experts)와 MLA(Multi-Head Latent Attention) 등 고효율 아키텍처를 적용해, 전체 파라미터는 수십억~수백억 규모지만 추론 시에는 약 30억 파라미터만 활성화해 연산 비용을 크게 줄였다는 점입니다.
이를 통해 엔비디아 A100급 범용 GPU 환경에서도 원활하게 구동되도록 최적화해, 대형 기업 전용 인프라가 아니라도 중소기업·스타트업·대학 연구실까지 실사용 가능한 수준의 성능과 비용 구조를 구현했습니다.
카카오는 MoE 학습에 필요한 커널을 직접 개발해 메모리 사용량을 줄이고 학습 속도를 높이는 한편, 최신 글로벌 모델과 유사한 벤치마크 성능을 기록했다고 설명했습니다.
이번 업데이트에서 특히 강조된 부분은 ‘에이전트형 AI’ 구현을 위한 도구 호출(tool calling)과 지시 이행 능력 강화입니다.
카카오는 Kanana-2에 멀티턴 도구 호출 데이터와 사용자 지시 이행 데이터셋을 대폭 반영해, 여러 단계에 걸친 복잡한 요청을 이해하고 적절한 API·플러그인·내부 도구를 선택·호출하는 능력을 끌어올렸다고 밝혔습니다.
이로 인해 단순 채팅을 넘어 검색, 일정 조회, 결제, 사내 시스템 연동 등 실제 업무 수행까지 확장할 수 있는 ‘에이전틱 AI’ 실 서비스 구축에 한층 유리해졌다는 평가가 나옵니다.
카카오는 이번 Kanana-2 업데이트와 오픈소스 추가 공개를 통해 “비싼 초대형 인프라에 의존하지 않고도 실용적인 에이전트형 AI를 구축할 수 있는 새로운 대안을 제시하는 것”을 목표로 하고 있습니다.
Kanana-2는 허깅페이스를 통해 모델과 가이드 문서가 함께 공개돼 있으며, 카카오는 앞으로도 1,550억 파라미터급 MoE 모델 ‘Kanana-2-155b-a17b’ 학습을 진행하며 글로벌 최상위 성능을 목표로 연구를 이어간다는 계획입니다.
새로 올라온 콘텐츠
전체보기









